央視新聞客戶端

央視新聞客戶端點擊或掃描下載

首頁資訊科技農業健康

數據變現的秘密

滾動 來源:央視網 2016年09月07日 16:46 A-A+ 二維碼
掃一掃 手機閱讀

原標題:

  各位觀眾大家好,歡迎大家來到央視網的《大數據名人講堂》,首先呢,我做個自我介紹,我叫劉鵬,一直在互聯網公司從事流量和數據變現方面的工作,所以今天我給大家演講的題目是《數據變現的秘密》。那麼這個題目背後,我們是想給大家揭秘一下在互聯網行業裏如何把免費産品形成的流量、數據,還有品牌價值這些核心資産,通過一個完整的商業化體系,把它變成錢的這麼一個過程,這個過程我們從術語上叫商業化,相信大家如果不熟悉互聯網的人可能沒聽過這個詞,但是希望大家聽完我的講座以後,對互聯網數據和流量變現的秘密有一定的了解。
  
  好,我們開始,首先因為今天的時間比較短,我們只有45分鐘的時間,可能沒辦法把商業化體系裏所有的內容、所有的産品跟大家詳細地介紹出來,所以如果大家對這方面有興趣,可以參閱我們在去年出的一本書叫《計算廣告》,這本書是互聯網商業化體系方面,從全世界範圍來看,是目前唯一的一本出版物,幫大家揭示如何利用數據和流量進行互聯網的變現。

  好,我們從哪兒開始説呢?從這張表開始講。這張表的內容我們在裏面列出了中國和世界上主要的互聯網巨頭在2015年的收入佔比,首先我們看這個Alphabet,它是谷歌的母公司,大家可能知道,去年它的總收入達到800多億美金,那麼廣告收入佔到多少呢,我們看到它佔到了700多億美金,這個佔比接近90%,也就是説在互聯網最大的商業巨頭當中,那麼廣告收入,也就是我們説的商業化收入佔到了它的絕對優勢地位。

  另外一家國際巨頭是Facebook,近兩年來在移動廣告方面增長非常迅猛,那麼它去年的收入180億美金,其中大部分是廣告營收,我們再來看中國的幾家廣告巨頭,騰訊、阿裏巴巴和百度,互聯網巨頭。騰訊去年的收入是這樣子,總收入達到接近160億美金,那麼它的廣告收入有點不太好算,為什麼這麼説呢,在財報裏直接體現的廣告營收是27億美金,但是騰訊還有很大的一塊收入是所謂遊戲收入,但是騰訊的遊戲收入又分為兩塊,一位是騰訊自研的遊戲,另外一塊是騰訊進行的遊戲聯運,什麼是遊戲聯運呢?就是其他人做的遊戲放在騰訊的平臺上進行分發,這種我們叫遊戲聯運。實際上這種遊戲聯運本質上仍然是廣告業務,背後用到也是廣告平臺,當然在騰訊的整體收入構成裏,遊戲部分到底有多少是聯運的收入,有多少又是自研遊戲的收入,這個數字我不得而知,所以我在這個表裏畫的是這樣,就是騰訊的收入,廣告收入佔比應該是介於17%和55%+17%這樣一個比例之間的一個數字,應該也是很大的一個比例。
  
  那麼阿裏巴巴,大家知道是個電商巨頭,但是我們會看到,阿裏巴巴在去年122億美金的收入裏,廣告收入應該佔到七八十億美金,也是佔一個絕對的大頭。百度就不用説了,102億美金的收入裏,廣告佔了絕對的優勢地位。從這個圖我相信大家從數字上會有一個直觀的認識,就是互聯網行業實際上我們大部分收入是來自於廣告,當然這裡的廣告並不是我們傳統意義上認識到的線下廣告,因為它主要是通過一種付費內容的載體,對流量和數據進行變現,它是一種産品驅動和技術驅動的數據變現生意,與傳統廣告有非常大的差別。那麼今天我們就用這短短的45分鐘,來幫大家解讀一下,到底這樣的數據變現體系是什麼樣的,也希望大家有一個基本認識。
  
  好,我們剛才説到商業化産品。那麼商業化體系在互聯網裏都負責解決什麼樣的問題,我相信大家是不了解的,因為大家用過很多的互聯網産品,比如説你用過搜索,用過社交軟體,用過電商,但是這是你看到的用戶産品的一面,那麼它背後的變現的一面,也就是商業化産品的一面,我給大家舉一些例子,讓大家有感性認識。商業化産品相關的問題,我們研討的問題是非常多的,比如説商業模式探索,我這舉了一個例子,我們會考慮這樣的問題,比如電影它是一種邊際成本很低,但是又能夠大量地傳播用戶信息的這種典型的商品,那麼在我們互聯網人看來,電影這個東西絕對應該是將來是免費的,那麼如何探索一種合理的商業模式,把電影變成免費的,能夠獲得更好的用戶體驗和更多的收入,這是我們商業化體系研究的一種典型的問題,也就是商業模式的探索。
  
  那麼更常見的問題,大多數媒體都碰到的問題是流量變現和數據變現。流量變現的問題很多,比如説現在很火的互聯網電視,互聯網電視的廠商除了獲得銷售收入,他其實還獲得了用戶流量,那麼這些流量如何變成錢,這也是我們商業化體系研究和實踐的關鍵內容。

  另外一個問題,也是我們今天重點討論的是數據變現。我舉一個例子,比如説現在在移動的,移動互聯網上,室內定位技術是一項快速發展的新技術,那麼這樣的室內導航和室內定位技術,它除了給用戶提供方便以外,實際上他獲得了大量的有價值的數據資産,那麼這樣的數據資産怎麼變成錢,也是我們商業化體系重點研究的內容之一。
  
  當然,商業化體系還有另外一個重要的側面,就是關於用戶增長。什麼是用戶增長呢?就是我利用商業化體系,換句話説,我通過購買廣告或者購買付費位置這樣的方式獲得我的流量。可是不同的廣告渠道、不同的流量渠道帶來的用戶,它的屬性、它的變現能力都是有很大的差別的,我們一定要用一個基於數據的運營體系,把這樣的流量精細加工,在商業化體系內把它完善起來。所以比如我舉個例子,像電商它會從各種渠道獲得多種流量,那麼這些流量帶來的轉化有什麼樣的歸因關係,如何用數據來判斷各個渠道的價值,這就是我們今天所説的用戶增長這樣一個互聯網的重要的數據應用話題。從這些應用當中,我相信大家能夠大致地了解互聯網商業化體系到底在關心和研究什麼樣的問題,如果將來大家碰到有關的問題,也知道怎麼樣借鑒互聯網的經驗去解決你自己的問題。
  
  好,我們進入正題,我們今天談的內容從哪兒説起?從互聯網的免費模式説起。免費是互聯網在商業模式當中一個非常重要的基調和主軸,那麼也有很多大佬對免費模式給了自己的解讀。不過在我看來,大多數人的解讀都不徹底或者説不系統,他們在碰到軟體的免費、碰到硬體的免費的時候給的解釋都不太一樣。其實我們給免費做了一個非常簡要的定義,那麼大家看我們這個PPT裏這句話,能夠個性化傳播信息的商品售價都會趨向邊際成本,這是我們對於免費模式的一個基本認識。也就是説,免費模式的前提是你的商品本身不是個死的東西,是能夠傳播信息的,比如説我們這個桌子這就不可能成為被免費模式改造的東西,因為它沒有信息可以傳播,但只要可以規模化、個性化傳播信息,實際上我就有了後向邊際的通路。有了後向邊際的通路,那麼我前向的産品就可以沒有利潤。我們今天看到這樣的例子非常非常多了,比如説我舉幾個例子,像我們今天在用的所有的網站、所有的APP,那麼都是免費的,收費的已經非常非常少了。這是為什麼呢?因為這個網站和應用,它每多服務一個用戶,所付出的成本基本是零,換句話説他的邊際成本基本是零,既然邊際成本是零,按照我們免費的定義,它的售價就應該是零,所以你看到它是免費的。
  
  那麼今天我們還會看到大量的所謂互聯網概念的手機和電視,那麼這些手機和電視實際上它的售價基本上等於它的量産成本。量産成本我們知道其實就是它的邊際成本。也就是説,這些賣電視和賣手機的廠商並沒有打算賣電視來掙錢,這是很有意思的一點,那麼他的錢從哪兒掙的呢,當然是因為由於他能夠規模化傳遞信息,這使得我在獲得用戶的同時,獲得了一些其他的資産,這些資産可以通過向廣告商出售的方式來變現,也就是我們所説的後向變現,所以免費模式的目的跟大家總結一下。我們是通過免費,換句話説,用等於邊際成本的售價來出售商品獲得用戶,那麼再通過從用戶身上得到的其他資産來變現,這是免費模式的本質。
  
  好,但我們來看一下,在互聯網的免費模式下,到底我們能夠積累哪些可變現的核心資産?換句話説,我們賺了吆喝,是吧,賺了用戶的眼球,但是我們還要掙錢,什麼東西可以掙錢呢?實際上我們總結下來,互聯網可變現的資産不外乎以下三項,我們用一個金字塔來表示,先看這個金字塔的塔基,塔基呢,我們把它叫流量,traffic,這個事情是最簡單的可以直接變現的資産。什麼是流量呢?有人在用你的網站,在用你的APP,那麼除了你放他感興趣的內容以外,你還可以放一些跟這些內容相關或者跟用戶的興趣相關,但是是有人付費讓你放的內容,這些內容我們叫Sponsored content,付費內容,或者就叫做廣告。那麼在正常內容裏夾帶付費內容這樣一個邏輯,就是流量變現的基礎。
  
  再往這個金字塔的中部來看,除了流量,今天我們還認識到互聯網的公司還有一項非常重要的資産,就是數據,數據有什麼價值呢?簡單地説,我們通過數據可以知道用戶的偏好,那麼根據這些偏好我可以提高付費內容的轉化率,這是數據變現的一個基本的原理。數據是怎麼得來的呢?由於別人在用你的應用,在用你的APP,用的過程當中你會發現他會留下蛛絲馬跡,比如説他搜索了一些詞,比如他上了一些網站,那麼你會知道他的用戶屬性,也可以猜出他的一些購物偏好,根據這些購物偏好來投送相關的付費內容,比我沒有任何的指導來投放付費內容,它的效果要好很多,也就是説單位流量的轉化效果、轉化能力是被提升的了,數據實際上起到這樣一個作用。
  
  金字塔的塔尖是我們從今年開始著重關注的一點,除了擁有流量和數據以外,很多互聯網的媒體甚至自媒體還擁有一項核心的資産,就是所謂的品牌價值。品牌價值的基本原理我們可以這麼解釋,它是利用用戶熟悉的形象來提高付費內容的關注程度。這個原理我們後面會有一張圖來具體的解釋。

  好,我們今天先來看一下,現在先來看一下,流量變現和數據變現為什麼與商業化體系是天然地結合在一起的,也就是説為什麼我們通過廣告渠道,就很容易的把流量和數據變成錢呢?那麼我在這兒畫了一個圖,大家可以根據這個圖理解一下這個原理。這個圖的左半部分講的是流量變現,這個非常簡單。如果你有一個網站,你的網站每天有十萬人訪問,那麼我在上面放一個廣告位,我這個廣告位的報價,咱們比如説是一萬塊錢,這就是我流量的價值,非常容易理解,對吧。
  15:00
  可是呢,在數字化媒體當中大家很快就發現,這種流量變現的方式並沒有最大的發揮數字媒體的特點,或者説也沒有發揮數據的特點。為什麼呢?我們看我們這兒舉的這個例子,這個流量變現的時候,我賣一萬塊錢放的是一個剃鬚刀的廣告,可是這個剃鬚刀的有效受眾是哪些人?潛在有可能買剃鬚刀的人,不外乎是男性受眾,因此我這裡邊有一半的女性受眾實際上是被浪費了的,這個原理大家都非常容易理解,那麼怎麼辦呢?我們看這個圖的右半部分,我們實際在商業化體系裏當中踐行的商業模式是這樣子,我只把它的有效受眾留給這個客戶,比如説這個剃鬚刀客戶,我僅僅把男性的一半流量留給它,那麼對於這個客戶而言,它的有效受眾的觸達並沒有變少,因為它的客戶都是男性的,但是由於我只給他一半流量,我可以給他打個折,比如原來這個廣告位全買的話,賣一萬塊錢,現在你只買一半男性的流量,我賣給你是六千塊錢。
  
  可是對媒體來説,我還剩下一半女性的流量,是吧,這個女性的流量,我可以把它賣給一家做化粧品的廣告主,那同樣,化粧品的廣告主它的受眾基本是女性,通過這樣的人群的拆分,我們會發現,對媒體來説,我掙到了更多的錢,原來我掙到了一萬塊錢,現在通過拆成兩份,每份收六千的方式,我掙到了一萬兩千塊錢。對於廣告主而言他也是滿意的,因為他只用花六千的成本,就獲得了原來他要花一萬成本才能觸達的所有的有效受眾,所以這是個雙贏的事情。
  
  那麼這個雙贏的事情,實際上天下沒有免費的午餐,既然是雙贏,一定有新的資源加入到這個過程裏,那麼這個資源是什麼呢?我們看下面的這個等式,流量價值的一萬元加上什麼變成了最後收入的一萬兩千元呢?實際上多出的兩千元是數據的價值,這就是我們講的數據變現的秘密。雖然是很簡單的原理,但是放在這樣一個具體的例子裏,大家肯定還是覺得很有意思的。
  
  為什麼説它是數據的價值呢,因為如果我僅僅有這個概念,但是我並不知道我的每一個受眾是男是女,那麼這兩千塊錢我是完全掙不到的,換句話説,我由於有了每一個用戶的性別數據,結合我的廣告系統,我就多掙了兩千塊錢,這就是為什麼我們説商業化體系或者説廣告體系,能夠一站式的將流量和數據變成錢,希望大家聽完我們這個講座,對這件事有充分的認識,也把今天互聯網行業的商業化體系、廣告體系跟傳統廣告行業有個區分,因為傳統廣告行業基本上是我們這個圖裏左半部分,有一個廣告位,你把廣告放上去,但互聯網做的主要是右半部分,它的核心並不在於有一個廣告位,把廣告放上去,而是在於利用數據做精細的加工,提高單位流量變現的能力,所以它是完全是一個數據驅動的行業。這點大家要有認識,因此大家記住一個觀點,數據變現和互聯網廣告是有非常天然的內在聯絡的。
  
  我們剛才還説到一點,在那個金字塔的塔尖還有一種互聯網的核心資産叫做品牌屬性。這個品牌屬性的變現實際上跟流量和數據又不是一回事了,可是關於這一點的清晰認識,我覺得至少在今年大家才形成,為什麼今年會形成這個認識,因為今年大家知道是直播和網紅的元年,大量的自媒體、大量網紅,都在考慮怎麼把自己的粉絲、把自己的流量變成錢。那麼大家會碰到一個問題,比如有很多朋友會開這個微信公眾號,微信公眾號下面可以放微信的廣告代碼,換句話説你有流量你是可以通過微信把它變成錢的,但是你會發現這個掙的錢會非常非常少,相比他們自己去接軟文或者其他的方式變現,這種通過流量變現的方式得到的錢可能只有十分之一甚至更低。
  
  那麼為什麼他自己接的軟文可以掙那麼多錢,而放這個廣告只能掙那麼一點錢,就是因為我們傳統的廣告體系考慮的是前面的兩點,流量和數據的變現,但是恰恰忘了怎麼樣把這個IP或者把這個自媒體的品牌屬性加以變現。品牌屬性變現的原理實際上我們今天還在探討,但是我這畫了兩個圖,我大概能夠跟大家解釋一下,品牌為什麼會産生議價。左邊這個圖是我們在互聯網營銷裏常用的一種方式叫做Remarketing或者叫做Retargeting,中文叫做再營銷。再營銷的原理這樣,如果你上過一個電商網站,或者你上過一個其他的網站,那麼你並沒有買東西你就離開了,那麼當你到達其他的媒體網站的時候,我知道你這個人曾經對這個品牌發生過些關注,那麼我可以再給你推送這個品牌相關的廣告,你會發現用戶由於對這個品牌已經有了一定的認知,有了一定的熟悉,那麼他再次點擊這個廣告,乃至發生後續轉化的可能性會非常地高,這件事是早已在互聯網營銷界被驗證了。
  
  同樣的道理,我們可以來解釋為什麼一個大家熟悉的形象,可以獲得更高的廣告回報。比如説右邊我們舉這個例子,劉建宏是大家都很熟悉的一個大IP吧,一個公眾人物,那麼大家在看到有一幅畫面或者有一個廣告,有劉建宏的形象出現的時候,先不説這個廣告宣傳的商品是什麼,你會下意識地去關注這個廣告,這個關注力是由於劉建宏這個熟悉的公眾形象帶來的。換句話説,由於公眾形像是熟悉的,所以帶來了大家對付費內容的高關注,這件事是品牌屬性帶來的高關注,換句話説,它也是一種互聯網可變現的資産。
  
  這種例子我相信大家能舉出很多,如果大家有在廣告主工作的朋友,其實最近也會有這種認識,比如同樣的是一個,假設是一檔綜藝節目,那麼我在綜藝節目的視頻網站買它的前貼片的廣告,就是在這個綜藝節目開始之前放的15秒這個廣告,和在綜藝節目開始的時候,由著名的主持人他説一句本節目是由某某某贊助的,這個話可能只有3秒,可是實際我們看到的結果,這3秒的這種這個廣告它的效果遠遠好于前面15秒的貼片,這就是品牌形象帶來的高關注。
 
  總之,這個品牌屬性也是咱們互聯網可以變現的核心資産,而且隨著網紅和直播的興起,我相信這是未來兩年大家研究的一個主軸,它既不同於流量,也不同於數據,但是怎麼跟數據體系結合起來用一種定量的方式來優化,這是我們今天仍然在探索的問題。
  
  好,我相信講了這幾頁,大家應該對我們商業化體系在做什麼有個基本的認識了,所以這兒我給大家簡單地總結一下這些觀點。首先大家想了解互聯網,那麼除了了解各種各樣的用戶産品,非常重要的一點就是要了解商業化體系。可以這麼説,我們剛才給了幾家巨頭的數據,大家可以看出來,整個商業化體系當中,以廣告為載體的這樣一個商業化體系,它支撐了我們互聯網行業的大半壁江山。我可以大概的估計一下,應該這個行業裏有70%左右的收入是來自於廣告的。所以你如果不了解商業化體系,你想深入了解互聯網,我覺得是沒有可能的。
  
  那麼第二點,大家要認識到互聯網的商業化體系,實際上是一種流量、數據和品牌屬性變現的生意,不是簡單的媒介售賣。從大數據領域來看,互聯網商業化體系也是大數據領域最早成熟的應用之一,那麼上溯到2006、2007年左右,我覺得規模化的利用數據,去提升廣告的收入能力,已經是成為當時業界非常重要的一個主題了。從今天來看,我也認為大數據領域唯一形成規模化營收的應用,應該説是互聯網的廣告應用,或者説互聯網的商業化體系,當然大數據其實有很多其他的應用,是吧,這些應用也都在蓬勃發展。我這兒只是指的到目前為止規模化最好的是商業化體系。
  
  今天我們當然只是講一些概念,但是這個商業化體系或者説計算廣告體系是非常複雜的一個體系,它要綜合利用到計算技術、用到心理學、經濟學、營銷學,各方面的知識,所以是個綜合學科。我舉一個例子,像去年我們有一位諾貝爾經濟學獎的得主約翰·納什去世,那麼約翰·納什他所研究的博弈論的這個體系,實際上在工業界當中,最成熟的或者最規模化的應用就是在我們的競價廣告體系裏。
  
  這個商業化體系其實涉及到不同的應用,我這兒畫了一個圖告訴大家這個商業化體系的閉環都包括哪些東西。那麼這實際上涉及到一個互聯網産品它的全週期,我們從這個圖裏來看,如果你有一個産品,從上面來看,那麼用戶在你的網站或者IP上會産生瀏覽行為,是吧,如果有瀏覽你就可以去夾帶廣告,那麼就有了廣告展示。如果用戶對這個展示感興趣,那麼他就會點擊,點擊以後當然就把你的這個廣告的流量又帶給了下家,帶給了你的廣告主,如果他進一步對廣告主的産品感興趣,就會産生轉化,這個轉化就會使得這個用戶成為廣告主的新用戶。當然後續你還要去通過數據分析和優化用戶的留存,如果用戶的留存變好了,你這個新的廣告主又産生了流量,他同樣可以通過這個流量去變現,所以在這個圖裏,這個大閉環裏,我們會看到幾類的問題,這些詞如果大家對於商業化體系感興趣,對互聯網感興趣,你會經常地聽到有人説。我們在這個圖裏把它解釋一下,首先從用戶的瀏覽到廣告展示,到廣告點擊,也就是説我有流量把它變成錢,有數據把它變成錢,這個過程最簡單叫做變現,我們英文叫Monetization,這是站在媒體角度去看商業化體系。
  
  從廣告展示到廣告點擊到轉化,這麼一個中間過程,那麼這是我們今天講Advertising,就是在互聯網行業講Advertising這個詞它指的是中間過程,它不是依附於媒體的,它是一個第三方的中立的加工過程。從用戶的轉化再到優化用戶的留存,這個過程我們今天在移動互聯網,有一個詞叫做User Acquisition,就是UA,用戶獲取。那麼從用戶獲取以後進入你的站內如何通過數據化的方式去運營,這是我們講的數據化運營的問題。所以總體看這個商業化體系,它實際上把流量變現、數據變現、廣告、用戶獲取和數據運營這些環節都在一個大閉環上完美地給串接起來了。整個這個閉環從右半部來看是偏向於媒體的角度,或者我們説一個術語吧,偏向於供給方的角度。那麼這個媒體的角度,我們簡單來説都把它叫做商業化。如果從左半部來看,偏向於廣告主的角度,那麼這部分我們今天有一個非常時髦的詞,叫Growth hacker,叫增長黑客是吧,利用數據的辦法去拉新,數據的辦法去提高留存。整個這是我們商業體系的一個大閉環。
  
  我這畫了一個圖,給大家一個直觀的認識,就是我們商業化體系怎麼直觀地去解釋它。可以這麼説,我們的商業化産品,主要是我們的廣告産品,還有相關的像CRM其他的一些産品,它就像我們這個體系的一艘大船,它是整個這個體系的承載者,業務落地的關鍵是在這個商業化産品體系。可是這個船實際運送的貨物是什麼呢,實際上是數據,我們這個不管船的載體長什麼樣,不管廣告長什麼樣,實際上我們在核心去加工和變現的內容,是用戶的行為數據。當然這裡面要想把用戶的行為數據變現得好,我們要用到大量的智慧技術,那麼這個智慧技術也就像這艘船的船長,它是引領這個船高速的前行的關鍵。因此在這個商業化體系裏,商業化産品、數據和智慧技術是一個完美的統一,我們只有把這三點都研究清楚了,那麼在商業化變現和用戶增長這兩方面才能夠真正達到互聯網的先進水平。
  
  這有一個圖我沒打算細講,這是一個我們在變現領域非常著名的圖,就是商業化市場的格局。大家會看到,從左邊的廣告主到右邊的媒體,實際上我們今天在互聯網廣告當中,不是説廣告主去媒體那兒簽個合同,就把廣告買回來,它中間經過了多層的加工和交易過程。我們今天不去講這些加工和交易的細節,但是大家要看,我在這個圖裏面畫了兩個大框,上面這個框所有的這些公司都是在從事廣告交易的,這廣告交易又分了很多層,如果今後有其他機會我們可以再講這方面的東西,關於供給方的産品和需求方的産品。但總之這些公司,上面這個大框的所有公司,它真的是在跟廣告發生關係,當然它本身不一定是媒體,也不一定是廣告主,可能僅僅是一個中間的加工者,可是這個圖裏真正有意思的是下面一塊,就是我下面畫的這個方框,數據加工和交易這塊。就是在這個市場裏,有很多的公司,實際上你發現,它首先並不是廣告主,也不是媒體,甚至它也不從事任何的廣告買賣,它只從事數據的收集加工和交易,但是實際上這些公司是我們廣告行業或者商業化體系當中真正的支柱性的公司。由於這些數據體系的存在,它使得我們的變現能力越來越強。
  
  大家會覺得在這個圖裏邊廣告主買廣告是不是比傳統行業要複雜呢,要複雜很多,但是由於有數據的支撐,這個複雜它是有産出的,媒體在用傳統的方式賣出廣告,比如説一個廣告賣一塊錢,通過各種數據的注入,通過各種廣告産品的加持,最後在廣告主那兒能掙到多少錢呢?那麼如果按照世界上的先進水平來看,大概是個1比3的關係,就是一塊錢的媒體資源,由於數據的注入,可能最終的變現價值是3塊錢,也就是説這裡面數據和品牌屬性帶來的議價已經超過了流量本身的價值,這也是這個體系最有意思的一點,也是我們今天為什麼這麼關注大數據的一個核心的出發點。
  
  這個圖的上方,當然我還給了兩個專業性的名詞,就是這個圖裏面因為有很多層的公司,那麼如果它偏向於廣告主一側,傾向於給廣告主獲得更多的利益,那麼我們就把它叫做需求方,如果它是偏向於給媒體帶來更多利益,我們把它叫做供給方,這個詞如果大家熟悉金融的朋友應該都很熟悉,因為這些詞我們基本上就是從金融行業給借用過來的。總之這個圖希望大家了解一個觀點,就今天如果大家還有人在討論Big Data,大數據到底能不能掙錢,應該怎麼掙錢,我認為這是一個非常過時的問題,也可能是對我們行業還不夠了解,至少在商業化體系當中,在廣告體系當中,數據規模化的加工和變現,不僅僅已經成為現實,而且它已經成為一個巨大的市場,這種數據化的廣告變現,在去年中國市場,它已經線上的,基於數據的廣告已經超過了其他所有廣告的總和,已經佔據了中國廣告市場的大半壁的江山,而且將來它的增速是遠遠超過其他傳統廣告行業的。
  
  其實説到這兒,我相信大家對互聯網的商業化體系和廣告體系從概念上應該有了一個清晰的認識,就是我們用數據變現,利用廣告做載體,利用智慧技術做驅動力,這是我們今天在商業化體系裏大數據的三架馬車。但是我特別要用幾分鐘給大家講一個反面的事情,就是我們今天在用數據,實際上我們會碰到很多的數據隱私的問題,如果不解決好這些問題,我相信將來的數據利用和數據變現會碰到非常大的困難。關於數據隱私的問題,我們的認識實際上也是説有幾個階段的。
  
  首先在最早的階段,關注用戶的數據隱私的主要的國家是歐盟那些國家,歐盟有一個A29這個委員會,它對數據的隱私問題,還有用戶的其他隱私問題做了非常深入的研究,這個委員會主要是負責隱私保護條例的一些制訂,當然它不僅僅是限于互聯網了,也包括線下的很多數據隱私問題。A29當時給了我們幾個非常重要的原則,這些原則在今天看來仍然是很有效,首先他告訴我們Personal Identifiable Information,就是所謂的PII,這種數據我們是不能用的。什麼是PII呢,就是如果有些字段你拿到這個數據你就很容易的找到這個人,那麼這樣的數據是不能用的,我舉個例子,比如説有的人拿到你的電話號碼,那麼他就可以給你打電話,有人拿到你的家庭住址,他就可以上門給你做推銷,拿到郵件,他可以給你發垃圾郵件,是吧,像這樣的信息我們都把它叫做PII,這種PII在歐盟的標準是嚴格禁止使用的。中國有一個詞叫脫敏,跟這個事有一定的關係。
  
  這個原則我們覺得非常好,另外它還有一個原則就是用戶,這裡邊實際上有一個商業倫理和道德上的悖論。PII我保證你不用,但是你日常的行為數據,比如你搜過什麼詞,買過什麼貨物,其實我用戶也沒有讓你用,那麼你為什麼能用呢,如果我們一定要要求用戶允許網站來使用這個數據,實際上這會陷入非常無休止的爭吵當中,那麼這A29其實給了一個聰明的解決方案,什麼解決方案呢,用戶你可以不讓我用你的數據,那麼大家會看到,國外如果大家看到一些廣告的話,它右上角往往有一個小的i,一個小三角裏邊寫了一個i,你點那個小三角進去,就是一個頁面告訴你,我這個廣告或者我這個性化系統是收集和利用了你的哪些數據,當然如果你覺得我很不Comfortable,我覺得我的數據不應該被收集和使用,那麼下面有一個按紐,你點那個按鈕,你的系統就,他的系統就不會再記錄和使用你的數據了。這種方式為什麼很聰明呢?首先它避免了我們在道德和倫理層面的討論,用戶有權利決定自己的數據不被網站來使用。但是它對我們的商業影響又不大,因為實際上對這件事感興趣,就關心自己數據有沒有被使用的用戶是非常少的一部分,可能只有1%,所以這實際上也沒有什麼影響。
  
  第三點,這個A29還要求不能長期保存和使用用戶數據,除非你有特殊的要求,用戶同意我長期保存,一般的數據,即使是用戶沒有説不讓你用,那麼你在使用了,我記得是18個月,18個月以後,那麼這所有的數據都必須嚴格地從你的服務器上刪除,這實際上是避免一些管理風險。如果你大量的數據,不論你存在磁帶上還是存在什麼地方,只要在你的庫裏就越積越多,總有一天由於管理上的問題,它會有大量的洩露的可能。這是我們對數據隱私最早的一種認識吧。
  
  那麼後來到互聯網時代,大家突然發現,隱私問題遠遠比這個複雜,複雜在哪兒?我們舉這麼一個例子,如果你在有一天在你單位的會議室裏發現了一張人事留下的表格,這個人事表格當然它把已經進行了我們説的脫敏,把姓名、手機號都去掉了,可是你如果發現這個表格裏有某某人,比如他是多少歲,哪個部門的,家住在哪個區。那麼大家想想這個場景,其實你很容易去猜出來這個人是誰,換句話説,如果我跟某一個人是線下的熟人關係,我對他有一些背景信息的了解,在這種情況下即使不給我他的PII,不給我他的電話號碼,不給我他家庭住址這些關鍵信息,我從其他的一些零散的信息拼起來,我是能知道這個人是誰的,這個事挺可怕的。那麼你想在剛才那個例子裏,如果你拼出來這個人是誰,假設人事那張工資表,那麼你就知道了這個人掙多少錢。
  
  所以今天我們關注的數據隱私問題,實際上我們發現一個問題,就是熟人之間的隱私,它替代了陌生人之間隱私,已經成為一個最大的顧慮,而熟人之間如果他能夠了解你的隱私,並且他有惡意的話,你會發現它可能帶來的傷害遠遠超過陌生人。

  實際上前兩年還有一個例子,大家有興趣可以去翻一番,有一位清華的同學是王珞丹的粉絲,那麼她在對王珞丹有一些背景信息了解的基礎上,通過翻王珞丹的微博,看她的每張照片,看他發的內容,通過推理的方式得出來王珞丹住在哪個小區,住在哪個樓,幾門幾號,最後的結果很準確。王珞丹也回應也承認了,當然這個人並沒有惡意,他只是個追星的行為,但是如果他有惡意,你想其實他的影響是蠻大的,其實這件事本身的影響也不小,後來好像王珞丹微博上説,雖然她知道這個人沒有惡意,但她還是因為這事搬了家。所以你會看到,在有背景信息的支持下,熟人之間的隱私是我們碰到的一個最大的問題。
  
  那麼再到互聯網的真正的數據場景下解讀這件事,你會發現它的問題會變得更複雜,為什麼呢?我們還有一個例子跟大家講講。這個例子是在若干年以前吧,五六年以前吧,Netflix,就美國的電影網站,它舉辦過一次非常轟動的推薦比賽,就是給你一些人的觀影記錄,然後再給你一部新片子,你判斷這個人喜歡這部片子可能性有多大?應該打幾分,這是這個電影網站非常核心的一個實際的應用了,它把這個任務放出來是希望大數據的高手都來幫他解決這個問題,之所以轟動,因為這個比賽的獎金非常高,當時100萬美元的獎金。當時是我們的一位同事拿了100萬美元的大獎。
  
  為什麼它跟隱私有關係呢?就這個比賽裏發生了一個黑天鵝事件,有一個參賽者拿到這個數據以後,他陰差陽錯地正好看到了一條數據,這條數據當然Netflix已經對它做了脫敏,所有的PII是不在的,甚至我們剛才前面講的那些Course Identify那些問題他也解決了。但是他看到這個人,去年某月看過某一個片子,評價是3分,去年某月又看過另外一個片子評價是5分,把這些行為串起來,腦子裏第一時間就反映出這個人一定是我的同事,大家可以回想這個場景,你會跟你的同事經常交流,我們看什麼片子,評價如何?而且每個人跟每個人的觀影記錄都不可能一樣的。所以他看到這個記錄很明確地反映出這就是我的同事,他拿這個記錄找他的同事,一看,同事説,還真是我,問題在哪兒呢?除了這些片子以外,還有若干部片子是他們之間從來沒交流過的,那麼這幾部片子都是跟同性戀相關的影片。我們不太想做過多的猜測,但至少説明一點,就是他的同事並不願意向他透露他看過這些影片,這些事情是他的隱私,那麼這個同事看到這個事情當然很惱火,為什麼Netflix拿這樣一個數據拿出來做比賽,洩露了我的隱私。

  怎麼解決呢?Netflix回去商量了半天,沒什麼解決方法,所以這個比賽進行了一屆就不辦了。這件事給我們非常大的啟示,互聯網的行為數據它真正的隱私風險在於,由於每個人的行為數據是非常非常稀疏的,我們就拿觀影記錄這一件事來説吧。我覺得如果咱們在整個海淀區來把所有的人觀影記錄拿出來看,可能都找不來兩個人是相同的,除了有一部分人是完全不看電影的,把這部分人排除出去,只要看過電影的,我相信把看過什麼電影、什麼時間看的和評價如何,這三個維度的指標拿出來,我認為每兩個人都是不同的。那麼換句話説拿到這樣一條記錄,如果你是熟悉這個人的一個朋友,我是有辦法把這個人找出來的。這也就是説,在稀疏的行為數據和熟人對背景信息了解的這樣一個基礎上,隱私的問題變得是非常非常嚴重的。

  當然我們的業務不可能因為有這樣的問題存在就停滯下來,因為今天利用數據,利用大數據去解決互聯網裏的各種問題,已經成為不可逆轉的歷史潮流了,這就像我們今天看安全問題一樣,我們不可能因為你的電腦有可能中毒,就停止生産電腦,同樣今天我們不可能因為有隱私問題的存在,還有些沒解決的問題,就停止使用用戶數據,但總之,大家要了解到這個問題是客觀存在的,而且有很大的挑戰。那麼進一步説,計算廣告也好,個性化推薦也好,這樣深度的利用用戶的數據進行推薦的系統,深度個性化系統它也有隱私安全的風險。與此相關的也有些前沿的研究,關於差分隱私的題目,我們今天就不多談了。

  總之要給大家一個概念,我們利用數據是非常好的,但是在今天看來,隱私也是一個不可忽略的問題,而且由於今天它還沒有全面的爆發,有可能是大數據頭上的達摩克利斯之劍。

  好,我講的內容大概就這麼多,做一個簡單的小結。今天我們用簡短的時間幫大家一塊了解了互聯網商業化體系的全貌,希望大家能認識到互聯網的商業化體系也好,廣告體系也好,跟傳統廣告體系關係並不大,它主要是在把免費産品形成的流量、數據和品牌價值這三項核心資産變成現金,所以你看到的谷歌也好,BAT也好,這樣的巨頭型的商業公司,為什麼它都是用廣告支撐他的業務的,這裡面是有非常明確的原理的。但在了解這個商業化體系的原理之後,同樣還要認識到我們還有事物的另外一面,就是利用數據客觀地會帶來隱私性的風險,特別是在互聯網的這種稀疏行為數據的情況下,這種隱私數據的風險其實比我們原來考慮得問題要複雜很多,並且它仍然是未解決的一個問題。

  總之,希望大家客觀地來認識大數據,了解大數據,也希望諸位在你們自己的行業當中、自己的工作當中,都能夠有數據的意識和數據風險的意識,更好地讓數據來服務於我們的業務,服務於我們的工作,好,謝謝大家。

  • 新聞
  • 軍事
  • 財經農業
  • 社會法治
  • 生活健康
掃一掃
掃一掃,用手機繼續閱讀!
央視網新聞移動端
央視新聞客戶端iPhone
央視新聞移動看!
CBox移動客戶端
下載到桌面,觀看更方便!
860010-1114010100
1 1 1