央視網|中國網絡電視臺|網站地圖
客服設為首頁
登錄

中國網絡電視臺 > 經濟臺 > 資訊 >

大財富:數據改變世界

發佈時間:2012年05月14日 11:29 | 進入復興論壇 | 來源:《第一財經週刊》 | 手機看視頻


評分
意見反饋 意見反饋 頂 踩 收藏 收藏
channelId 1 1 1

  《第一財經週刊》204期封面

  Big Data

  他們來自微軟、Facebook,他們擁有智慧的頭腦,他們正利用數據改變世界。

  文|CBN記者 徐濤 李蓉慧 駱軼航 許悅

  製圖|項凱

  Robin走進紐約Maidson大街99號17層時,像個異類。他有可能也叫Roby,反正他沒帶名片。他遲疑地看著裏面端著酒杯彼此交談的年輕人,而自己頭髮花白。好在他看到了投影儀的幕布上碩大的字樣:“Big Data”(大數據)。

  他已和數字打了20年交道,不過是在金融行業。採集數據、建立模型、預測價格的走向,這是他每天都在做的事。“我不喜歡這份工作,這些數據是冷冰冰的,當你處理完這些數據後,你沒有成就感。”他説,“我想要做些改變,去面對那些更加活生生的、有趣的數據。”所以他來了這個由諮詢公司Dalberg組織的討論會。

  他説的那些活生生的、有趣的數據來自於社交網絡—Twitter、Facebook、Foursquare以及不斷新冒出來的新應用。在Twitter和Facebook剛出現時,鮮有人知道除了吐槽炫耀自戀外這些碎碎唸有什麼用,但現在這些被稱為數據,是價值尚未發掘完全的資源。

  儘管在過去的幾十年裏,像Robin這樣的程序員和數學家不斷在和數據打交道,但是SoLoMo(Social、Location、Mobile)帶來的海量數據依然是個新挑戰—在一分鐘內,Twitter上新發的信息數超過10萬;在Facebook上有超過600萬的瀏覽量。而且和單純的數字不同,這些數據是含義豐富的文字,以及比文字更複雜的圖片、音頻和視頻。

  實際處理起來,這並不比金融行業中的數據更加有趣。Robin想要離開的真正原因可能是華爾街的蕭條。再多的統計數據與模型也不能防止整個經濟的下滑和小概率事件發生帶來的股災,無數人正在失去華爾街那份體面的工作。而處理社交網絡的大數據卻是朝陽行業,人們開始發現大數據或許能讓他們和華爾街一樣賺錢—即便現在還沒有那麼多。

  最主要的盈利模式只有一個。“在線廣告已經成為了過去十年財富創造最可靠的來源。把消費者和銷售者配對起來,以及創造新的消費者和銷售者,這對於任何市場來説都是最重要的問題。”Jeff Hammerbacher告訴《第一財經週刊》。2006年以前,他還是Robin的華爾街同行,但後來他成了最早加入Facebook的數據分析師之一,以研究科學家的身份幫助馬克扎克伯格搭建了最早的數據分析模型。換個更直白的説法:弄清楚用戶點擊廣告的動機和方式。

  Facebook開啟了互聯網公司在盈利模式上的想象力,儘管有谷歌在先,但在線顯示廣告,甚至商業信息可以作為網站內容一部分這件事,還是給人們提供了不一樣的思維方?式。

  從公元前6世紀的亞歷山大圖書館,到把一切都數字化的谷歌,再到SoLoMo時代,數據的獲取正在變得越來越細緻,也越來越個人化。創新諮詢公司Frog(原Frog Design)在一份全球市場調查中發現,消費者對信用卡公司、在線零售商和科技公司的信任度最高,超過87%的調查者都樂意與這些公司分享個人數據。與此同時,因為對後臺操作不了解,人們往往不知道自己已經分享了哪些個人數據。在Frog的另一份調查裏,只有20%的人認為分享了自己的網絡搜索關鍵詞。而事實上,你並沒有辦法避免分享這部分數據。

  大數據的挖掘和分析就像任何行業一樣,一開始只是Jeff Hammerbacher這樣的個人研究者,但很快會發展出分工細緻的專業服務公司。

  離Dalberg辦公室步行10分鐘之遙的地方,有家叫Social Flow的創業公司,它也許可以算作是內行。它和Twitter是合作夥伴,在Big Data行業中生機勃勃。它分析數據,告訴廣告商什麼是正確的時間,誰是正確的用戶,什麼是應該發的正確內容。廣告商愛這家公司,這讓這家公司已經有了40多名員工。

  這家成立於2009年的公司在2011年説服了在微軟研究大數據的專家Gilad Lotan從波士頓搬家到紐約來和他們一起創業。Lotan看起來很年輕—他的專家資質來自於從2008年起就研究Twitter上的龐大數據,而不是像Robin那樣直到今天才想要一探究竟。

  “你還記得2008年伊朗大選風波嗎,每個人都在Twitter上轉發,讓人驚訝。”Lotan説。之後,他開始圍繞伊朗大選做關於信息傳播的模型。當時他還在微軟工作,這些研究很快被用在了微軟Bing搜索上,這是首個可以直接搜索社交媒體信息的搜索引擎。“每秒都有大量新內容産生,而且是非結構化的。這和傳統的搜索很不一樣。”Lotan説。

  Lotan喜歡將這些大量的數據分析後的結果可視化,使得那些非技術人員也能輕易明白這些數據在表達什麼。在本拉登被射殺後,他所做信息圖譜可以讓人們清晰地看出,在白宮發出官方消息前誰引爆了Twitter上的消息傳播。當然,在他開始在Social Flow工作之後,他會把客戶請到辦公室,將包含這些公司的信息圖譜展現出來:有些是普通的時間軸,有些像蒲公英,有些則是鋪滿整個畫面的泡泡,泡泡中顯示這些客戶的粉絲正在談論什麼話題。

  現在《經濟學人》使用Social Flow的服務來分析自己的受眾群,並且選擇在什麼時間來推送一條什麼樣的消息;而百事可樂則用這種服務比較不同的營銷活動會得到什麼樣的傳播效果。這些公司並不吝于為Social Flow的服務付費。

  事情看起來就是這樣,除了廣告,其他行業似乎還不知如何參與進來。Jeff Hammerbacher解釋説,這是數字化讓廣告業的效率和産出變得更加容易衡量。就好像那句廣告業的名言,“你知道有50%的投入被浪費了,只是你不知道是哪50%。”現在你能清楚看到那50%在哪。Twitter和Facebook上的點擊和轉發數量能精確告訴廣告商這個促銷要比那個火熱多少,Foursquare則告訴這些廣告商人們和他們的家人朋友都去過哪。嘗過這些甜頭之後,廣告商會關注任何受到用戶歡迎的新應用,甭管它是不是剛剛冒出來的。

  但Jeff Hammerbacher不覺得這是好事,2011年他就對《彭博商業週刊》説,“我一代中最聰明的人都在想著怎麼讓更多人點擊廣告,這真是糟糕透了。”然後他就去了矽谷當時創立不久的一家數據分析公司Cloudera,這家公司製作與任何形式、任何規模的數據相匹配的開源軟體,很多公司以此為平臺建立了自己的商業模式。難得的是,儘管開發開源軟體,Cloudera還是能靠銷售和服務支撐起目前將近200人的團隊。

  Jeff Hammerbacher不缺乏志同道合者。Robin慕名而來的這場討論會裏大多數人都對“除了廣告還能做什麼”感興趣,他們不懂分析和挖掘,但想知道趨勢和數據的未來。

  “我在紐約市應急管理部門工作,蒐集紐約的地理信息和數據,醫院、警察局、天氣變化等等,然後為可能發生的緊急事件提供預案,”一位叫做 Timothie Biggs的女士介紹自己,“也許我們以後也會蒐集社交網絡上的數據,因為你會更快地知道發生了些什麼。”

  甚至舉辦這次活動的Dalberg公司也不是懂行的人。它成立於2001年,是一家為企業、政府和非營利性組織提供和經濟發展、氣候變化與公司治理有關的策略的公司。在2011年年末,這家公司覺得也許應該將Twitter和Facebook這類社交媒體加入到自己的分析中來。而這次講座就是他們做的一次嘗試。

  有個叫Robert Kirkpatrick的演講者,是聯合國秘書長執行辦公室的官員。他和一些科研組織一起基於Twitter等社交媒體上的數據來研究通貨膨脹、失業率等社會問題。他們給這個項目起了個名字,叫做“全球脈搏”(Global Pulse)。這個名字很容易讓人想到Twitter在2009年給自己的戰略定位:“如果我們擁有10億用戶,那我們就是地球的脈搏(If we had a billion users, that will be the pulse of the planet。)。”

  “的確看起來現在大數據以及數據挖掘更多和廣告有關,創業公司們從廣告上也更容易賺錢。但我想,也許這些分析方法和成果能運用到別的方面去。”Robert Kirkpatrick?説。

  他們挑選了一些話題作為實驗。在一個被稱作為“麵包實時在線價格”(Real-Time E-pricing of Bread)的項目中,Global Pulse在6個拉丁美洲國家建立了每日價格指數。這個研究發現在線零售價格由於和線下價格的波動有聯絡,能比官方的數據更早發現通貨膨脹的苗頭。

  在另一個研究中,Global Pulse希望發現社交網絡中情緒和失業率之間的關係。在愛爾蘭,當社交網絡上“困惑”和“沮喪”這些指標升高3個月後,失業率也會升高;而在美國發生在失業率升高之前持續升高的是“憤怒”這一指標。當然,也許對政府部門而言更有意義的是失業之後他們在談論些什麼:在“失業”指標上升2個月後人們在談論“房子”,這也許意味著他們準備賣掉自己的房産;在過後的幾個月,談論“公交”和“地鐵”的在上升,這也許意味著他們承擔不起開車的油費,或者已經準備將車賣掉。

  “政府現在得到的數據是滯後的,他們做出的決定也非常緩慢。等政策做出幾年後發現有錯時,時間也不可能倒流。”Kirkpatrick?説。他覺得如果一個政府做決定能像廣告商根據數據分析更新自己的營銷策略一樣快,那也許這個世界會變得更美好一些。

  但這些數據還遠沒有到可以直接使用的地步。機器無法理解一句話是陳述還是反諷,“數據太多太複雜了,有時你得問出對的問題,”Kirkpatrick?説,“而且,機器也無法像人一樣理解不同的情景。例如通過數據你能發現烏干達很多人在賣掉自己自行車,但機器不能馬上知道他們賣掉自行車的下一步可能就是買一把機關槍。”

  “這也是和我以前處理的數據不一樣的地方,”和Robert聊完之後Kirkpatrick?説,“我以前處理的數據就是指‘數字',不包含情感或其他引申含義。”

  越來越多的行業開始和數據打交道。美國聯邦政府在2012年3月29日宣佈將投入超過2億美元在大數據研究上,而你會在這篇文章後面看到更多以各種方式利用數據的公司,它們都來自以色列,不僅僅因為以色列在大數據領域的創業公司尤多,還因為這些公司更為關注公共服務領域,無論是Takadu這樣的為居民用水處理數據的公司,還是Given Imaging這樣的膠囊攝像頭公司。

  “在線瀏覽和在線購買都變得非常容易估量。當你有估量方法,你就可以研究科學。在這個意義上,我這一代中最聰明的人則在推動科學的前進。”Jeff Hammerbacher説,“但我不確定如何整合我們的社會,才能讓致力於解決長期挑戰的人覺得自己得到了應得的回報,這是一個值得問出口的問題。”

  有些行業面臨的問題是數據量還不夠大。谷歌創始人謝爾蓋布林的太太安妮沃斯基創立的23andme是一家基因公司。他們希望用戶能提供足夠的唾液,而他們則回報給用戶一份報告來了解自己和家族潛在的與基因有關的疾病。在4月6日,這家位於矽谷的公司邀請了一些有輕度帕金森症的患者到他們的辦公室,對於他們而言,要研究帕金森綜合症,目前的樣本量還是不夠大。

  事實上有更多的行業和領域被建構在越來越龐大和複雜的數據基礎上—與此相關的公司也正在收到風險投資的青睞。“大數據不僅僅是一個時髦詞彙,我相信它有真正的未來,”矽谷頂級風險投資機構德豐傑(Draper Fisher Jurvweston)創始合夥人Tim Draper對《第一財經週刊》説,“我們需要分辨出哪些是未來的趨勢,哪些是時髦的概念,而大數據無疑是個趨勢。”

  Tim Draper認為,未來更多的與複雜的數據相關的創業公司會陸續出現,而並非由大公司主宰一切。“這些數據將分散在各個領域,你的行車路線、你經常出現的地點、你喜歡的顏色、經常買的東西,社交網站上的觀點和言論,這些都會成為個人數據的一部分,它們可以用來被服務每個?人。”

  而位於加州Palo Alto的創業公司Alohar開發的Placeme正是這樣一款産品。它看上去是一款普通的地理位置應用,而事實上,它能自動記錄你經常出現的地理位置,並自動生成為數據圖表—這些信息會幫助分析每日的行程路線、生活必需場所,甚至駕駛里程與汽油存量的關係(因為它知道你上一次在哪加過油),它們在一起將會變成一款“個人生活助理工具”—這應該是複雜的數據聚合在一起對個人直接産生輔助(而非廣告)的第一個工具。

  “Siri是人們的語音助理,但它不是一款真正智慧處理人們需求的産品,Placeme的數據處理會讓它變成一款個人的智慧助理工具。”Alohar創始人Sam Liang對《第一財經週刊》説。這家公司獲得了從事分佈式計算系統和數據分析處理長達數十年的斯坦福大學教授David Chariton的投資—他也是迄今世界上最龐大的“大數據”公司谷歌的第一位投資者。

  一年多以來,Jeff Hammerbacher看到的數據挖掘趨勢是催生更多的開源工具包,也就是他在後面那篇對談裏提到的那些陌生的名字。它讓更多的創業者更方便地開發産品,比如通過社交網絡來收集數據的健康類App。也許未來數年後,它們蒐集的數據能讓醫生給你的診斷變得更為精確,比方説不是通用的成人每日三次一次一片,而是檢測到你的血液中藥劑已經代謝完成會自動提醒你再次服藥。

  “我深信科學是社會一切美好事物的偉大來源。數據則是被科學管理著的世界的代表。在廣告于過去十年變得無比成熟的同時,許多産業甚至還沒有進入數字時代,比如醫療。”Jeff Hammerbacher説。

  但正如他所言,“不幸的是,我人生中大部分期待有朝一日要被解決的問題,都不會因為更精準的廣告迎刃而解。”

  還有更重要的事情要做。

熱詞:

  • 數據聚合
  • 谷歌
  • Takadu
  • Maidson
  • 數據挖掘
  • Twitter
  • Hammerbacher
  • 失業
  • 改變世界
  • Facebook
  •