《大數據名人講堂》以落實國家大數據戰略為己任,傳播數據知識、構建數據思維、提升數據能力、挖掘數據價值,致力於大數據生態體系建設,通過聚合政産學研用等多方資源,推動大數據創新技術和産品應用、加速企業成長、推動産業轉型升級,倡導數據倫理,探尋數字文明。 《大數據名人講堂》匯聚國內外大數據各界精英,引發深入探討,激發思想碰撞,全面解析大數據的産業應用和未來發展,致力成為大數據思想的策源地,大數據應用的領航者。
我們先來看看人工智慧這個名詞本身。人工其實不需要解釋,就是我們人來製造、創造的東西,所以我們重點要看什麼是智慧。智慧實際上是一個很久遠的一個概念了。大家能看到我這張PPT中,從甲骨文,中國最古老的甲骨文金文裏頭就能看到“智”這個字。大家能看到,其實它最開始的智的這個形態呢,實際上是一個人拿著一個兵器,然後好像有個口,各種字形大致都是這樣的,稍微有一些變異。它實際上什麼意思?就是人在戰爭中通過一些智謀來取勝,它實際上是這麼個意思。而下面這個,是我們現在比較標準的一個解釋,智慧和智力其實意思是一樣的。 大家能看到,智、智慧,它是指人要通過自己的這個知識、經驗,要獲取這些東西,然後用這個來解決問題,這是一個非常非常簡單的一個定義,大家能看到有記憶、有觀察、有想象、有思考,還有判斷。我們看看這個外國人他怎麼理解的?英文Intelligence這個詞的一個權威字典定義是這樣的。是説學習和理解事物的能力,或者是處理新的、或者困難的情況的能力。
很高興來到央視網的《大數據名人講堂》,我是DT財經的主編王小喬,DT財經從去年成立以來的一年多的時間裏,一直在做的一件事情,就是用大數據來去做新聞,同時記錄大數據這個行業的變化和發展。我今天要跟大家分享的就是大數據推動媒體的內容變革和價值重塑。首先簡單跟大家捋一下,大數據在新聞業的一個發展的歷程和應用現狀。那麼接下來重點我會通過幾個案例,就是我們新聞業的幾個案例,包括國內的、也包括國外的,來跟大家介紹一下新聞和大數據交叉的運用之後,新聞怎麼樣推動了大數據行業的社會價值、公共價值和商業價值的一個發揮。同時在這個過程當中,新聞業又怎麼實現了自己的內容變革和價值的重塑。 最後一段也是大數據行業特別關心的一個話題,就是數據開放和個人隱私之間到底應該怎麼來平衡的問題。那好,我們先來看一看第一部分,其實呢用數據來做新聞,還真不是一個什麼特別新鮮的事兒。一開始的時候是小數據,當然這個略久遠啊,1967年的時候是美國的一個記者,他在報道底特律的一個暴亂事件的時候,他自己産生了一個疑問。疑問是什麼呢?就是究竟一個人的教育水平和他的收入是不是一定使他更容易去加入到這個暴亂的過程當中,他覺得他自己的採訪是沒有辦法去回答這個問題了已經。
大家好!今天非常榮幸能夠來到《大數據名人講堂》,跟大家分享一下智慧駕駛對於我們未來的城市,我們的生活帶來的一系列的變化。我們可以看到在大數據的土壤之上,可以長出來人工智慧這樣一種新型的應用,我要講的題目叫做“智慧駕駛重構未來城市”,“智慧駕駛”是一種非常重要的人工智慧的應用。那麼人工智慧究竟是什麼呢?能夠讓機器像人一樣去行為,去思考,就是人工智慧。而人工智慧恰恰就是在大數據的基礎設施之上形成的一種應用。 對於人工智慧我們有一個大的判斷,2016年開始的人工智慧革命,在市場規模、輻射面、持續的時間的尺度上,是跟1976年的PC,以及1996年的互聯網相提並論的。大家應該還記得在1976年PC開始了20年的數字化的繁榮。而1996年,我們又用互聯網展開了網絡化的20年的精彩。那麼在未來的20年,人工智慧即將打開的是智慧化的波瀾壯闊的20年,這是我們一個大的判斷。説到人工智慧,我們不能離開它所在的行業,在早先幾年,我們看到了很多人工智慧的公司,他們非常擅長于某些算法,他們能夠在某一些特定的應用上,在計算機視覺,在語音識別,在自然語言處理上做到非常好的效果。
大家好!今天由我來為大家分享大數據和人工智慧在醫療健康領域的一些工作。我叫路瑤,是來自Talking Date的數據科學家,我一直從事人工智慧和機器學習一方面的工作。近幾年,人工智慧技術在諸如無人駕駛、聊天機器人、語言翻譯等等方面都獲得了突破性的進展。特別是今年由谷歌DeepMind開發的AlphaGo和李世乭的圍棋世紀大戰展示了人工智慧已經達到了前所未有的水平。那麼人工智慧技術是否也能在醫療健康的領域為我們來服務?現在已經有許多的研究人員在這個方向努力,也作出了一系列的成果。 人工智慧在醫療領域的應用,並不是在最近幾年才出現的。早在上世紀的70年代斯坦福大學的Shortliffe教授就在這個方向作出了一些績,Shortliffe教授本人他的研究領域涵蓋了計算科學,生物信息學和醫學。在他的主導下,在斯坦福大學發明了世界上第一台基於規則的醫用人工智慧專家系統,這個專家系統可以幫助醫生在治療血液感染病患者的時候,選擇合適的抗菌類藥物。很遺憾的是這個MYCIN系統在當時並沒有進行大規模的普及,這倒並不是因為它本身的準確率不夠,其實在實驗中MYCIN的準確率是高於實驗中的專家組的。但是當時網絡通信,以及病歷電子化的水平是達不到使MYCIN大規模使用的要求的。
這個“贏”既代表了經營的營;又是如何贏得營銷的贏。今天分享的內容大致分為三個部分,第一個部分講為什麼需要數據營銷。第二部分講目前數據營銷主要關注的受眾群體。第三部分講目前主流的數據營銷方案,如何幫助客戶通過大數據來贏得客戶。。 數據到底能為營銷做什麼?大數據與營銷到底如何結合?實際上解決的是,第一,我的目標受眾群體到底在哪。第二,我如何用一些合適的方案來吸引更適合我的客戶群體。第三,如果我的老用戶要流失了,老客戶要走了怎麼辦?我有沒有一些合適的方案(留住他們)?第四,我能否有一些合適的活動、或者説一些創意,讓一些目標用戶光顧我的店面?第五,我收集到了很多用戶的數據,我怎麼用於重復的營銷。哪些數據對我的營銷有價值,哪些沒有價值,我如何通過我的一些數據來觸達到有效的目標群體上去。基本上來説,大數據和營銷的結合無非就是圍繞著上述幾個問題來展開。
我們往往看到很多項目,包括你們看的電視劇,或者電影,或者綜藝之類的,它核心是在投資風控這塊,有沒有做好它足夠應該做的一些這樣的一個風控,那麼後面的不管是在劇本,在主創,在營銷,還有在發行,我們都需要看到怎麼來用大數據來做這樣的一些那個相關的一個數據風險,包括是在那個風險控制,所以在前面你可能會關心那個在投資風控這邊你怎麼來要決定一個問題,這個項目能否去盈利,到後面的不管是在主演,在發行,在營銷,可能我們關心更多的問題,它怎麼去盈利,所以一般我們來看,那個電影是否要盈利,往往是由三部分來構成的,第一個,你投資的時候是否把足夠的一個因素考慮到了,包括市場一些競合一些關係。到第二部分整個的一個劇本的一個評估,劇本包含了它的類型跟題材,那麼整個大眾的一個審美,大眾的一個喜好,包括社會現在一些輿論,這塊來講也是很關鍵的,往往我們在中國出現很多問題,就類型同一時間扎堆,迅速地把一個整個的類型題材給消耗了。
我們是想給大家揭秘一下在互聯網行業裏如何把免費産品形成的流量、數據,還有品牌價值這些核心資産,通過一個完整的商業化體系,把它變成錢的這麼一個過程,這個過程我們從術語上叫商業化。商業化體系在互聯網裏都負責解決什麼樣的問題,我相信大家是不了解的,因為大家用過很多的互聯網産品,比如説你用過搜索,用過社交軟體,用過電商,但是這是你看到的用戶産品的一面,那麼它背後的變現的一面,也就是商業化産品的一面,我給大家舉一些例子,讓大家有感性認識。商業化産品相關的問題,我們研討的問題是非常多的,比如説商業模式探索,我這舉了一個例子,我們會考慮這樣的問題,比如電影它是一種邊際成本很低,但是又能夠大量地傳播用戶信息的這種典型的商品,那麼在我們互聯網人看來,電影這個東西絕對應該是將來是免費的,那麼如何探索一種合理的商業模式,把電影變成免費的,能夠獲得更好的用戶體驗和更多的收入,這是我們商業化體系研究的一種典型的問題,也就是商業模式的探索。
大家都知道在海上,除了海上的美景之外,其實我們更希望知道,海上每天都在發生什麼。我的分享主要是分為幾個模塊,首先我來和大家分享一下什麼是航運,以及航運與貿易之間的關係。第二版塊,(和)大家來分享航運數據的採集,我們是怎麼來進行蒐集航運的數據,以及怎麼處理的航運數據,包括我們這種航運數據的挖掘方法是如何進行的,第三塊來説,是重點介紹我們航運大數據的一些典型的應用的事例。 首先介紹一下航運的特點是什麼,航運的特點首先來説是它歷史的悠久,我們最早的時候,古人是從刻木行舟開始,基本上來説,一個木頭挖空就可以在水上漂,這是最早的所謂的航運。隨著人類的發展,基本上我們從小河,到江、到大海、到遠洋,這個歷史一直在發展。不過在歷史上有顯著記錄的是從明朝開始,15世紀初鄭和七次下西洋,最大的一次規模是兩百多條船,2.7萬人左右的團隊,最遠達到了紅海的範圍。
數據科學這個概念從2010年出現以來是一個非常時髦或者是火熱的概念。有些人認為數據科學是一個非常神秘或者神奇的學科,有化腐朽為神奇,點石成金的魔力。但是有一些,了解一些數據科學所涉及的技術的一些人,這樣一些人又認為,其實數據科學不過就是傳統的統計學的領域的一些東西,最多算是它的一些新的發展,跟傳統統計學或者傳統的數據分析沒有本質性的區別,完全是在炒作概念。所以今天我講這個題目就是想從我個人的觀點來跟大家分享一下,到底什麼是數據科學,它跟我們以前的傳統數據分析方法有沒有本質性的不同,或者有的話,它是什麼樣的不同。 今天的內容主要是三個部分,第一個是概要性的來介紹,什麼是數據科學,它的方法論是什麼樣子的,它可能涉及到哪些具體的分析步驟。中間我會比較概覽性的來講一下數據科學涉及到的相關的技術,包括IT方面的技術,以及分析技術,最後一部分會講一些數據科學實際的案例和例子來具體介紹一下數據科學能産生什麼樣的價值,同時數據科學是怎麼來運作的,最後可能會總結下數據科學未來的發展趨勢會是什麼樣子的。
我們知道大數據是一個非常火熱的概念。那麼在大數據這個領域,在互聯網上的應用,又是在大數據領域比較前沿的部分。而在互聯網應用領域比較前沿的部分中間呢,互聯網廣告又是大數據應用的前沿陣地,可以説是大數據應用最直接、最火熱,而且應用的技術和解決方案能夠落地,解決實際商業問題的一個領域。所以今天分享的這個話題是非常非常有意義的。 那麼朋友們知道,互聯網廣告的出現不是一個新事物。世界上最早的互聯網廣告出現在上個世紀的90年代,到今天已經有20年的歷史,中國也大概是那個時候,比美國稍微要晚個三、四年的時間。那麼互聯網廣告並不是一個新事物,為什麼今天宋老師您又過來給我們講大數據創生的這樣的一種新的互聯網廣告呢?這個其實就是我今天特別想跟大家去分享的一個話題。那麼在這個話題要講之前,首先還是想給大家介紹一下互聯網廣告的一點點小的歷史,幫助大家去理解為什麼咱們的互聯網廣告最終跟大數據結合産生了很多神奇的效果。
今天的內容分三個部分,第一就是讓我們先了解一下整個中國的汽車市場發展的變化;第二讓我們去了解一下,有關中國汽車消費者的一些特性,那我們為什麼選擇大數據去了解消費者,第三我會最終把大數據在整個汽車營銷領域的一些新的實踐分享給大家,並且把我們的思考與大家進行交流。 中國乘用車已經連續8年成為全球的銷量冠軍,到去年為止,2015年的銷量已經達到了1.9億台以上,隨著銷量不斷的攀升,其實中國的汽車保有量也達到了一個高點。在2015年,中國的乘用車的保有量已經達到全球第一,那麼這個乘用車是指,不包括其它商用車。在乘用車不斷的保有量達到高點以後,我們會不會認為整個的中國汽車市場已經達到了飽和,其實這個是不然的。 那我們來看一看整個全球各個國家千人保有量的數據,我們看一下,美國在2010年的時候,它的千人保有量數據是812台,其他國家,我們依次可以看一看,像德國2008年的時候數據是634台,俄羅斯在2011年的時候是271台,而中國在2015年的時候,千人保有量才達到110台。所以整個中國汽車市場的大環境,仍然是處於一個藍海的狀態,所以市場機會是非常廣闊的。
其實人類利用數據來感知社會服務生活,在很早時間就有了,比如在1850年代的時候有一個叫約翰·斯諾的,他是根據霍亂病患者,他就發現離水井比較近的地方患者多,他就推測水源是傳染霍亂的一個主要來源。比如説在1920年的時候,我們國家有一個叫胡煥勇的,他就根據各地,比如這個鎮有兩萬人,這個鎮有三萬人,他用描點法,有一條線叫胡煥勇線,這是我們國家的一個經濟社會的分水嶺。 那在80年後我們用QQ,微信同時在線數也能發現這種規律,就利用大數據。其實我們生活中也有很多大數據的案例,比如説在2016年6月7號北京下一點小雨,北京有雨的時候交通就比較糟糕,你就發現平時我打車一般來説他是不加錢的,而在這一天因為車供應量人需求量多,所以它就大概1.5倍,比如説我們在各種電子商務網站買書的時候,你發現除了,比如説期貨方面的書,除了給你推薦期貨方面的書之外,還給你推銷無線鼠標,無線路由器,它其實不是無緣無故的,它是根據過去很多人買這方面的書,然後同時又買了無線鼠標,無線路由器,這樣一個利用大數據的原理來進行精準的推薦。還比如説有很多人去江蘇某個地方去玩,這個地方都哪些人來呢,其實我們可以用電信信令的數據,來分析出來這些人從哪地方來,剛才算是一個序幕。
隨著互聯網、物聯網,特別是移動互聯網的迅猛發展,一個以信息爆炸為主要特徵的大數據時代正在來臨,這對於維護社會治安為主要職能的公安機關而言,既是一場挑戰,更是一場機遇,公安機關如何在打擊違法犯罪、維護社會治安穩定,和服務群眾中,依託大數據來提升工作效能,推動警務機制變革,我們和多家省、市公安機關進行了合作,進行了一些有益的嘗試,這些工作主要體現在三個方面,預警、預知和預測。 大數據的思維可能不會很準確的指出,誰誰誰就是壞人,你就是犯罪嫌疑人,但是我們通過對積累的海量數據的分析可以基本去掌握一個事物的運行規律和趨勢,知道了這個事物的運行規律和趨勢,也就是我們要講的預知,我們就可以預知,一旦符合這些條件的人,是不是19到23歲,淩晨一點到七點,甚至來自哪個地區的,入住的中低檔旅館,一旦他入住,我們後續的一些防範工作就可以有針對性的跟進,及時發現和制止違法犯罪行為。
我們每一個人每一天都在生活當中都在産生各種數據,我們每天乘坐公交車和地鐵刷卡的記錄,每天使用手機上智慧的APP産生各種數據,這些都是我們以人作為傳感器所得到的數據。我們每一天在發的微博,也可以用來去監測中國國民或者中國的市民他們的情緒,因為我們發的每一條微博它除了有語意以外,它還能告訴我們你發的是什麼時間,你發的微博在什麼地點,我們對它進行分析,可以將這些微博把它聚合到我們的地塊上,我們就知道城市裏每一塊土地上的居民,每一天是開心還是不開心。 我們可以通過這些數據去監測人群的流動、監測城市的活力,去監測我們城市公眾的情緒和輿情,同時我們可以通過這些辦法,能夠針對上述存在的問題進行有針對性的治理。當我們能夠感知到一個市民的活動,其實這個市民就參與到我們的社會生活和政治生活當中來了。所以我們認為所謂感知即參與,這也是我們城市能夠達成居民更廣泛的參與社會生活,參與我們城市治理的一個好的辦法。
豬聯網通過信息化的管理系統,把養豬的過程場景化,每一個養豬的過程,從配種到分娩等等一系列的環節場景化,然後再通過數字化的記錄,然後對於養豬人來説更加方便直觀地管理和操作。有了這些操作以後,所有的操作不是為了記錄而記錄,而是為了所有的是為了提高PSY所做的努力,比如説這個豬場我們就可以通過大數據來計算出它的各項指標,比如説配種的頭數,分娩的頭數和分娩率,那麼看出來這個指標以後,我們就知道它是什麼原因造成的指標不達標,比如説它是由於大量的空懷導致分娩率不達標,那麼具體來提高分娩率的辦法,我們就可以在線上給他一個解決方案。 在互聯網和大數據的背景下,你可以實時地查看豬場當天的各種的績效指標,實時地來掌控自己豬場的一個經營效率情況,甚至我們可以暢想未來也許有一天豬場老闆可以坐在海邊拿著手機,就可以知道自己當天是賠了還是賺了,我應該做哪些的操作。