央視新聞客戶端

央視新聞客戶端點擊或掃描下載

首頁資訊科技農業健康

預警、預知、預測大數據催生“智慧警務”

滾動 來源:央視網 2016年07月06日 18:40 A-A+ 二維碼
掃一掃 手機閱讀

原標題:

各位觀眾大家好!隨著互聯網、物聯網,特別是移動互聯網的迅猛發展,一個以信息爆炸為主要特徵的大數據時代正在來臨,這對於維護社會治安為主要職能的公安機關而言,既是一場挑戰,更是一場機遇,公安機關如何在打擊違法犯罪、維護社會治安穩定,和服務群眾中,依託大數據來提升工作效能,推動警務機制變革,我們和多家省、市公安機關進行了合作,進行了一些有益的嘗試,這些工作主要體現在三個方面,預警、預知和預測。

首先我來説説預警,何為預警?預警就是公安機關能夠及時對影響社會治安的各類因素進行提前的警示或者警告,防患于未然,預防或者避免違法犯罪行為的發生。其實在以往的信息化運用過程中,預警在公安機關的使用已經比較成熟,特別我舉個例子,對於逃犯的這個預警,只要在逃人員在我們的各類登記系統,譬如説旅館登記、乘車、乘飛機,相關系統立刻就能根據身份證號碼來進行這個比對預警提示,但是這些以往的做法都是在小數據的背景下的應用。簡單,而且比較容易被犯罪分子規避,那麼大數據背景下的預警它是怎麼回事呢?

我們首先來看一個案例。大家都知道,我們已經逐步進入了一個車能國家,路網現在越來越發達,車輛也越來越多,越來越多的犯罪分子違法作案,也開始搭上了汽車這個載體,犯罪分子開車作案,最好是開沒有牌照的車,但是大家都知道我們現在整個推動警力上路,路面的警力越來越密集,對於沒有掛牌的車子查控的越來越嚴厲,那麼這些犯罪分子只好退而求其次,他怎麼辦呢,他就是挂假牌,其中挂假牌有一個比較突出的常用的伎倆就是套牌,特別是兩台車,同一個品牌,同一個顏色挂同一個牌照,那我們大數據背景下的套牌車的排查模型這個就應運而生了,我們2011年就開始在探索的一個項目,在這個項目中我們的目標很清楚,在12個億的電子警察抓拍數據中,找出套牌的車輛,這個和以往的數據挖掘方法也是一樣的,對於大數據的處理的基本原則,也是以業務規則為核心,以數據資源為基礎,以運算能力為支撐,因此我們也是按照這個三步來進行工作的。

那我們第一個要做的什麼呢?就是要搞清業務規則,我們的這個規則是在較短的一個時間內,同一車牌不可能被不同路口的電子警察設備抓拍到,這其中涉及到三個變量。一個是時間,一個是車牌,還有一個是我們電子警察的這個地理位置。我們跟交管部門專業的交警部門進行了一系列的業務研究之後,基本確定下了這麼一個規則,在5分鐘之內如果距離大於十公里的兩個電子警察設備,同時抓拍到了一個車牌,那這個車牌可能就是套牌了,或者説套牌的概率已經非常非常大了,因為它不可能會開得這麼快。我們第二步就來組織數據,如果面對的是百萬級的或者千萬級的數據,那我們用常規的辦法,關係型的數據庫就可以把它解決掉了,但是在我們這個案例中遇到的數據是什麼呢,是上億的數據,我們在2011年的時候有12個億的數據,三年的電子警察抓拍的數據的和,因為我們在2011年左右,一個中等城市的電子警察的規模一天抓拍量大概在1000萬到1200萬這個概率,然後我們三年大概匯聚了12個億。因此這個實例,我們這個案例處理的一個技術架構,我們在技術上講的就是一個HADOOP,加上一個關係型數據庫數據,用HADOOP來處理上億的數據,然後預處理之後,用關係型數據庫,傳統的關係型數據庫來進行小數據的處理。第二個數據是電子警察的地理位置,這個數據其實我們很好獲取,因為我們全國公安機關都建設了一個叫Police GIS警用地理信息系統,在警用地理信息系統上,我們每一個路口的電子警察都標明了位置,因為它在地理信息系統上標明了位置,所以我們很容易判斷這兩個或者多個電子警察之間的距離,因為只要有坐標,記錄了經緯度,那我就很容易計算。

還有一個很重要的因素是什麼呢?時間,時間我們不是用來去採集的,我經常説這個時間我們是用來校準的,因為所有的信息化設備它都會有時間這個一個基礎的要素,但是我們往往很多的這個設備上的時間不同步,用我們專業的話講叫統一授時,就是所有的電子警察必須要在同一個時間上統一授時。好了,有了這三個數據,那我們就可以來進行計算了。當然這個具體的計算過程我在這兒也不詳細説了,也是一個非常典型的HADOOP的MAP-REDUCE的一個計算框架,由MAP來分發數據,由REDUCE來匯總數據,最後來得到我們的結果。我們第一次是有十台很普通的PC服務器搭建了一個HADOOP集群,我們第一次運行就從12億的車輛抓拍數據裏面獲取了394輛疑似的套牌車。很多人認為,你看你已經抓到394輛套牌車了,可以了,工作已經完成了,是不是這樣的,其實不是這樣的,我跟大家講,套牌車抓到了這輛,我知道了這個套牌車的這個車牌不一定在我警務工作中最後能解決問題,我解決的問題是什麼,要找到這輛車,抓到這個坐在車上的人。好了,那我們所以説這個案例大數據應用我們前面才進行了一半,用我們的專業講法前面是叫針對離線數據,離線的大規模數據進行一個挖掘分析,後面我們要用到什麼呢,後面我們要用到大數據的實時計算模式,我們要實時計算,因為這個車輛的查控時效性非常強,車輛在路面上跑,耽誤一分鐘它可能就經過了兩三個路口,每一個路口它就又會有三個指向,所以時間越短,這輛嫌疑車輛,或者説我們的套牌車輛它逃竄掉的概率它就越小,所以我們在技術處理上採取了一個什麼呢,叫KS的架構,K就是我們現在開源的叫Kafka,分佈式的一個消息訂閱系統。第二個就是我們Storm 大名鼎鼎的這個流式計算的框架Storm。具體是怎麼來幹的呢這個事情,就是在生産端,比如説A線區吧,將數據輸入到Kafka的這個消息隊列中去,然後在消費端,譬如説另外一個線區,我們姑且叫B線區,B區,接收到隊列中的數據,然後把它扔給Storm的計算框架來進行流式的比較分析處理,最終將實時的可疑的車牌比對出來,第一時間發送到我們路面的交警、巡警的移動終端上,這樣這個應用才會服務實戰,才有生命力。當然我們還可以將這個結果數據作為一個新的源頭數據,再次通過這個Kafka把它流到各個生産庫裏去,進行一個再比對,一旦發現有新的軌跡可以把它調出來進行綜合研判分析,這種比對的實效要大大地優於傳統的布控系統,我們説這是一種真正的實時查控。

另外,在自然宣傳防範上,大數據的預警也在逐步讓我們的老百姓,讓社會公眾嘗到甜頭,我們可以先看一個視頻。

吳女士是怎麼知道這個幕後大數據應用的工作原理呢?吳女士如果知道了幕後大數據運用的原理,她就不會再驚訝了,因為按照我們公安消防部門的群租房這麼一個主題應用,我們構建了一個水電煤氣的一個專題庫,也就是説我們居民家裏的用水、用電、用煤氣我們都進行了動態的記錄,這些符合大數據特徵的動態數據,最後我們把它整合起來通過模型的比對,我們就會知道這個房子,這個出租房它的用水、用電、用氣的量大大地大於一般居民戶的用水、用電、用氣的量,很容易就推斷出它是多人居住的一個群租房,那麼我們相關的應用系統就可以立即發出預警指令,以短信、微信等方式,包括一些上門宣傳,推送給我們的社區民警,我們的治安網格員,包括我們的房屋出租戶的租賃戶主,提醒他們做好檢查監督和其他的安全防範工作,類似于這種針對性的安全防範案例還很多,我們把它稱為大數據背景下的精準投放,主要原理多數也是基本類同的,就是通過大數據的運用,開展人物的刻畫,給不同的用戶貼上不同的屬性標簽,對匯聚了某一類或者某幾類屬性的標簽的人群推斷其的身份,推斷其的行為,然後有針對性的開展安全防範工作,譬如説我們對經常夜間網吧上網人員我們進行一系列的安全預警,對殘疾人,對我們的旅館、網吧在高峰時段我們進行預警,還有譬如我們消防部門的易自燃的機動車,包括電瓶車是在夏季非常容易自燃,我們有針對性的對車子進行刻畫,然後推出預警,包括還有假日期間我們針對學生家長的一些安全預警,這是第一個方面,大數據背景下的預警。

第二是大數據背景下的預知。如果説預警還是針對個體、個案的大數據應用,那預知就是對事物發展規律的一種總結性的應用。我們先來看一個小故事,似乎這個故事跟我今天要講的這個公共安全大數據沒什麼關係,但是它從中也能看出很多的道理來,大家看到的這是一本很普通的書,這本書叫The Cuckoo's Calling《布穀鳥的呼喚》。2013年4月這本小説在英國上市了,大家可以看到作者是誰呢,上面寫的是羅伯特,作者自我介紹他也是一名前警察,前便衣警察,然後2003年退役進入私人保安行業,寫下了這本書,這本書發行三個多月也沒有賣出什麼東西,幾乎因為別人也不知道這個羅伯特到底是誰,也不是一個很著名的作家嘛,這本書在整個英國的零售書商只賣出了400多本,然後在全球知名的網上書店亞馬遜英國站上面排名,排名排到了五千多位,也就是説基本上無人問津,書商們、書評商們最多對他的評價説文筆還不錯,故事也寫的很吸引人,但是不那麼特殊,之前還有出版社拒絕出版這本書。然而在一夜之間,一個消息改變了一切,在亞馬遜網站上這本書迅速地攀升到了暢銷書的前幾位,為什麼會這樣的呢,因為有了一個消息,這個消息説,這個男性的作者羅伯特其實是一個匿名者,真正寫的是誰呢,是一個女性,不單單是一個女性,還是一個寫過七集哈利·波特,並以此書成為歷史上第一位靠寫作收入超過10億美元的女作家J.K.羅琳。我們知道,以羅琳的知名度,和在寫作上的成功,她的小説攀升到這麼比較靠前的位置根本不算什麼,對不對,並不稀奇,但是這裡面有兩個很有趣的問題。

第一個,J.K.羅琳她為什麼要隱姓埋名,以一個男人的身份來發表一個新作品。第二個更關鍵,我們是怎麼知道,羅琳就是真正的作者呢,對於第一個問題我想也並不難理解,作為一個從不名一文的小寫手開始寫起,最終到寫作上非常非常成功地成為一個大文豪,大作家,經濟上更是叫前無古人的這麼一個作家,繼續寫作的動力可能也不是太大了,所以重新開始對於她來説可能是一種樂趣,所以她在最後被揭露之後,她才説,這個東西也不是我透露的,她説我一直希望這個秘密能夠保持的更久一些,因為作為羅伯特來發表這個文章是一種更自由的體驗,以另外一個名字發表,沒有任何期望值和吹噓,是如此地美妙,你看一個大作家她這麼説。但是第二個問題,到底是誰發現了這本書《布穀鳥的呼喚》,就是J.K.羅琳寫的呢?這個才是我講的重點,是誰呢,是大數據的技術,恰恰是大數據破譯了這個秘密,我們英國的兩位計算機語言學家使用了大數據的分析方法,對《布穀鳥的呼喚》還有另外的兩本書,大家應該都很熟悉的兩本書,《臨時空缺》和《哈利波特和死亡聖器》進行了科學的比對,一種大數據方法的比對,那這種比對是怎麼比對呢,我們可以簡單地看一下,他用了這麼幾種大數據比對的方法,第一種在每本書裏對比所有的詞組或者相連續的短語集,大家知道這是一個很大的數據量的一個比對了。第二個通過一種叫N-gram的算法,作為一個語言模型,來分析用詞或者字符的序列關係。其實我們很多作家,包括我們很多普通人在寫作,或者在説話的時候,他都是有自己的行為習慣的,只是你自己可能不太清楚這種習慣,這裡面可以做一個語言模型,來進行分析你的序列關係,一般你先喜歡寫什麼,再喜歡寫什麼,一般寫了這個字的之後,後面一個字是什麼?第三,對每本書中使用最頻繁的一百個詞進行了比較,對比出他們出現頻率的這個細微差別。第四,來分析詞的長度,排除詞意的因素。最後一個,也是一個比較關鍵的,叫主成份分析,對比每本書中的六個特點:單詞長度、句子長度、段落長度、字符頻率、標點頻率,還有詞的用法。我們兩個計算機科學家花了五個小時。五個小時後,這兩位計算機語言學家利用他們的大數據分析技術,十分肯定地證明了羅伯特就是大名鼎鼎的J.K.羅琳。歸根到底,這個案例告訴我們一個道理,成功之處在哪,就是説他找到了J.K.羅琳的寫作的規律。那我們在公共安全上,是不是也可以來借鑒這個做法,來進行分析呢,我們認為當然是可以的。早在2013年,我就帶領一支團隊也開始用大數據的技術來分析十年以來違法犯罪人員,入住旅館是一個什麼規律,當時的出發點也很初步,就是想看看他們什麼時間到旅館去開房間,去入住的。首先跟我們前面的這個案例也一樣,也是組織數據,我們2013年的時候經過多方的努力,匯聚到了十年左右的旅館的一個住宿的數據,當時的數據量大概15億條,這個也比較龐大了。10年某一個地級市的違法犯罪數據因為這個違法犯罪數據是一個內部數據,不能夠很精確,我只能告訴大家大概是在多少呢,大概是在60幾萬的光景。我們搭建了一個比對模型,其實也就15個億來比我們的60多萬人,最後得到十年間旅館住宿人員曾經違法犯罪過的,這個數據有多少條呢,200多萬條,通過碰撞比對200多萬條,這個就是一個在我們技術範疇看,就是一個典型的小數據了,用傳統的關係型數據庫可以很容易地去解決它,去處理它,去挖掘它,但是由於裏面涉及到一些比對,我們還要後面會説到跟15億數據去比對,所以這個案例還是我們大數據的工具,叫HADOOP,跟我們傳統的關係型數據庫一個混搭的處理模式。

大家現在看到的這一張圖是我們正常入住旅館的一個人群的時段分析,就十年以來我們普通人是怎麼住旅館的,這個折線圖的橫軸是我們的時間段,1時到24時;縱軸,大家看數值是一個百分比,其實它代表了數量,因為我要進行數值的脫密脫敏,所以你可以把它就看成數量,通過這個圖我們可以看出,這個也是十多億,用HADOOP的MAP-REDUCE來進行分組段來跑的,跑出來之後這個效率還是比較高的,我記得當時十多分鐘就把它跑出來了,跑出來得出圖中的結果可以看出,我們正常人一般開房的高峰是在下午的13時和夜間的21時左右,這個是我們一個正常人的。大家我們來看第二張圖,這張圖是什麼呢,是違法犯罪人員入住旅館的他的時段的一個分析,大家一看這張圖跟前面這張圖的折線不一樣了吧,有著明顯的區別了吧,你看它的峰值在哪在淩晨的3點左右,高峰期從淩晨的1時一直持續到早上的5時到6時,也就是説在前十年中這段時間是我們所謂的犯罪嫌疑人吧,或者通俗來講壞人入住旅館的高峰,同時結合前面一張圖,偏偏在這個時候是我們正常人入住旅館的一個低谷,所以顯而易見,你看犯罪嫌疑人是高位,我們正常人是低谷,對不對,這個分析對我們的實戰,特別對旅館業查控,對旅館業管理的實戰將産生十分重大的意義。

那好,那我剛才講的是所有的違法犯罪人員,那我還可以分的細一點,現在比較突出的犯罪是什麼呢,侵財類犯罪,侵財類犯罪裏面又以盜竊類犯罪為多,那我可以看一看,盜竊類的這個違法犯罪人員,在十年間他入住是一個什麼規律,在這裡面我要再強調一下所謂的大數據的思維,就是我們要需要一定的數據量級之後才能採取這種大數據的分析方式,我為什麼沒有把盜竊類下面再細分呢,譬如我們可以分為白日闖、分為爬二樓,對不對,我為什麼沒有去再分呢,因為再分這個數據量太少了,一少之後對於大數據的分析來説它就意義不大了,這個也是一種大數據的思維,在我們傳統的小數據思維下,想把數據的維度劃分的非常細,甚至劃分的越細越好,但是越細帶來每一類的數據量它都會急劇地減少,一減少之後我們大數據特別是針對歸類總結性的分析它意義就不大了,很容易來誤導,所以我們這個分析大家已經看到了,盜竊類的嫌疑人很有意思,他們開房的高點在哪?一個是淩晨的兩點,一個是早上的七點,關於這個結果呢,我也請教過很多刑偵、治安的老前輩,他們説你這個很有意義,為什麼呢?符合盜竊類犯罪嫌疑人的作案規律,他們一般會在一點左右作案,做到了之後他就去開房了,第二個他們會在五六點鐘作案,作完案他們可能七點鐘左右去開房,有這麼一個規律,那我們還可以拓展,拓展到什麼,這張圖是年齡的分析,我可以看一看淩晨一點到七點,我們重點要查緝的盜竊類犯罪嫌疑人,入住的他一個年齡範圍是多少,這個圖大家一看就比較清楚了,19到23歲,在這個點裏面住著是比較有嫌疑的,好,那我們還可以來看他的叫入住的檔次,這一條紅的虛線是正常人的入住檔次,高檔,中檔,中低檔,我們可以看出主要是在中檔左右,普通人,這也是一個大數據的分析,而你看犯罪嫌疑人他們住的什麼,到中檔最後就持平了,就證明我們盜竊類的,侵財類的,侵財類裏面盜竊的犯罪嫌疑人,他基本上是在住中檔,中低檔和低檔的這個旅館,這個就是我們治安防範要重點去關注的這個部位。從上面的分析可以看出,大數據的思維可能它不會很準確的指出,誰誰誰你就是壞人,你就是犯罪嫌疑人,但是我們通過對積累的海量數據的分析可以基本去掌握一個事物的運行規律和趨勢,知道了這個事物的運行規律和趨勢,也就是我們要講的預知,我們就可以預知,一旦符合這些條件的人,是不是19到23歲,淩晨一點到七點,甚至來自哪個地區的,入住的中低檔旅館,一旦他入住,我們後續的一些防範工作就可以有針對性的跟進,及時發現和制止違法犯罪行為。

在大數據預知犯罪中還有一個比較常用的分析方法,我們稱為叫日常分析,我也可以舉個例子給大家看看,大家看這張圖,我們還是以旅館住宿為例,大家看看這個入住有什麼特點,對不對,對,大家可能都發現了,他入住旅館的檔次忽高忽低,一會住五星級酒店,一會住沒有星級的車站旅館,這個是什麼呢,這個就是很典型的,犯罪分子的入住規律,特別是侵財類犯罪分子,有了錢趕緊揮霍,沒有錢他只好去住20塊錢一個晚上的車站旅社,這些都逃不過我們數據的眼睛,通過海量數據的這個篩選,我們用大數據的方法,把這些日常入住的數據瞬間捕捉,直接提供給我們的刑偵民警,治安民警來進行進一步的工作。

最後是預警。預警是大數據運用的高級階段,它的原理其實也很簡單,也就是將前面規律性的應用把它映射到或者叫投射到我們的未來中,看未來會不會發生同樣的事情。李克強總理經常説的一個,人在幹,雲在算。在我們公安我的理解,所謂的雲在算,更多的就是要通過大數據進行預警,這塊我們還處於一個起步階段,所以也沒有形成很成熟的應用的規模效應,所以今天我跟大家介紹幾個我們正在探討的這個案例。

第一個,是對於車輛未來行經路線的預測,就是説基於汽車經過我們電子警察卡口,這個的數據,前面已經説過了,這是一個數據量非常龐大的數據,我們通過若干個算法來對未來這一輛車輛可能會經過一個,或者哪幾個卡口進行預測,這個我們稱為叫一個規律路徑的預測,這個應用對於公安機關來講是有很現實的這個意義的,很現實的實戰意義的,特別是對於我們需要重點去控制的一些車輛跟駕車人,在這個以往的應用中大多數基於GPS,GPS説實話比較難獲取,我們用電子警察的卡口更精準,更完備,所以比GPS數據對於我公安目前而言是一個比較優化的一個方案。

我們也經過了實測,這裡面的算法主要是用到了聚類,還有用到了回歸,我們經過實測,判斷往後面一個週期一輛車某一輛車行經路線,其實是經過哪一個路口了,準確的概率目前的測試已經達到了68%以上。

第二個實例,跟大家講的案例,是我們對刑滿釋放人員,他會不會重新犯罪進行一個預測。這個我們也是依託工具平臺,依託一個雲架構的工具,因為要分佈式處理,數據量很大,然後我們會有一些警用的算法,主要也是聚類、回歸,來對這個刑滿釋放人員對他的是否會重新犯罪進行一個預測,這裡面我們涉及到很多預測因子的指標,包括年齡、羈押期間的一些相關的信息,家庭或者他家族的一些依附關係的情況,包括他個人的受教育情況,還包括他的人身經歷,還有包括不良社會交往,甚至一些反社會的行為,我們都要把它建庫建表,作為一個預測因子,然後通過一個動態的指標表,通過我們回歸跟聚類的算法,來判斷出一個什麼呢,他一旦刑滿釋放之後,他重新犯罪的概率用多大,因為我們大概知道了這個概率之後呢,可以相對應的採取不同的我們叫幫教也好,幫扶也好,採取一系列的讓他回歸社會,成為一個正常人,採取一系列的預防措施。

第三個案例是我目前正在做的,是化工園區的火災隱患的預測,這個也是非常有現實意義的。化工園區的火災不同於一般的火災,大家都知道天津港這個事件,對公共安全的殺傷力極大,因此我們看能不能通過大數據的應用,對化工園區進行火災隱患的預測,這個對公共安全非常有意義,我們通過整合單位消防安全管理的一些數據,包括它日常管理,單位的一些隱患信息呀,整改情況啊,設備設施的運行情況,維保情況,包括還有互聯網上的一些反映,這些信息。還有我們一些消防違法行為的處罰信息,他單位行業主管部門我們消防機構對他的處罰性信息,包括我們既往火警火災的一些數據,特別是我們以往積累了大量的119的報警數據,我們火災調查的火調數據,對於這些數據我們來建立指標,進行相關的預測因子的因素的設置。最後我們來預測一個化工園區是否會發生火災,在未來會發生火災進行一個預測,進行一個概率的預測,同時把這些影響的隱患要立即要告訴我們的消防機構,告訴我們的化工園區單位,要進行有針對性的整改和防範,前面跟大家説了大數據背景下的預警,預知和預測。

下面我簡單地最後談幾條體會,因為我一直在從事這一方面的研究工作。

第一條,就是叫不要空談大數據。注意,不是不談,是不要空談,為什麼説不要空談呢?我把幾個問題把它列出來了,第一個我們目前的確沒有很好的、很成熟的非結構化,或者半結構化數據的處理工具,這是一個現狀。第二個,我們很缺少機器學習和相配套的這麼一個知識庫。我們這個阿法狗為什麼會戰勝人類,其實它就有了機器學習和知識庫這兩個法寶。第三也我是經常説的,我們目前還沒有符合行業特點的傳感器。我也經常説一句話,沒有傳感器就不要談大數據,所以看到這三個問題我想我們當前的一個階段,我們重點應該在哪呢,應該是去聚焦海量的結構化數據的處理,這是第一條。

第二條,提升數據處理能力,它是王道。我們沒有足夠的計算能力,你再有用的信息也會被數據淹沒,你存在那兒就是個死數據,存的下,不等於你能夠算得動,我們現在的警務運用往往就是能查,能查詢,能查遠遠不能滿足警務實戰的需求,那我們怎麼幹呢,那就是大數據的套路,分佈式處理,分佈式處理是當前提升計算能力的必由之路,包括微觀分佈,就所謂的在一個機房,甚至在一個機器裏面可以有一個分佈。另外呢宏觀分佈,基於不同機房,不同地理位置的一個宏觀分佈。最後還要注意一個什麼呢,基於不同類型的數據庫,我們現在有關係型,NOSQL型,內存型,多種數據庫的一種混搭運用,混合計算模式,前面講的都是混合計算模式,傳統型的關係型數據庫還不能丟。

第三條,努力要使數據流動起來。大數據不在於大,我一直在強調這個觀點,在於在線和流動,數據就像我們的貨幣一樣,只有流通它才能增值。你把貨幣,你把你的錢放在家裏,存在銀行裏,它這個增不了值,只有讓它流通起來,來買東西,買賣、商品交易,我們的數據也是一樣的,數據增值的最佳辦法,我們目前發現的就兩個,一個重組,A跟B進行重組,得出一個新的數據集來增值,第二個就是跨界,就通過站在這個維度的範疇去看另外一個維度,我前面講的旅館住宿檔次的這個案例,就是很典型的一個跨界,其實我通過旅館住宿的行為去判斷出了他的金字情況的異常,對不對,一會住的高,一會住的低嘛,金字情況的異常,這就是數據的一個跨界運用,我們説要讓數據在不同的維度上去體現不同的價值。總之啊,要讓信息時時處於一個在線的狀態,讓更多的人能使用的到。各位觀眾,以上就是我簡要的介紹了我們公安機關如何依託大數據來開展這個預警、預知預測、這些應用的情況。應該講從數據中獲取價值,讓數據逐步成為公安機關工作的一個主導因素,特別是用大數據的思維,大數據的方法,大數據的技術來提高我們的工作效率,推動警務機制變革,催生智慧警務落地,這個我們正在這條道路上不斷地探索前行,謝謝大家。

 

  • 新聞
  • 軍事
  • 財經農業
  • 社會法治
  • 生活健康
掃一掃
掃一掃,用手機繼續閱讀!
央視網新聞移動端
央視新聞客戶端iPhone
央視新聞移動看!
CBox移動客戶端
下載到桌面,觀看更方便!
860010-1114010100
1 1 1