自1987年從中國發出了第一封電子郵件以來,中國互聯網産業的發展已有將近15年的時間。中國互聯網市場也已發展為僅次於美國的全球第二大市場。網民規模已經超過1.3億(CNNIC2007年報告),中文也成為了互聯網第二大語言,在傳統互聯網産業(新聞、搜索引擎、電子郵件等)保持高速增長的同時,各類新興的網絡服務産業(如網絡視頻、WEB2.0、博客網)也風起雲涌,豐富了互聯網服務的應用領域。
網絡的飛速發展也使信息共享和獲取更加方便快捷。而具體如何將網站的信息進行統計匯總,從而作為我們進行決策的依據,一直是國內企業關注的焦點。但是,我們也應當看到在國內互聯網市場高速成長的同時,相關網絡流量的評估與分析工作卻一直滯後。特別是缺少一個對網站流量進行綜合排名的權威工整機構,使得中國網站長期依賴國外網站流量分析機構ALEXA(www.alexa.com)的統計數據。
所謂第三方網站流量排名服務,就是通過一個完全中立性的第三方平臺對所有網站的流量進行監測,在利用自己的一套算法對網站流量進行評估統計,由此得出網站排名的先後順序。網站流量的統計、排名、調查、分析和推廣在國內早已有之,但卻是混亂和極不規範的,不僅缺少一個統一的標準,大家也都按照各自的理解確定名詞,因此大家在討論和交流時就缺少必要的基礎。國際上在這方面比較成功的案例是ALEXA。ALEXA是以發佈世界網站排名而引人注目的一個網站,創建於1996年4月,1999年被亞馬遜收購,他們的目標是讓INTERNET沖浪者在分享虛擬世界的資源同時,更多的參與INTERNET資源的組織。作為一個商業單位,ALEXA的數據在國外也僅僅是作為一個參考,國外的企業更注重對流量的深入分析,而非簡單的排名。但在中國,ALEXA的排名卻長期被行業奉為圭臬,那麼ALEXA適合中國的網站對於流量排名的需求嗎?事實上,自2006年以來ALEXA的中國網站排名數據已經越來越被廣泛質疑,其原因如下:
1、ALEXA對中國互聯網了解不夠
雖然互聯網倡導“連接無極限”,但不意味著不會受到疆域或地域的影響。語言、文化、習俗、意識形態、經濟基礎等因素的差異,都會導致各地區網民的上網習慣、瀏覽取向、網上消費習慣的不同,最終體現為各地區網站流量的特點差異。例如:在國外非常普及的維基百科類網站,在國內基本局限于小眾群體。而在國內擁有大量人氣的純社區類網站(如百度貼吧、天涯、貓撲等),在國外也遠不如在國內那麼有市場。再例如:國內網民的習慣“看文章、發表評論”,會經常出現一個網站因為發表一篇文章,導致流量大幅度增長,而在國外則很少會有這樣的情況發生,所以做網站排名必須要結合本地特點來制定標準。而ALEXA對中國互聯網的現狀長期缺乏了解,也很少和國內互聯網産業進行交流,在2007年8月,根據自身的標準,單方面大幅度降低中國地區網站的排名就是個明顯的例子。
2、統計模式的先天不足
而在統計方法上ALEXA也存在明顯的缺陷。對任何網站的統計一般有兩種方法:一是客戶端統計(我們稱之為K統計)和因此得到的客戶端排名(我們稱之為K排名);二是網站端統計(我們稱之為W統計)和據此得到的網站端排名(即W排名)。K統計的方式是在網民的電腦上安裝一個統計插件,該插件可以自動記錄網民瀏覽網頁的行為,如登錄哪些網站、打開哪些網頁、打開網頁的時間等,這些記錄會自動被統計插件保存併發送到流量統計平臺,該平臺根據自身算法將所有網民終端發回的記錄進行統計,計算出網站的流量排名。ALEXA就屬於這類模式。由此可見,K統計是一種抽樣統計方法,結果質量完全取決於安裝統計插件的網民數量,由於在所有網民的電腦上都安裝統計插件是無法在現實中完成的,所以統計樣本(安裝統計插件的網民)的地區分佈和水平分佈非常關鍵。W統計即網站端統計,是指在網站服務器端安裝相應的統計軟體,並記錄所有客戶的訪問情況,對訪問量進行統計分析。這兩類方法在統計上都有自己的特點,但也各有局限之處。我們可以在如下幾個主要方面做一個對比:
由此我們可以看出,客戶端統計的優勢在於對訪問量的深度分析,特別是對不同特徵的網民群體做個性化分析方面(如商業用戶群體),而網站端統計則在流量宏觀統計上有先天優勢。我們可以用一個形象的方式來説明兩類方式的優勢,假設在一個人聲鼎沸的會場裏,網站端統計可以統計聲音分貝高低,而客戶端則是分析不同人群主要説什麼,如果這兩類方式能結合使用,將會極大地提升網站流量排名的精確度和深度。
3、統計樣本的局限性
讓我們再分析一下ALEXA的模式。如前面所言,ALEXA數據客戶端統計模式,數據來源全部是安裝其統計插件的網民。由於統計插件本身對網民的實用價值不大,為了鼓勵網民主動安裝,一般都打包成一個實用軟體。ALEXA的統計插件是瀏覽器工具條(ALEXA TOOLBAR),該插件可為普通網民提供搜索引擎服務。但ALEXA的工具條沒有中文版本,在産品設計上對中國網民的實用性並不高。所以在中國主動安裝的中國網民多為網站站長和互聯網專業人士,目的是為了提升自己網站的排名。這些人群在中國1億網民中所佔的比例很小,而他們的上網行為卻都被ALEXA抽樣統計為中國網民的普遍行為。通常來説,作為抽樣統計模式,統計樣本必須分佈均勻,不僅僅是地區分佈均勻,而且網絡操作水平、知識水平、職業背景等都應該有均勻的分佈,否則會嚴重影響統計結果。ALEXA從統計取樣上就有嚴重的偏向性。
4、對作弊處理的標準不符合中國互聯網的特徵
在2007年8月,ALEXA對中國網站的數據做了調整,導致中國網站的排名大幅度下降。其中確有作弊的網站,但也有不少被“流量誤殺”的網站。中國擁有全球第二大網民市場,而在ALEXA全球排名全500的網站中,中國網站只有一小部分,甚至一些韓國、日本網站卻排在中國網站前面。主要原因是ALEXA有一套自己定制標準的反作弊機制,凡數據增長不符合這個機制的網站都在被打壓的範疇內。反作弊是確保排名公正的重要措施,但必須要考慮不同國家的互聯網文化,借助一刀切的手段去保證公正性,其本身也就失去了公正。
我們如何做自己的網站排名?
為了中國互聯網的良性發展,中國必須擁有自己的第三方權威流量統計平臺。但做流量統計不能照抄ALEXA的模式,應當設計開發符合中國互聯網特點的流量統計方法。在這方面由國務院新聞辦電信管理局指導、中國互聯網協會主辦的中國網站排名網(www.chinarank.org.cn )在這方面做了有意義的探索。中國網站排名成立於2006年12月19日,雖然只有半年多的時間,但其發佈的網站流量排名已逐漸被業界所認可。除了互聯網協會作為一個公益性行業組織,不會設計排名商業利益的影響之外,在流量統計分析方面還具備如下特點:
1、 客戶端數據源覆蓋面廣,保證數據的準確性
中國網站排名的統計軟體累計覆蓋了400萬網民,平均每天活躍的網民數為40萬,基本能抽樣監測國內所有網站的訪問變化。
2、 針對中國網站設計多種流量統計算法
單純統計網站的流量高低已遠遠不能滿足互聯網行業的需要,中國網站排名網推出了10余種特色算法,對網站流量進行深度分析,例如:
同類網站訪問率——在一段時間內(以30天為單位),某網站的總訪問量中,同時也訪問過與其提供相同或類似服務網站的訪問量。
網站忠實訪問率——以日為單位,在一段時間(30天)內,訪問某網站達3日或3日以上的獨立訪問量(一日內多次訪問不計算在內)。
網站流量黏著率——某網站的黏著率越高,説明深入訪問該網站的用戶比例越高,也可間接證明網站的信息內容及服務對網民的吸引力越明顯。
網站流量貢獻率——某網站對其他網站的流量貢獻率越高,可間接體現該網站的廣告投放的價值與效果越明顯,為廣告主選擇網站投放廣告提供重要的指導數據。
等等……
3、 和眾多ISP運營商開展嘗試性合作,完善統計算法
前面已經提到,客戶端統計與網站端統計的結合能優勢互補,極大地提升網站流量排名的精確度和深度。作為電信基礎服務提供商,ISP運營商可提供最客觀的網站端流量數據。因此,中國網站排名網與多家ISP運營商開展合作,在流量統計方面進行探索性嘗試,將IP流量數據與獨立客戶端的數據進行算法結合,提供權威的網站流量排名數據。
4、 完善分類排名,根據行業特點評估網站流量
行業特性也是導致網站流量特徵的一個重要因素,而一般的網站排名只考慮總流量的排名,忽略行業的特點。例如購物網站和新聞網站服務於不同領域,他們本身不具備可比性,如果將網站按照他們所服務的行業做排名,則更能反映不同行業的網絡發展水平。
目前,中國互聯網正在經歷一個新的發展階段,新興的網絡服務産業也會層出不窮,網民數量和網站規模還有很大的增長空間,對網站流量統計的需求也會不斷加強並提出新的需求。長期依賴國外網站流量統計平臺不利於中國互聯網的良性發展,所以中國必須要自己權威、公正、客觀的網站排名。
>>>>更多內容請關注互聯網頻道<<<
責編:修榮騰
更多相關新聞