央視網|中國網絡電視臺|網站地圖 |
客服設為首頁 |
數字漫天飛,虛實真難辨 朱慧卿繪(人民日報發)
我該相信誰的調查(民生視線)
曾兩度出任英國首相的本傑明?迪斯雷利有句名言,“世界上有三種謊言:謊言、該死的謊言,還有統計數據。”事實上,統計數據本身並無罪,可人們往往喜歡濫用統計工具來支撐自己的立場,而不是反映真實情況。
如今,來自於方方面面的統計數據、調查數據越來越多,並日益影響到普通人的生活和心態。面對海量的數據,該如何分析辨別?記者採訪了有關專家。
正點率、物價漲幅怎麼和我感受不同?
統計數據常是“一籃子”項目的全國綜合水平,往往與個人感受不一致;某些指標或算法有特定的含義
去年下半年以來,看著菜價、肉價一路飆升,退休職工田英開始關心起CPI。不過每個月和自己的家庭賬本“對賬”時,田英總會很疑惑:“我賬本裏的肉價、菜價都翻一兩倍了,房租也漲了兩成,可當月CPI還是個位數,這統計局的數據是不是造假了?”
和田英一樣對官方數據抱有懷疑的還有常在京滬之間出差的薛先生。根據中國民用航空局的統計,2010年民航航班正點率為75.5%,可這個數據與薛先生的感受大相徑庭。“怎麼可能這麼高?我去年跑上海,就沒一次準點過!尤其是世博會期間,航班延誤一般都要兩三個小時!”
為什麼這些權威部門的統計數據,與百姓的生活體驗不一致呢?
一是人們往往喜歡用少數商品的價格水平或服務水平,與相關部門統計的“一籃子”商品或服務項目的綜合平均水平相比較。比如田英的賬本僅記錄了自己家附近農貿市場的菜價和自家的房租變化。而統計局公佈的CPI構成分八大類262個基本分類,價格往往有升有降,而且各分類的權重也不同。
二是人們往往喜歡用某一地域的價格水平或服務水平,與全省、全國的平均水平相比較。比如,薛先生就是用自己經歷的某一條航線某幾個航班的準點率,與全國範圍所有航線所有班次的正點率相比較。
三是人們對某一調查的樣本及統計口徑不了解。統計口徑是指統計數據所採用的標準,包括統計方式、統計範圍等指標。統計方法又包括抽樣調查、全面統計等。不同的統計口徑會導致完全不同的統計結果。例如,今年5月國家統計局公佈的“2010年城鎮居民人均居住月支出111元”就是個狹義口徑,購建房款支出不包含在內,只統計實際發生的房租、供暖費、維修費等現金支出。而且該調查樣本有80%以上是自有住房戶,20%是租房戶,因此樣本中的“零房租”大大拉低了最終的平均支出水平。
清華大學新聞與傳播學院教授金兼斌長期研究媒介調查與統計方法。他認為,“有些指標的定義或者算法,民眾可能不太清楚。例如物價指數是一個有多個子指標計算合成的綜合指標。但如果人們只關注或比較關注其中個別指標,則兩者的漲跌狀況有時會有出入。因此,在有關部門不斷完善統計方法的同時,也需要提高民眾的統計素養和科學素養。”
目前,統計部門對外公佈的各種報告中,都會附有該項調查的統計口徑、統計樣本、統計方法以及具體名詞的解釋,以便研究機構或大眾媒體更科學地解讀和運用數據。比如目前的“城鎮登記失業率”,這項統計針對的是非農業戶口、在一定的勞動年齡內、有勞動能力、無業而要求就業並在當地就業服務機構進行求職登記的人員,不包括農村勞動力、國有及集體企業下崗職工,以及未主動登記的其他城鎮失業人員;“城鎮職工平均工資”,包括了工資、津貼、獎金,以及個人應交納的養老、醫療、住房等個人賬戶的基金和稅金。
不過也有人建議,這些民生調查的統計口徑與樣本應繼續完善,使之更合乎現實國情。例如,城鎮居民人均居住月支出調查中80%的樣本為自有房住戶,這一比例是否偏高?如果以該統計數據為參考,那麼各地是否會喪失鞏固房地産調控政策、大力發展保障房的動力?如果“失業率”的統計口徑與方法能隨著時代發展而不斷完善,是不是就會使感覺自己“被就業”的人群相應減少呢?
僅憑平均數可能會被誤導?
平均數不能代表一組數據,更不能反映一組數據間有多大差異,還會受到極端值的巨大影響
大學生小仇還沒畢業,就掉進了“平均數的陷阱”。她曾到一家展會公司求職,被老闆告知企業平均工資為3000元,她的實習起薪是800元。後來她托熟人一打聽,發現公司業務員的薪水都是1000元,便去找老闆理論。
老闆給她算了一筆賬:公司業務員10名,薪水1000元;業務經理5名,薪水2000元;部門主管6名,薪水2500元;副總經理拿10000元,總經理拿24000元。由於收入差距懸殊,全體人員一平均,平均工資確實是3000元。而對於小仇這樣的求職者而言,一組數據中出現最多的數值——眾數,即大多數員工的工資1000元,以及一組數據從小到大排列位於中間的數值——中位數,即員工中等工資2000元,可能比平均數更具有參考價值。
實際上,小仇的經歷也反映了目前統計數據無法反映社會收入分配差距的問題。2010年我國城鎮非私營單位在崗職工年平均工資為37147元。其中,最高工資行業與最低工資行業年平均工資之比為4.7:1;最高工資行業金融業中,非私營單位與私營單位在崗職工年平均工資之比為2.6:1。由於行業差距、地域差距,以及同行業中不同企業、同企業中不同級別的收入差距,導致低收入群體在看到37147元時,往往産生“被增收”的感覺,而高收入人群看到37147元時,又覺得該數值被嚴重低估。
由於可以簡潔地反映樣本總體的情況,統計中的“平均數”無處不在。然而平均數也具有誤導性,常會掩蓋原始數據的信息,還會受到極端值的巨大影響。比如在中小學裏,班級平均分往往會因為一兩名不及格的學生而大幅下滑,因此總有老師會憤懣地説:“真是一顆壞小豆,毀了一鍋粥”。再比如,在各種體育、文藝比賽中,往往會“減去一個最高分、再減去一個最低分”,這也是因為將少數異常值去掉後計算出的平均值具有更好的代表性與穩定性。
“僅靠平均數不能反映一組數據間有多大差異。平均數通常需要與標準偏差結合起來報告或考察,才能得出相對全面的分佈描述。”金兼斌認為,人們對統計數據産生誤讀或誤解,往往是因為有關部門發佈這些調查數據時,只報告了平均數,而沒有解釋相關指標的分佈差異情況。“那些與平均數水平差別較大的民眾,會覺得調查結果與他們實際感受有出入,進而認為數據有問題。”
實際上,統計是無限接近現實,卻不能代替現實,很多統計數據只能反映宏觀趨勢的變化,不適合作為個體選擇的參考。比如,統計部門公佈的商品住房銷售均價、銷售額與銷售面積,在研究一個區域的經濟、産業走勢上的作用突出,對單一購房者,這種“均價”在判斷房價走勢、決定是否該買房等方面,沒有太多參考價值。
哪些調查的“百分比”不可信?
樣本容量小、抽樣不科學,一些街邊問卷與網上調查的結果不可偏聽偏信
“89.3%的人坦言物價上漲影響生活”、“一半人認為房屋單位售價在5000元以下最能接受”……每天電視、報紙、網絡都在刊登著各種調查機構的調查結果,這些聳動視聽的“百分比”調查結果真的反映了現實情況嗎?
張小姐曾經供職于北京一家小型的信息諮詢公司。她接到的第一份工作就是問卷調查都市人群的牙齒保健行為。但令她不解的是,公司並沒有採取嚴格的抽樣方法,而是讓員工和臨時志願者去城市商圈、地鐵站等處,臨時找人填寫問卷。而且問卷中的一些問題,受訪人可能不會真實回答。“比如您現在存在哪些口腔問題,我想不會有人主動選擇口臭一項。而且上班時間逛商場的人群是否就能代表這個都市的基本面,我也很懷疑。”
金兼斌認為,統計數字誤導最常見來自抽樣問題。抽樣調查首先要保證一定的樣本容量。另一方面,樣本能很好地代表總體,避免調查受到社會傾向的影響。“例如,恐怕很少有人願意填寫問卷承認自己歧視農民工,但實際言行顯然是另一回事。”
不僅是街頭問卷調查,很多所謂的網上民意調查的結果也值得商榷。例如今年8月,中國青年報社會調查中心的一項網絡調查顯示,83.2%的受訪者確認現在社會謠言很多,其中34.4%的人表示“非常多”。大量媒體據此撰文“八成民眾認為現在社會謠言很多”。實際上,該調查是僅對1714人進行的在線調查,而且參與者最可能是上述網站的常客以及曾經歷過該話題的人群。媒體的結論顯然有以偏概全之嫌。
網絡調查是一種計算機輔助的信函訪問方式。通過電子郵件和互聯網頁面,被調查者可以輕鬆而不受拘束地完成調查,提高了調查的便捷性。但網絡調查不能實現人口全覆蓋,且受到虛擬匿名等局限,真實性很難鑒別。(人民日報)