央視網|中國網絡電視臺|網站地圖
客服設為首頁
登錄

中國網絡電視臺 > 新聞臺 > 中國圖文 >

人民日報:我該相信誰的調查

發佈時間:2011年09月15日 06:00 | 進入復興論壇 | 來源:人民日報


評分
意見反饋 意見反饋 頂 踩 收藏 收藏
channelId 1 1 1
壟!-- /8962/web_cntv/dicengye_huazhonghua01 -->

更多 今日話題

壟!-- /8962/web_cntv/dicengye_huazhonghua02 -->

更多 24小時排行榜

壟!-- /8962/web_cntv/dicengye_huazhonghua03 -->

眾多調查數據中,誰是真權威,誰缺少代表性?

我該相信誰的調查(民生視線)

記者 陸婭楠

數字漫天飛,虛實真難辨

  曾兩度出任英國首相的本傑明迪斯雷利有句名言,“世界上有三種謊言:謊言、該死的謊言,還有統計數據。”事實上,統計數據本身並無罪,可人們往往喜歡濫用統計工具來支撐自己的立場,而不是反映真實情況。

  如今,來自於方方面面的統計數據、調查數據越來越多,並日益影響到普通人的生活和心態。面對海量的數據,該如何分析辨別?記者採訪了有關專家。

  正點率、物價漲幅怎麼和我感受不同?

  統計數據常是“一籃子”項目的全國綜合水平,往往與個人感受不一致;某些指標或算法有特定的含義

  去年下半年以來,看著菜價、肉價一路飆升,退休職工田英開始關心起CPI。不過每個月和自己的家庭賬本“對賬”時,田英總會很疑惑:“我賬本裏的肉價、菜價都翻一兩倍了,房租也漲了兩成,可當月CPI還是個位數,這統計局的數據是不是造假了?”

  和田英一樣對官方數據抱有懷疑的還有常在京滬之間出差的薛先生。根據中國民用航空局的統計,2010年民航航班正點率為75.5%,可這個數據與薛先生的感受大相徑庭。“怎麼可能這麼高?我去年跑上海,就沒一次準點過!尤其是世博會期間,航班延誤一般都要兩三個小時!”

  為什麼這些權威部門的統計數據,與百姓的生活體驗不一致呢?

  一是人們往往喜歡用少數商品的價格水平或服務水平,與相關部門統計的“一籃子”商品或服務項目的綜合平均水平相比較。比如田英的賬本僅記錄了自己家附近農貿市場的菜價和自家的房租變化。而統計局公佈的CPI構成分八大類262個基本分類,價格往往有升有降,而且各分類的權重也不同。

  二是人們往往喜歡用某一地域的價格水平或服務水平,與全省、全國的平均水平相比較。比如,薛先生就是用自己經歷的某一條航線某幾個航班的準點率,與全國範圍所有航線所有班次的正點率相比較。

  三是人們對某一調查的樣本及統計口徑不了解。統計口徑是指統計數據所採用的標準,包括統計方式、統計範圍等指標。統計方法又包括抽樣調查、全面統計等。不同的統計口徑會導致完全不同的統計結果。例如,今年5月國家統計局公佈的“2010年城鎮居民人均居住月支出111元”就是個狹義口徑,購建房款支出不包含在內,只統計實際發生的房租、供暖費、維修費等現金支出。而且該調查樣本有80%以上是自有住房戶,20%是租房戶,因此樣本中的“零房租”大大拉低了最終的平均支出水平。

  清華大學新聞與傳播學院教授金兼斌長期研究媒介調查與統計方法。他認為,“有些指標的定義或者算法,民眾可能不太清楚。例如物價指數是一個有多個子指標計算合成的綜合指標。但如果人們只關注或比較關注其中個別指標,則兩者的漲跌狀況有時會有出入。因此,在有關部門不斷完善統計方法的同時,也需要提高民眾的統計素養和科學素養。”

  目前,統計部門對外公佈的各種報告中,都會附有該項調查的統計口徑、統計樣本、統計方法以及具體名詞的解釋,以便研究機構或大眾媒體更科學地解讀和運用數據。比如目前的“城鎮登記失業率”,這項統計針對的是非農業戶口、在一定的勞動年齡內、有勞動能力、無業而要求就業並在當地就業服務機構進行求職登記的人員,不包括農村勞動力、國有及集體企業下崗職工,以及未主動登記的其他城鎮失業人員;“城鎮職工平均工資”,包括了工資、津貼、獎金,以及個人應交納的養老、醫療、住房等個人賬戶的基金和稅金。

  不過也有人建議,這些民生調查的統計口徑與樣本應繼續完善,使之更合乎現實國情。例如,城鎮居民人均居住月支出調查中80%的樣本為自有房住戶,這一比例是否偏高?如果以該統計數據為參考,那麼各地是否會喪失鞏固房地産調控政策、大力發展保障房的動力?如果“失業率”的統計口徑與方法能隨著時代發展而不斷完善,是不是就會使感覺自己“被就業”的人群相應減少呢?

  僅憑平均數可能會被誤導?

  平均數不能代表一組數據,更不能反映一組數據間有多大差異,還會受到極端值的巨大影響

  大學生小仇還沒畢業,就掉進了“平均數的陷阱”。她曾到一家展會公司求職,被老闆告知企業平均工資為3000元,她的實習起薪是800元。後來她托熟人一打聽,發現公司業務員的薪水都是1000元,便去找老闆理論。

  老闆給她算了一筆賬:公司業務員10名,薪水1000元;業務經理5名,薪水2000元;部門主管6名,薪水2500元;副總經理拿10000元,總經理拿24000元。由於收入差距懸殊,全體人員一平均,平均工資確實是3000元。而對於小仇這樣的求職者而言,一組數據中出現最多的數值眾數,即大多數員工的工資1000元,以及一組數據從小到大排列位於中間的數值中位數,即員工中等工資2000元,可能比平均數更具有參考價值。

  實際上,小仇的經歷也反映了目前統計數據無法反映社會收入分配差距的問題。2010年我國城鎮非私營單位在崗職工年平均工資為37147元。其中,最高工資行業與最低工資行業年平均工資之比為4.7:1;最高工資行業金融業中,非私營單位與私營單位在崗職工年平均工資之比為2.6:1。由於行業差距、地域差距,以及同行業中不同企業、同企業中不同級別的收入差距,導致低收入群體在看到37147元時,往往産生“被增收”的感覺,而高收入人群看到37147元時,又覺得該數值被嚴重低估。

  由於可以簡潔地反映樣本總體的情況,統計中的“平均數”無處不在。然而平均數也具有誤導性,常會掩蓋原始數據的信息,還會受到極端值的巨大影響。比如在中小學裏,班級平均分往往會因為一兩名不及格的學生而大幅下滑,因此總有老師會憤懣地説:“真是一顆壞小豆,毀了一鍋粥”。再比如,在各種體育、文藝比賽中,往往會“減去一個最高分、再減去一個最低分”,這也是因為將少數異常值去掉後計算出的平均值具有更好的代表性與穩定性。

  “僅靠平均數不能反映一組數據間有多大差異。平均數通常需要與標準偏差結合起來報告或考察,才能得出相對全面的分佈描述。”金兼斌認為,人們對統計數據産生誤讀或誤解,往往是因為有關部門發佈這些調查數據時,只報告了平均數,而沒有解釋相關指標的分佈差異情況。“那些與平均數水平差別較大的民眾,會覺得調查結果與他們實際感受有出入,進而認為數據有問題。”

  實際上,統計是無限接近現實,卻不能代替現實,很多統計數據只能反映宏觀趨勢的變化,不適合作為個體選擇的參考。比如,統計部門公佈的商品住房銷售均價、銷售額與銷售面積,在研究一個區域的經濟、産業走勢上的作用突出,對單一購房者,這種“均價”在判斷房價走勢、決定是否該買房等方面,沒有太多參考價值。

  哪些調查的“百分比”不可信?

  樣本容量小、抽樣不科學,一些街邊問卷與網上調查的結果不可偏聽偏信

  “89.3%的人坦言物價上漲影響生活”、“一半人認為房屋單位售價在5000元以下最能接受”……每天電視、報紙、網絡都在刊登著各種調查機構的調查結果,這些聳動視聽的“百分比”調查結果真的反映了現實情況嗎?

  張小姐曾經供職于北京一家小型的信息諮詢公司。她接到的第一份工作就是問卷調查都市人群的牙齒保健行為。但令她不解的是,公司並沒有採取嚴格的抽樣方法,而是讓員工和臨時志願者去城市商圈、地鐵站等處,臨時找人填寫問卷。而且問卷中的一些問題,受訪人可能不會真實回答。“比如您現在存在哪些口腔問題,我想不會有人主動選擇口臭一項。而且上班時間逛商場的人群是否就能代表這個都市的基本面,我也很懷疑。”

  金兼斌認為,統計數字誤導最常見來自抽樣問題。抽樣調查首先要保證一定的樣本容量。另一方面,樣本能很好地代表總體,避免調查受到社會傾向的影響。“例如,恐怕很少有人願意填寫問卷承認自己歧視農民工,但實際言行顯然是另一回事。”

  不僅是街頭問卷調查,很多所謂的網上民意調查的結果也值得商榷。例如今年8月,中國青年報社會調查中心的一項網絡調查顯示,83.2%的受訪者確認現在社會謠言很多,其中34.4%的人表示“非常多”。大量媒體據此撰文“八成民眾認為現在社會謠言很多”。實際上,該調查是僅對1714人進行的在線調查,而且參與者最可能是上述網站的常客以及曾經歷過該話題的人群。媒體的結論顯然有以偏概全之嫌。

  網絡調查是一種計算機輔助的信函訪問方式。通過電子郵件和互聯網頁面,被調查者可以輕鬆而不受拘束地完成調查,提高了調查的便捷性。但網絡調查不能實現人口全覆蓋,且受到虛擬匿名等局限,真實性很難鑒別。

  “目前很多網上調查,包括一些調查機構發佈的調查,有時從抽樣方案上看是一個非概率調查,樣本對總體沒有代表性。對於誰有資格參加調查不加設計和篩選,得到的樣本不管多大,都屬於方便樣本,調查所得到的意見和看法,只能反映調查參加者這部分人群的意見和看法。”金兼斌説,“因此這樣的調查結果是不可以推廣應用到樣本以外的人群的;但從對結果的解釋和得出的結論上,這些調查又恰恰試圖去作過分的推廣或推論。”

  如今,在日常社會生活中,特別是描述經濟增長、宣傳商品價值乃至吸引眼球時,“百分數”也常常被濫用,以掩蓋樣本容量過小的事實。比如,廣告中常常出現“80%的測試人員”一致認可某種牙膏、某種咖啡的質量,而參加測試的人員可能只有5個人。再比如河南某媒體報道“九成家長願孩子當班幹部、近半孩子不願當班幹部”,這一調查結果被廣為傳播,但其實只調查了30個孩子及家長。

  “百分數不僅被當作催人入眠的安眠藥,還被用做使人激動不已的興奮劑。正如一架望遠鏡,如果人們沒有正確地使用,那麼,它既可以把小東西變成大東西,也可以把大東西變成小東西。”德國學者瓦爾特克萊默在《統計數據的真相》一書中這樣表述,“濫用百分數往往只有一個目的:用百分數比例來隱藏基礎數據。因此公眾應盡可能關注基礎數據,規避百分數的欺騙性。”

  為什麼統計數據會打架?

  統計方法不同以及行政干預會導致數據打架,這提示統計制度及其方法改革的必要性

  2007年4月,北京市國土資源和房屋管理局發佈該市一手房的銷售均價每平方米環比下降400元,幾天后,當地統計部門公佈新建商品住房售價環比上漲1.2%。

  同一指標,為何統計數據差距如此之大?

  主要還是統計方法不同。前者是以3月份備案的住房銷售總額和銷售面積相除,得出的平均交易價;而後者,考慮到大城市房屋有高中低檔之分,地段差別較大,普通住宅價格相對低但購買者多,豪宅單價高但購買者少,因此對不同房價賦予了不同權重,按加權指數計算。

  除了統計方法,行政干預也是造成數據打架的原因。以備受關注的GDP核算為例:目前,我國GDP核算採取分級獨立核算體制,國家和地方分別核算GDP。為什麼近5年每年各地公佈的GDP匯總數據,都會高於全國呢?除了重復統計等因素外,也不排除某些地方GDP虛報。因為目前GDP核算還牽扯到政績考核,因此存在地區GDP核算易受地方干預等弊端。

  為避免數據打架,提高統計數據質量和公信力,我國統計制度方法改革勢在必行。今年起,國家統計局開始推進統計改革,建立統一的基本單位名錄、統一的一套表調查制度、統一的數據採集處理軟體平臺和統一的聯網直報系統,最終將實現各級統計機構在線同步接收、審核和共享原始數據,確保數據的真實準確、完整及時。

  “無論是調查研究機構還是媒體,從關鍵概念的測量、抽樣的設計、樣本量的要求、數據的採集,到數據的分析、結果的解讀,都應該遵循基本的科學性原則。只有這樣,調查結果才是可信、有效的;也只有通過紮實、科學的研究與解讀,才能逐漸建立其社會公信力。”金兼斌説。

責任編輯:邢斯馨

熱詞:

  • 平均數
  • 房價走勢
  • 百分數