民意調查之統計資料,該如何解讀? - 科學月刊

文章推薦指數: 80 %
投票人數:10人

當我們搜集了大量的問卷調查,這個統計資料該如何被解讀呢? ... 由平均值與中位數的相對位置來看,可以發現平均值較易受到極端值,也就是最高金額12 ... 網頁 首頁 科學月刊/科技報導新網站 科學月刊粉絲專頁 2017年6月26日 民意調查之統計資料,該如何解讀? 作者/林珮婷,政治大學選舉研究中心博士後研究員,政治大學政治學博士。

主要研究領域為民意調查、性別政治、選舉與投票行為。

作者/賴以威,國立師範大學電機系助理教授。

數字會說話,但這些民調數字到底說了什麼話?當我們搜集了大量的問卷調查,這個統計資料該如何被解讀呢?其實,資料解讀與詮釋的簡單原則就是把樣本特性說明清楚,不然就像瞎子摸象。

就算不知道分析的對象是誰,也要說明清楚調查目的與可能的限制,再來談資料詮釋才有意義。

因此,要解讀資料,我們可以先從資料長什麼樣子來觀察。

資料長什麼樣子? 要描繪資料的樣貌,我們可以從中心點在哪以及分布狀況如何,這兩個層面來回答。

為了方便讓讀者了解,這裡我們用「數感實驗室(NumeracyLab)」在2017年初所做的「孝敬父母的紅包大調查」,以受訪者的年收入與年紀來討論「給父母的紅包金額」的有趣分析當例子。

討論之前,我們必須先提醒讀者,「民意調查是怎麼做的?」對於統計分析結果的正確性影響很大,譬如誰是「紅包大調查」受訪者?由於這個調查是直接發布在臉書的粉絲頁,主動填寫問卷的人除了本身就具有數感實驗室的「粉絲」特徵(可能是喜歡數學的人、重視小孩教育的父母、喜歡數感小編的寫作風格等)之外,可能還具有某些特質,比如說也許是覺得自己包的比較多或是收入比較高的人傾向願意填寫,造成最後的結果可能會有略為高估的情形。

簡單來說,這些自願送上門來的受訪者或是在路上隨意發問卷來的受訪者,都屬於非隨機抽樣,因為不知道他們與我們實際感興趣的那個群體所有人(母體)的差異,因此只能針對被調查的這群人進行描述性的說明,而不能進行推論。

這個資料庫大家不會太認真討論正確性,但是可當作一個例子讓大家了解如何解讀資料。

中心點在哪? 「紅包大調查」由於是網路自填問卷,主動填答的受訪者只能代表他們自己,而由資料中我們可以知道有效的259個受訪者的性別、年齡、家庭收入和雙親紅包總和,並針對這些受訪者來討論紅包金額平均多少?是否大家都差不多、還是有些人特別多或特別少?這時候,「平均數」就是一個很方便檢視資料樣態的工具。

平均數大家都相當的熟悉,是所有觀察值的總和除以個案數,也可以被視為一組資料的中心點。

如紅包區間圖所示,我們可以很快速的知道這259個受訪者包給父母的紅包平均金額為17000元,大多數集中在0~2萬元之間。

另一個與中心點相關的概念是中位數,也就是將所有受訪者依紅包金額高低排序後,最中間那一位的金額,在這筆資料中第130位受訪者的金額是12000元。

由平均值與中位數的相對位置來看,可以發現平均值較易受到極端值,也就是最高金額12萬的影響,導致大部分受訪者所包的紅包金額低於平均值。

這例子也顯示雖然由平均數來看中心點相當便利,卻不見得每一次都是最適合的工具。

政府單位公布的薪資調查資料也有相似的情形,公布的平均薪資與民眾感受有相當大的落差,而相對較低的中位數反而更貼近民眾所感受到的薪資水平,這反映了我國薪資的整體分布實際上是往低薪的一端傾斜,在這種情況下以中位數來看薪資會比平均數更有意義。

資料的分布狀況? 在知道資料的中心點後,另一個要問的是:資料的分布呈現什麼樣子?若用於民眾態度的調查,就是民意是集中的還是分散的呢?這個問題可以交給標準差(standarddeviation)來回答。

標準差是指資料中各點與中心點的「標準距離」,以定義來說,是各點與中心點的距離(相減後的差)平方後累加起來取平均數,再開根號還原。

標準差反映的是資料中各點之間的離散程度,當資料越集中,各點與中心點的距離越近,標準差越小,反之,資料越分散,各點與中心點的距離越遠,標準差就越大。

在檢視資料時,了解離散程度非常重要,原因在於:擁有同樣中心點的兩筆資料,可能有完全不同的分布情形。

當民調資料只看平均數而不管離散程度時,很容易做出錯誤的解讀。

以縣市首長的施政滿意度調查為例,若各請100位受訪者以0~100來表示對縣市首長的施政滿意程度,假設A、B兩縣縣長的滿意度平均數皆為75.06,但A縣是大多數受訪者的滿意度集中在75上下,則標準差小(2.936),而B縣受訪者的滿意度分散於50~100之間,則標準差大(9.608)。

兩縣接受調查的民眾看似都對縣長施政傾向滿意,但由離散程度來看,B縣必須特別注意極端意見的民眾,避免在某些情況下出現高強度的反彈,造成施政的困難。

樣本與母體長的不一樣怎麼辦?我們要怎麼推論? 只要不是普查,抽取出來的樣本一定會與你感興趣的母體之間有落差。

因此,在解讀時必須特別注意「抽樣誤差」的存在。

若是非機率抽樣,我們不清楚這些人的特性與母體之間的落差,因此僅能就有回答的這些人做結果的說明與闡述,不能推論到所有的人。

若是再進一步推論,所做出來的詮釋一點根據也沒有,萬萬不可相信。

我們經常在媒體上看到很嚇人的民調數字,比如說:「一例一休後,3成上班族薪資縮水一成!」。

這些數字怎麼來的?真的可以這樣子推估嗎?以104人力銀行的資訊科技針對求職會員進行「一例一休影響」問卷調查為例,這些求職會員通常具有某種同質性,也許是對於現在的薪資不滿想轉換跑道,也許是剛開始找工作的新鮮人,有著各種的可能性,總之並非隨機抽樣,這些同質性可能造成調查結果的偏誤。

因此調查結果「已有30%上班族因公司管控加班、少賺加班費,導致實質薪水變少,平均減少幅度11.3%」,只能說明這群受訪者的情形,並不適合用來推估所有臺灣的上班族。

即便是隨機抽樣,僅用少數抽取到的樣本觀察值來推估母體被稱為「點估計」,是不可能精準的。

就像是在校門口隨意抽取50個學生量完身高算出平均(樣本平均數)後,就想要命中這間學校全體學生的平均身高(母體平均數),是幾乎不可能的事。

......【更多內容請閱讀科學月刊第571期】 於 17:17 張貼者 科學月刊/科技報導 分類: 04-數學, 07月號(571期)-資料科學 較新的文章 較舊的文章 首頁 593期內頁試閱! 站內搜尋 科月檔案櫃 科月檔案櫃 六月2019(1) 五月2019(1) 四月2019(23) 三月2019(22) 二月2019(25) 一月2019(23) 十二月2018(27) 十一月2018(24) 十月2018(24) 九月2018(22) 八月2018(24) 七月2018(25) 六月2018(23) 五月2018(22) 四月2018(26) 三月2018(18) 二月2018(21) 一月2018(25) 十二月2017(23) 十一月2017(25) 十月2017(21) 九月2017(23) 八月2017(24) 七月2017(26) 六月2017(41) 五月2017(1) 四月2017(24) 三月2017(24) 二月2017(24) 一月2017(28) 十二月2016(12) 十一月2016(23) 十月2016(30) 九月2016(21) 八月2016(38) 七月2016(27) 六月2016(2) 五月2016(39) 四月2016(16) 三月2016(21) 二月2016(25) 一月2016(22) 十二月2015(22) 十一月2015(19) 十月2015(19) 九月2015(24) 八月2015(18) 七月2015(22) 六月2015(3) 五月2015(37) 四月2015(20) 三月2015(22) 二月2015(22) 一月2015(8) 十二月2014(37) 十一月2014(19) 十月2014(1) 九月2014(27) 八月2014(16) 七月2014(17) 六月2014(20) 五月2014(19) 四月2014(17) 三月2014(37) 二月2014(1) 一月2014(32) 十二月2013(16) 十一月2013(21) 十月2013(21) 九月2013(20) 八月2013(20) 七月2013(19) 六月2013(19) 五月2013(19) 四月2013(19) 三月2013(14) 二月2013(1) 一月2013(1) 十二月2012(2) 十一月2012(2) 十月2012(2) 九月2012(1) 八月2012(5) 六月2012(2) 五月2012(1) 四月2012(1) 三月2012(1) 二月2012(1) 十二月2011(19) 九月2011(2) 八月2011(7) 七月2011(8) 六月2011(1) 五月2011(13) 四月2011(25) 三月2011(2) 二月2011(2) 一月2011(9) 十二月2010(19) 十一月2010(21) 十月2010(27) 九月2010(21) 八月2010(19) 七月2010(23) 六月2010(20) 五月2010(30) 四月2010(17) 三月2010(24) 二月2010(20) 一月2010(14) 十二月2009(18) 十一月2009(24) 十月2009(15) 九月2009(27) 八月2009(27) 七月2009(24) 六月2009(23) 五月2009(24) 四月2009(15) 三月2009(18) 二月2009(23) 一月2009(21) 十二月2008(17) 十一月2008(2) 十月2008(1) 九月2008(2) 八月2008(1) 七月2008(1) 六月2008(3) 十二月2002(1) 十二月2000(1) 一月1977(1) 文章分類 00-專輯目錄 01-科學評論 02-科學新聞 03-編輯手記 04-數學 05-物理 06-生物 07-化學 08-地科 09-光譜 10-生化 11-科教 12-科技 13-科學史 14-專訪 15-書評 16-閱讀推薦 17-活動 18-大家談 19-勘誤 20-其它 21-非‧關科學 22-回顧 2019專輯 01月號(589期)-啟動心智秘境 02月號(590)-豬的時代 03月號(591期)-臺灣古生物 04月號(592期)-高樓.映像 05月號(593期)-伴.毛小孩 2018專輯 01月號(577期)-氣象預報 02月號(578)-重力波 03月號(579期)-生物辨識 04月號(580期)-AI人工智慧時代來臨 05月號(581)-看見聲音的景色 06月號(582期)-滋容養顏兩三事 07月號(583期)-藥品包裝 08月號(584期)-食蟲 09月號(585期)-大麻 10月號(586期)-科幻 11月號(587期)-啤酒生活 12月號(588期)-諾貝爾獎特別報導 2017專輯 01月號(565期)-薄膜分離技術 02月號(566)-錄音工程 03月號(567期)-電影技術 04月號(568)-描繪世界的方法 05月號(569)-不只是科學少數女性關鍵力 06月號(570期)-南海科學 07月號(571期)-資料科學 08月號(572期)-蝦 09月號(573期)-藻礁 10月號(574期)-音樂心理 11月號(575期)-區塊鍊與比特幣 12月號(576期)-諾貝爾獎特別報導 2016專輯 01月號(553期)-幾丁質大革命 02月號(554期)-綠色溶劑 03月號(555期)-實驗動物 04月號(556期)-氣象觀測 05月號(557期)-福衛五號上陣 06月號(558期)-生物大數據 07月號(559期)-直擊大腦的神祕宇宙! 08月號(560期)-新世代女科青 09月號(561期-)基因開關 10月號(562期)-地震新情報 11月號(563期)-真實生物X寶可夢 12月號(564期)-諾貝爾獎特別報導 2015專輯 01月號(541期)-法布爾的昆蟲世界 02月號(542期)-森林新思維 03月號(543期)-影像世界中的巧妙數學 04月號(544期)-濕地大探索 05月號(545期)-光科學年代 06月號(546期)-全球暖化海洋遇難 07月號(547期)-重返土壤 08月號(548期)-廣義相對論百年 09月號(549期)-癌症免疫療法 10月號(550期)-莫斯利與原子序 11月號(551期)-布爾代數 12月號(552期)-諾貝爾獎特別報導 2014專輯 01月號(529期)-再生醫學 02月號(530期)-汽車科技 03月號(531期)-臺灣的科學傳播:現在和未來 04月號(532期)-產能與節能的新觀念 05月號(533期)-科學、數學,動手玩 06月號(534期)-物聯網 07月號(535期)-鑑識科學 08月號(536期)-微機電系統的應用 09月號(537期)-張昭鼎紀念研討會:網路與科普 10月號(538期)-意猶未盡的急速:4G 11月號(539期)-結晶學百年解密 12月號(540期)-諾貝爾獎特別報導 facebook 追蹤者 本站流量 網站啟事 於版權問題如有任何疑慮,請洽編輯部。

為尊重著作權,本網站內容請勿任意轉載,若需引用圖文請先與我們連繫。

Google+



請為這篇文章評分?