一本出版有五十年的暢銷統計科普小書,內容還是非常適用,裡面提到的手法至今都還可以常常看到。當看到任何統計數據,一定要有自己獨立思辨的能力,很多東西多注意看一下就可以知道可信度有多少。
1.內建偏差的樣本
最大的誤差來源往往來自於 抽樣過程。例如填問卷時,心理上就會偏向多報或少報,好比問到收入或報稅 (前者多報後者會少報),因為人們會有勢利心理。
樣本是否有代表性? 可否假設樣本成員跟以外的差不多? 例如調查畢業生的平均收入,那些畢業後就窮困潦倒的同學應該不容易(或是不喜歡?)被連絡上吧。只要有可能的誤差來源,就可以輕易毀掉樣本的可靠性,你應該對結果抱持某種程度的存疑。因此,意見調查的作業方式,終究是在對抗各式各樣的誤差來源。
被選來代表母體的樣本常會不公平,可能會偏向比較有錢、教育水準較高、資訊較豐富、比較友善等這些比較容易被訪問到的人。受訪者也會有想要給訪問員喜歡的答案的傾向。
要做手腳不需要刻意操弄調查結果,只要樣本有特定偏的傾向,就已經自動替結果作手腳了。 閱讀全文〈別讓統計數字騙了你〉