630 likes | 957 Views
別讓數字騙了你 --- 由統計觀點來看賽制中的排名. 李 美 賢. Outline and Motivation. There are three kinds of lies: lies, damned lies, and statistics. — Benjamin Disraeli. 統計學的目的就是從數據中尋找訊息。 這個數據,是具有「上下文」的數據,配合著上下文,就可以和常識銜接上、也可以輔助我們做判斷 統計數字都是人創造出來的 數字會說話、也會說謊 數據的產生 — Garbage in garbage out.
E N D
別讓數字騙了你---由統計觀點來看賽制中的排名別讓數字騙了你---由統計觀點來看賽制中的排名 李 美 賢
Outline and Motivation • There are three kinds of lies: lies, damned lies, and statistics. — Benjamin Disraeli. • 統計學的目的就是從數據中尋找訊息。 • 這個數據,是具有「上下文」的數據,配合著上下文,就可以和常識銜接上、也可以輔助我們做判斷 • 統計數字都是人創造出來的 • 數字會說話、也會說謊 • 數據的產生— Garbage in garbage out. • 數據的量度與整合 — 百分比、平均、中位數、統計圖表 • 由數據做推論 —如何分辨?
巧合?!需要嘖嘖稱奇嗎? • 是巧合?還是常理? • 大型醫院的太平間都是在最底層 • 電梯急墜到最底層會剛好停在太平間那個樓層的機率是? • 大家來找碴 • 聯合報新聞:「電梯從廿一樓墜落到地下四樓,總共花了十秒鐘。為避免禁忌,醫院通常略去四樓樓層,因此電梯從廿一樓急速下墜到地下四樓,實際是急墜廿四層樓,而非廿五層樓。」 • 二十一樓到一樓隔了二十層樓的高度,再扣掉四樓的話是「十九層樓」的高度,地上十九層加上地下四層共「二十三層樓」,不是「二十四層樓」。 • 記者,請加油,好嗎?
數據的產生 • 在第二次世界大戰的時候,聯軍請美國哥倫比亞大學的統計學家沃爾德(Abraham Wald)協助改善機體,因為當時的飛機只能部份加強機體。而沃爾德教授在統計了許多飛機後,發現飛機最容易中彈的是機翼,而最少被擊中的是飛行員的座艙跟機尾。後來他的報告出來後,作戰指揮官說:「根據這份報告,我們應該加強機翼的裝甲。」,但是沃爾德卻持相反的意見:「我所分析的樣本只有順利返回基地的飛機。從統計的觀點來看,我認為機翼被擊中的飛機,似乎還是能安全返航。而飛行員座艙跟機尾中彈少的原因是因為一中彈就很難安全返航。」於是兩派意見堅持不下,後來皇家空軍採用沃爾德的建議,結果真的大大降低飛機被擊落的比例。後來英國軍方用敵後工作人員,蒐集了部份墜毀在德國境內的聯軍飛軍,發現大部份都是在駕駛艙跟機尾中彈。
數據的產生 • Call in 節目 • 支持馬英九還是謝長廷? • 相信TVBS還是三立的民調? • 某些新聞台/電台的特定族群比重太重、某些族群的比重太輕 • 問卷回覆 • XX家庭問題的專欄作家詢問讀者:「如果可以重來一次,妳還要生小孩嗎?」 • 近千份的讀者回覆信中,接近70%都說:「不要」 • 70%的父母都後悔有了小孩嗎? • 自發性回應樣本 / 方便樣本 →特定族群且對議題有強烈感覺的人 →高度偏差的樣本 • 對於整個人口來說,這些人並不構成具有代表性的樣本。
菜英文 • 台灣英文落後 日本、韓國、 泰國、越南; 贏過中國大陸。
菜英文 • 台灣英文輸給 中國大陸、 韓國、香港; 贏了日本、蒙古 、北韓、越南等國
菜英文 • 托福與IELTS都是自願受測的考試 • 用自願受測的成績推論各國英文能力高低,至少需要知道各國參加測驗的人數,佔該國人口的比例,考試族群為何,是否為英語系國家,這樣才具有可比較性。 • 2005年9月至2006年12月之間,台灣參加托福考試的人數有10022人,占25-29歲人口的0.5048%,受測比例排名第二,僅低於南韓。 • 平均分數排名第一且英語為第一語言的新加坡,受測者只有144人,只佔25-29人口的0.0420%,比例上不到台灣的十分之一。 • 托福平均分數前20名的國家中,13個國家的受測者人數都在千人以下,表中的28個國家中,有22個國家的受測人數佔人口比例低於0.1%。 • 很多國家可能只有菁英能留學,只有菁英才會去考托福;台灣是很多大學硬性要求要考托福,所以平均成績會比只有極少數人能出國的國家差。 • 大學生變多之後,大學生的「平均分數」會下降,英文程度相同的兩個國家,考托福人數較多的國家,平均分數也有可能會比較低。
菜英文 • IELTS平均分數與應考比例趨勢圖。 • 左高右低的趨勢線顯示:應考比例越高、平均分數越低 • 位於趨勢線上方,離趨勢線越遠,代表英文越強,反之則越弱。 • 觀察到,趨勢線上方幾乎是被英美殖民過的國家;下方幾乎為母語非英文的國家。 • 台灣非常靠近趨勢線,台灣的英文能力在母語非英文的國家中贏過日本、阿聯、泰國、越南、尼泊爾跟大陸。 • 測驗的平均成績不能直接代表該國的語言能力
數據會唬人---百分比不當的使用和比較 • 1995年XX期刊:「美國自從1950年開始,孩童遭到槍殺的人數,每年增加一倍。」 • 哪裡有問題? • 若1950年有一名孩童遭槍殺,則1951年就有兩名孩童遭槍殺,1952年有4名、1953年有8名…至1960年就有1024名遭到槍殺、1965年有32768名,到1980年總數將超過十億人(為當年度美國總人口數的四倍);1995年此文章發表時,當年受害的人數將高達三十五兆人(已超出地球經推算最多能容納的人類數1100億) • 事實上是--- • 1994年,兒童保護基金會:「自從1950年以來,每年美國孩童遭到槍殺的數目,至今已增加了一倍。」 • 這段期間內美國總人口數增加了百分之七十三。
數據會唬人---容易使人誤解的數據 (百分比) • 幾十年前,約翰霍浦金斯打破傳統,允許女學生進入大學,過不久,傳出此校有33.33%的女學生與教授結婚。 • 事實上是:當年僅有三位女生註冊,其中一位與教授結婚。 • 某小鎮殺人案件比去年增加 60% • 事實上是:去年殺人案件為五件、今年增加到八件---60%的增加 • 為何造成誤解?比較的基準選擇不當! • 面對過度簡化的數據 →數據如何製造?
數據會唬人---容易使人誤解的數據 (百分比) • 誰製造了統計數字? • 統計數字的製造目的為何? • 統計數字的製造過程為何? • 以兒童保護基金會的統計數字為例: • 數字的來源為何?是誰在計算孩童的槍殺死亡人數?如何計算?「孩童」的定義為何?「槍殺死亡」指的又是什麼?自殺?意外?他殺? • 如果討論的只有受害的孩童,精確的統計應該控制兩個年度相對的孩童人數。同時,也要確定計算孩童遭到槍殺人數的方式,此外,也要確定在兩個時間點統計方式是否相同。
數據會唬人---容易使人誤解的數據 (平均) • XX職業籃球隊12位球員的平均年薪為六十萬美元。 五位球員的年薪是二十萬美元, 六位球員年薪是五十萬美元, 一位超級巨星是三百二十萬美元。 • 中位數:五十萬美元。 (一半的觀測值比中位數小、另一半比中位數大) • 眾數:五十萬美元 (觀測值中出現最頻繁的數字)
數據會唬人---容易使人誤解的數據 (平均) • 某公司宣稱:「生產部門員工每小時平均薪資為225元」 • 事實上是:平常上班每小時150元、加班每小時225元,假日加班 每小時300元,平均工資每小時為:(150+225+300) ÷ 3=225 • 平常加班、假日加班的時數和正常上班的時數不一樣多,可以這樣算嗎? • 公司裡的一位主管和兩位員工,同時各調薪5%、10%和15%,所以這一次調薪的平均為: (5+10+15) ÷3=10 (%),對嗎? • 事實上是:這三人的薪水各為100000, 20000, 和10000 (合計130000元),加薪後成為105000, 22000, 11500 (合計138500元),所以調薪幅度應為: [(138500-130000) ÷130000] ×100% = 6.5% • 計算平均數時,需還原成實際數字再計算。
奇怪的數據 • Journal of Experimental Medicine 醫學實驗期刊 有六組老鼠,每組老鼠各20隻,實驗成功的比率為: • 奇怪在哪裡? • 數據與常理是否一致? • 過份精確?太有規律? → 偽造的數據
因果推論 • 2004年「美國臨床營養期刊」指出:一個人若每天喝超過一杯以上的咖啡,則罹患心臟病的機會,將會比別人高許多。 • 事實上是:研究人員找來近3000名身體健康、且沒有心血管疾病的成人,讓他們填寫問卷,看他們每天喝多少咖啡,同時抽取血液樣本,查看其發炎因子含量的高低」 • 根據目前的研究已知:當發炎因子多的時候,體內的血液循環系統會有問題。 • 因此推論:咖啡喝得越多、對心臟越不好。 • 邏輯上的問題 • 咖啡喝得多,血液中發炎因子含量高,兩者呈現正相關。 • 咖啡喝多「導致」發炎因子含量偏高? • 會不會是咖啡喝多的人,有某些共同的特質,如:熬夜、加班、壓力大、飲食睡眠不正常,而導致發炎因子偏高?
因果推論 • 經由蒐集資料發現:一個國家電視機的數目,和這個國家人民的平均壽命有關;電視機多的國家,平均壽命越高。 • 電視機的多寡和平均壽命的長短,存在正相關。 • 電視機多,所以「使得」人民的平均壽命變高? • 很有可能是:一個國家有錢,所以電視機多,因此人民生活品質好,醫療進步,因此容易長命。
M型社會 • 商業週刊第986期封面故事:M型社會來了— 2006.10.16 「歡迎來到新世界!」這是日本趨勢專家大前研一最近送給台灣人的一句話;你別再以為,只要咬牙忍一忍,好日子還會回來,你可能已經從中產階級淪落到「下層社會」而不自知
M型社會 • 代表富裕與安定的中產階級,目前正快速消失中,其中大部分向下沈淪為中、下階級,導致各國人口的生活方式,從倒U型轉變為M型社會。 大前研一斷言: 「台灣社會已經出現日本當初的徵兆,成為M型社會!」
M型社會 • 所謂的M型社會,指的是在全球化的趨勢下,富者在數位世界中,大賺全世界的錢,財富快速攀升;另一方面,隨著資源重新分配,中產階級因失去競爭力,而淪落到中下階層,整個社會的財富分配,在中間這塊,忽然有了很大的缺口,跟「M」的字型一樣,整個世界分成了三塊,左邊的窮人變多,右邊的富人也變多,但是中間這塊,就忽然陷下去,然後不見了。 —摘自商業週刊
哪有什麼都是M型 • M是一個分佈 • 「M型」的分布代表資料已經違反了「常態分布」的兩邊較低、中間高的山形,成為異常的M型。 • M型社會指的不是單純的貧富差異,而是「中產階級的消失」,因此,只要「中間的族群還是一大塊」,則不具備M型分佈的基本要件。 • 「M型」不等於「不均」,M型應該是「不均」的「極端化」 • 找到兩個極端值≠M型;常態分配下的極端值≠M型 • 光是極端現象,是呈現不出「M型」的分佈狀態,
M型社會?M型新聞產生器! • 治攝護腺肥大也M型化 有人用雷射 有人導尿DIY 【自由時報╱記者徐夏蓮/台中報導】 2008-10-03 06:00 銀髮族也嚴重「M型化」!一樣是攝護腺肥大、尿不出來,有人採用自費需16萬元的綠光雷射治療,導尿管只要插置半天或隔天就可移除,順利自行排尿;但是也有修腳踏車師傅竟然就地取材、拿根管子當導尿管,自己導尿DIY,奇怪的是,竟也導尿成功,連醫師都喊:「佩服!」 不過這名修車師傅後來也不堪長期自行導尿之苦而就醫治療。 中國醫藥大學附設醫院泌尿部主任張兆祥昨天指出,該院2年前引進綠光雷射,迄今已有一百廿多例採用,從中也可看出現今社會呈現M型化,在銀髮族間尤甚。 張兆祥醫師也曾診治一名攝護腺肥大的修理腳踏車老師傅,抱怨常常尿不出來,以致得導尿。他都是就地取材自己DIY,用的導尿管竟是修理腳踏車常用來打氣的小管子,並沒人幫他,長期下來也很吃不消,決定接受健保有給付的經尿道攝護腺刮除術治療。 不過這也是張兆祥醫師見過的唯一特例。
M型社會?M型新聞產生器! • 化妝品搞M型 愈貴賣愈好 【聯合報╱記者徐文玲/台北報導】2008.10.07 04:02 am 經濟不景氣,化妝品的M型化越來越明顯,金字塔頂端的貴婦品牌或系列,今年一至九月業績較去年同期成長一至兩位數字,相對於衰退的中價位品牌,頂級表現搶眼,嬌蘭、海洋拉娜、la prairie、DARPHIN新品趁勝追擊 。 嬌蘭傳媒經理李凌玲表示,頂級系列從一月至今成長20%、la prairie行銷經理潘逸文也說,品牌今年比去年有近10%成長。推測原因,貴婦較不受景氣影響,出手依然大方。
M型社會?M型新聞產生器! • 消費市場M型化 13萬元大衣熱賣 【經濟日報╱記者陳翌函/台北報導】 2008.09.28 02:35 am 台灣消費市場的M型化日趨嚴重,訂購一件MaxMara近13萬元的限量款大衣、一套10幾萬GIEVES & HAWKES的客製化西裝,客人依舊趨之若鶩。 義大利時尚品牌MaxMara的秋冬大衣全球知名,十年前的編號101801的經典款大衣,已銷出15萬件。代理該品牌的華敦國際廣告推廣經理高方莉指出,今年推出編號101 88的限量大衣款,全球限量888件,台灣僅分配到45件,一件售價128,600元。日前才上市銷售,就已賣出一半。
M型社會?M型新聞產生器! • 病房M型化 5星級1晚萬元 【聯合晚報╱記者李樹人、林進修/台北報導 】 2008.10.01 02:59 pm 三軍總醫院的單人病房每人每天需自付差額3500元病房費,雙人病房為1500元,而台北榮民總醫院單人病房費用差不多要三千多元,雙人病床為1800元。至於台大醫院的收費標準較為複雜,最貴的單人房一晚得需自費差額7000元;最便宜的單人房則只要2080元,雙人房則要自費1600元。 最貴的病房則出現在振興醫院,設備媲美五星級飯店的病房一個晚上費用得 要一萬元;台安醫院單人特等病房是6000 元,單人病房4650元,雙人病房是2000元。
台灣真的那麼M嗎?M在哪裡? • M如何畫出來? • M型社會:所得分佈呈現雙峰型態 • x軸代表有錢的程度,y軸是人數,M型是指窮人跟有錢人很多,中間的人很少,所以會畫出一個M 。 • 有錢的程度如何衡量? • 採用行政院主計處的資料: 「一個家庭的可支配所得」,也就是一家一年扣掉稅收之後的收入 。
台灣真的那麼M嗎?M在哪裡? • M如何畫出來? • M型社會:所得分佈呈現雙峰型態 • x軸代表有錢的程度,y軸是人數,M型是指窮人跟有錢人很多,中間的人很少,所以會畫出一個M 。 • 有錢的程度如何衡量? • 採用行政院主計處的資料: 「一個家庭的可支配所得」,也就是一家一年扣掉稅收之後的收入 。 • 收入變多就代表變有錢嗎?不一定,還要看物價。 • 為了去掉物價變動的因素,將年收入除以台灣地區的消費者物價指數,來代表實際的有錢狀況。
台灣真的那麼M嗎?M在哪裡? • 大前研一「M型社會」: 縱軸表各所得組別家戶數 佔總戶數百分比, 橫軸表各所得組別。
加工的M型 • 一個班級的成績分布如下:
加工的M型 • 經由擠壓…
選舉理論 • 假如 15 位同學負責籌辦一場同樂會,因為經費和人力的限制,他們決定只提供一種冰飲。至於要提供哪一種,則有三種意見僵持不下:冰紅茶 (用 T 表示)、啤酒 (用 B 表示) 還是雞尾酒 (用 C 表示)。於是他們決定要用最民主的方式解決紛爭:不記名投票。大家不假思索地舉行了最常見的選舉模式:一人一票、投給自己認為最適當的飲料、以獲得最高票數的飲料獲勝。開票的結果是 T:B:C = 6:5:4,冰紅茶獲勝。 摘自單維彰 [選舉的數學理論]
選舉理論 • 可是,有人說:「畢竟有 9 個人不喜歡冰紅茶啊」。 • 有人提議說他聽說過另一種投票方法,比較『公平』,那就是所謂的「兩輪制」:把第一輪投票結果中最好的兩名取出來,所有人對這兩個候選飲料再投一次票。如果能夠幫助大家和和氣氣地達成共識,再投一次票也無妨,於是他們就做了。第二輪的投票結果,竟然就是 B:T = 9:6,啤酒獲勝。 • 這樣的結果真的解決歧見了嗎? • 喜歡喝茶的人一票也沒有動搖,但是那些失去了雞尾酒選項的人全部改去支持啤酒了 摘自單維彰 [選舉的數學理論]
選舉理論 • 又有一個人提議,請大家拋棄成見,再來一次。這一次,他提議一個「最科學」的作法:請每個人給每種飲料一個分數,最喜歡的給兩分,次喜歡的給一分,不喜歡的不給分。然後計算每種飲料得到的分數總和,最高分的飲料獲勝。這聽起來畢竟是一個新奇的作法,雖然大家意興闌珊,還是勉強同意了。 • 15 個人很小心地在選票上填寫了分數,計算的結果是 C:B:T = 19:14:12,雞尾酒獲勝。 • 有人哀號「怎麼會三次結果都不一樣?」 摘自單維彰 [選舉的數學理論]
選舉理論 • 為什麼三次投票得到三種結果?是有人搞鬼嗎?有一些人要和另外一些人作對嗎? • 可能這並不是那 15 個人的錯,而是不同的選舉程序會造成不同的結果。 • 究竟有沒有最『公道』的選舉程序?回答這個問題之前,當然要先討論:什麼叫做『公道』? • 15個同學心目中對於 選擇對象的優先順序
圍棋的賽制 • 瑞士賽程編排 • 第一場編排方式:1號對2號、3號對4號、以此類推,若遇奇數個人參加比賽,則安排最後一號輪空。 • 第二場以後之各場編排原則: A. 先排最多勝者,以戰績相同者依序由前面號碼往後配對。 B. 已對過的對手不再配對 C. 若遇戰績相同,有一位無法有相同戰績者配對,則需由最前面號碼 中戰績多一敗者排出配對。 D. 不同戰績配對以一次為限。 • 瑞士制成績計算方式: • 主分:勝的場數和 • 主分高者排名在前,主分若相同則依以下之輔分順序排名 • 第一輔分:為所有交戰對手之主分和 • 第二輔分:負的對手之輔分和 • 第三輔分:彼此交戰之成績 • 若第三輔分仍無法排名時,則並列名次,若名次無法並列的話,則加賽快棋或以抽籤方式決定之。
圍棋的賽制 • 以32人比賽5場為例: 五勝1人、四勝5人、三勝10人、二勝10人、一勝5人、零勝1人 • 若有32人參加比賽,A為參賽者中最強的,B為第二位。 很不幸地,第一場比賽B就遇到A,且B敗北。 第二場B與另一個零勝一敗的對手交戰,B勝。 第三場B與另一個兩勝一負的對手交戰,B勝。 第四場B與另一個三勝一負的對手交戰,B勝。 第五場B與另一個四勝一負的對手交戰,B勝。 • A則是五戰全勝,獲得冠軍。