650 likes | 719 Views
抽菸會致癌嗎?. 癌症與抽煙與否相關性研究 相關性或因果關係的論戰. 癌症與抽菸的討論. 癌症發生率與是否抽煙的相關性陸續被提出,抽煙是否會致癌引起熱烈討論。 一 九五八年,費雪在 《 百年回顧 》(Centennial Reviews) 上發表一篇題為 〈 香菸、癌症,與統計 〉 的論文,後來又在 《 自然 》(Nature) 期刊上發表兩篇論文,題目分別是 〈 肺癌與香菸? 〉 及 〈 癌症與抽菸 〉 。 後來他把這些論文蒐集在一起,並寫山一篇內容廣博的前言,發行成一本標題為「抽菸:有關癌症的爭議,及相關證據的分析」的小冊子。.
E N D
抽菸會致癌嗎? 癌症與抽煙與否相關性研究 相關性或因果關係的論戰
癌症與抽菸的討論 • 癌症發生率與是否抽煙的相關性陸續被提出,抽煙是否會致癌引起熱烈討論。 • 一九五八年,費雪在《百年回顧》(Centennial Reviews)上發表一篇題為〈香菸、癌症,與統計〉的論文,後來又在《自然》(Nature)期刊上發表兩篇論文,題目分別是〈肺癌與香菸?〉及〈癌症與抽菸〉。 • 後來他把這些論文蒐集在一起,並寫山一篇內容廣博的前言,發行成一本標題為「抽菸:有關癌症的爭議,及相關證據的分析」的小冊子。
在這些論文裡,費雪(是個老菸槍,照片裡他總是叼著菸斗)堅決主張,那些抽菸會導致肺癌的證據,都是有瑕疵的。在這些論文裡,費雪(是個老菸槍,照片裡他總是叼著菸斗)堅決主張,那些抽菸會導致肺癌的證據,都是有瑕疵的。 • 在當時,連梅育診所(Mayo Clinic)的首席統計學家、也是美國生物界大師的柏克森(Jerzy Berkson)也質疑這些研究的結論。 • 另外 ,尼曼也曾經對類似研究的推論過程,提出反對意見。
老菸槍的堅持 • 費雪的批評最尖銳,但他所堅持的理由只是相關性未必是因果關係,卻沒有正面的駁斥理由。在幾年後,相關證據愈來愈多,柏克森與尼曼似乎對兩者之間的關係不再質疑時,費雪卻仍堅定如昔,甚至還指控某些占有一席之地的研究人員竄改數據,這使多數的統計學家相當難堪。 • 在當時,香菸公司也否認那些研究的有效性,指出研究的結果只是許多「統計上的相關」,但沒有證據能證明抽菸會導致肺癌。
證據的再檢驗 • 一九五九年,康菲爾德與五位分別來自美國癌症學會、美國國家癌症研究所,及史隆凱特林癌症研究所(Sloan-Kettering Institute)的頂尖癌症專家,審查所有已發表的論文,寫成一篇厚達三十頁的論文。
醫學社群的共識 • 他們檢驗了費雪、柏克森與尼曼的反對意見,也檢查了菸草研究所(Tobacco Institute,代表菸草公司的利益)的反對意見,再針對引起爭論的地方,重新提出詳盡的推論,指出所有的證據都壓倒性的支持「抽菸是肺癌當中的表皮樣本癌發生率急遽上升的主要原因」。這篇論文使整個醫學社群,在這件事上面達成共識。
反對意見的凋零 • 雖然菸草研究所仍然在各種通俗的雜誌上刊登全版的廣告,質疑抽菸與肺癌的發生只是統計上的相關,但從一九六○年起,稍有聲譽的科學期刊就沒有文章質疑這項發現。在這之後不到四年,費雪也去世了,沒有辦法繼續抗爭,也沒有別人抱持相同的立場。
費雪反對甚麼? • 到底費雪的反對是真的有道理?還是只是一個想安靜的抽菸斗的老頭無理取鬧? • 費雪反對的理由其實是一個深層的科學問題。 • 醫學社群的共識是如何形成的?這個共識的形成是否對費雪提出的問題提供了解答?
因果關係 邏輯推論
有因果關係這種事嗎? • 這個問題英國哲學家羅素(Bertrand Russell,1872-1970,開創邏輯論)在三○年代早期就已經指出來了,是科學思想的核心疑問,一個很多人甚至都不了解他是問題的問題。 • 這個問題就是:「因果關係」代表的意義究竟是什麼?這個問題的答案絕對很不簡單。
數學原理 • 羅素的第一部重要著作,是和他的老師懷海德(A. N. Whitehead,1861-1947,英國數學家、哲學家)共同撰寫的《數學原理》, 書中論及算術與數學的哲學基礎。在書裡他們企圖把幾個數學概念,如數字與加法,建立在集合論(set theory)會用到的一些簡單公理(axiom)上。在羅素與懷海德合著的這本巨著上,有一項重要工具,也就是符號邏輯(symbolic logic)。
邏輯的發展 • 在十九世紀末至二十世紀初期,集合論與符號邏輯開始發展,上述這些情況也隨之改變。符號邏輯始於一些稱為命題(proposition)的思想元素,羅素與懷海德所利用的 ,也就是這種最早期的形式。 • 每個命題都有一個稱為「T」或「F」的真值,可和一些代表「和」(and)、「或」(or)、「非」(not)、及「等於」(equals)的符號結合與對照。
命題的推論 • 因為每個命題原素都有個真值,他們的任一種組合也會有個真值,這個值可以用一系列的代數步驟計算出來。 • 在這個簡單的基礎上,羅素、懷海德等人就能建立許多符號的組合,並用這些符號組合來描述數字和算術,而且似乎能描述所有類形的推論過程。
實質蘊含 • 為了取代因果的概念,羅素從符號邏中,提出一些定義的很清楚的觀念,即「實質蘊含」(material implication)。使用了原始命題「和」、「或」、「非」、「等於」這類聯結符號之後,我們就可以產生「若命題A,則命題B」的觀念。 • 若天下雨則地濕。 • 逆命題:若地未濕則天未下雨。
疾病傳染源檢驗公設 • 十九世紀末,德國醫師柯霍(Robert Koch,1843-1910)提出一組必要的公設(postulate)用來檢驗特定的疾病是否由某種傳染源引起。 • 這組必要公設就是: • 凡是當傳染源可以培養出來,疾病必會發生。 • 只要沒有疾病存在,一定是傳染源沒有培養出來。 • 若傳染源被消滅,疾病就會消失。
儘管有點累贅,柯霍卻寫出了實質蘊含的條件,對於判斷某種傳染病是否是某些特定的病菌引起的,柯霍的條件可能就夠了。儘管有點累贅,柯霍卻寫出了實質蘊含的條件,對於判斷某種傳染病是否是某些特定的病菌引起的,柯霍的條件可能就夠了。 • 我們試著用他來看能否抽菸與肺癌扯上一些關係。 • 這也同時檢驗了羅素的實質蘊含是否適用。
傳染源檢驗公設不適合香菸致癌的情況 • 致病源是抽菸史,而疾病是表皮樣癌,有很多抽菸的人並未罹患肺癌,如果我們相信他們的說辭,那麼也不滿足柯霍的第二項條件,不過若我們把肺癌的類型限制在小細胞癌,那麼不抽菸卻罹患肺癌的人數似乎等於零,因此有可能滿足第二項條件。現在,假如我們拿掉致病源,也就是讓病人停止抽菸,他還是有可能得病,因此也不滿足柯霍的的第三個條件。
傳染源檢驗公設的侷限 • 若我們用柯霍的必要公設(即羅素的實質蘊含),那麼滿足這些公設的疾病,只有那些能由血液或其它體液培養出來的特定傳染源所引起的急性疾病,對於心臟病,糖尿病、氣喘、關節炎、癌症等病,就不成立了。
相關性或因果關係 隱藏變數的存在
相關性與因果關係 • 酒精對身體的影響的研究; • 不同計量的酒精(解釋變數)對老鼠體溫(反應變數)的影響。 • 美國51州SAT數學與字彙分數的關係; • 兩變數並沒有誰影響誰的情形。 • 若將數學分數視為反應變數,字彙分數視為解釋變數,則可利用兩分數的相關性以一考生的字彙分數預測該考生的數學分數。
相關性與因果關係(續) • 解釋變數與反應變數之間未必具有因果關係。但兩變數的相關性,可作為互相預測的參考。
相關與因果關係實例 • r=0.5239,氣候影響兩變數
相關與因果關係實例 • 飲料消費量與患者人數有相關性,但未必有因果關係。氣候分別影響飲料消費量與患者人數的因果關係,或許較為可接受。 • 100位男人的資料顯示收入與血壓有正相關,但未必有因果關係。而年齡分別影響收入與血壓的因果關係,或許較為合理。
留意隱藏變數 • 表面的資料未必可信。 • 比較兩航空公司的班機延誤率
留意隱藏變數(續) • 考慮隱藏變數:班機起飛城市
留意隱藏變數(續二) • 每一個班機起飛城市的班機延誤率都是Alaska Airlines 較低
留意隱藏變數(續三) • 資料來源 • A. Barnett, “How numbers can trick you,” Technology Review, October 1994, Department of Transportation.
相關性證據的再檢驗 康菲爾德的解
我們現在回過頭,去看看康菲爾德與五位著名癌症專家在一九五九年發表的論文,他們一一說明了先前所進行的各項相關研究。我們現在回過頭,去看看康菲爾德與五位著名癌症專家在一九五九年發表的論文,他們一一說明了先前所進行的各項相關研究。 • 追溯性研究發現抽煙者肺癌發生率高。 • 追蹤研究發現肺癌與抽煙之間的劑量反應。 • 根據三大城市死亡證書全面性的肺癌與抽煙的相關性研究。
比較性研究 • 第一項研究是由杜爾(Richard Doll)和希爾(A. Bradford Hill)所做的,並於一九五二年發表在《英國醫學期刊》(British Medical Journal)上。 • 他們注意到,英國人死於肺癌的人數急劇上升,於是開始追蹤數百名肺癌病患,並把這些病人,與同一時期住在同一家醫院的其它狀況類似(同年齡、性別與社會經濟情況)、但非罹患肺癌的病人加以比較。
抽煙者肺癌發生率高 • 結果發現,肺癌病人當中的吸菸人數,是非肺癌當中將近十倍(在這類研究中,非肺癌病人稱為「對照組」)。 • 直到一九五八年底,有其它五個性質類似的研究結果發表,研究對象是北歐、美國、加拿大、法國與日本的肺癌病患。 • 所有的結果都一樣,肺癌病人當中抽菸人數所占的比例,遠高於對照組的抽菸人數比例。
追溯性的研究 • 這類研究稱為「追溯性的研究」(retrospective studies),是由疾病開始,追溯回去看哪些事前條件與這個疾病有關。 • 這種研究必須要有對照組,(即未罹患同樣疾病的另一組病人),以確定就是某些事前條件和該疾病有關,而不是病人其它更普遍的特徵。當然一定會有人批評,說這些對照組有可能和實驗組不相等同。
追溯性的研究的誤判實例 • 有個很著名的追溯性研究是在加拿大進行的,研究者想知道人工代糖是否會導致膀胱癌:研究結果顯示,人工代糖似乎與膀胱癌有某種關聯,但更仔細分析數據之後,研究人員發現罹患膀胱癌的病人幾乎都來自社會經濟較低的族群,而對照組幾乎屬於高階層的族群,這意謂著實驗組和對照組並不等同。
因此在九○年代初,耶魯大學醫學院的范斯汀(Alvan Feinstein)及霍維茲(Ralph Horvitz)提出一套非常嚴格的規則,確保在進行追溯研究時,實驗組和對照組能相符。 • 若我們把范斯汀--霍維茲規則套用於上述這些追溯性的病例對照研究,會發現他們全都不符合規則。
追蹤性的研究 • 另一種替代的方法則反過來,也就是追蹤性(prospective)的研究。在這種研究裡,研究者會事先選定一群研究對象,仔細紀錄這群人的抽菸史,然後追蹤一段時間,看看會發生什麼事。 • 直到一九五八年為止,已經普遍進行過三項追蹤研究。
英國的五年追蹤研究 • 第一個研究是杜爾與希爾對五萬位的英國醫生的研究(他們做完第一項追溯研究之後就做了這個研究)。 • 在這項研究裡,追蹤的時間並不長,但他們仔細詢問了這些醫師的情況,包括抽菸的習慣,而在追蹤五年之後,其中有很多人得到了肺癌。
這一次,證據不只顯示兩者之間的關係,他們按照每個人抽菸量的多寡,把這些醫師分成好幾組,結果發現菸抽的愈兇的醫師,得肺癌的機率愈高。這一次,證據不只顯示兩者之間的關係,他們按照每個人抽菸量的多寡,把這些醫師分成好幾組,結果發現菸抽的愈兇的醫師,得肺癌的機率愈高。 • 這是所謂的劑量反應,是藥理學上對於一組結果的關鍵證明。
美國的追蹤研究 • 在美國,賀門(E. C. Hammond)與霍恩(David Horn)也進行了一項追蹤研究(於一九五八年發表),研究對象共187,783人,追蹤了四個月,也發現了劑量反應。
追蹤性研究的問題 • 如果研究的規模不大,它也許只能處理某個特定的母體,因此把研究結果外推至大母體,可能並不合理。 • 比方說,早期這種追蹤研究的對象,絕大部分是男性,因為在當時,女性發生肺癌的機率實在是太低了,低到無法分析。 • 第二個問題是,為了做出有意義的分析,事件(如肺癌)發生的數目必須夠多,這可能就需要很久的時間了。
解決方法 • 若要解決這兩個問題,追蹤的人數必須要夠多,如果做到了這一點,我自就更能確保研究結果對於大母體也會成立。 • 此外,如果在短時間內,事件發生的機率很小,只要我們追蹤的人數夠多,一樣可以得到夠多的事件來分析。
兩追蹤研究的侷限 • 杜爾與希爾的第二項研究之所以選擇醫師這個母體,有兩個原因:首先他們認為,醫師對於自己抽菸習慣的回憶比較可靠,其次是因為他們有接受過專業的醫學訓練,因此這個群體裡發生的所有肺癌病例,一定都會被記錄下來。
但是我們能由研究醫師所得到的結果,去推論碼頭工人的情況嗎?醫師畢竟是受過高等教育的專業群體,而碼頭工人的平均教育程度在高中以下。但是我們能由研究醫師所得到的結果,去推論碼頭工人的情況嗎?醫師畢竟是受過高等教育的專業群體,而碼頭工人的平均教育程度在高中以下。 • 賀門與霍恩希望自己的樣本更具代表性,因此找了將近二十萬人,研究這麼多人也有一個風險,就是得到的資料較不準確。
機率樣本的疑慮 • 談到這裡,可能會想起前面章節所提的,某些人對卡爾.皮爾生的數據樣本持反對意見,理由是他們認為這些是機率樣本,我們在這裡討論的,不也是機率樣本嗎?
全面性的研究 • 為了回應這種反對意見,多恩(H. F. Dorn)於一九五八年研究了三個大城市的死亡證明,並對死者的親屬追蹤訪問。 • 這個研究對象是所有的死者,因此不再是機率樣本。這一次,肺癌與抽菸之間的關聯再度得到壓倒性的證明,但我們還是能質疑訪問死者家屬的作法有瑕疵。
在這項研究進行的時後,抽菸與肺癌的關係已經廣為人知,因此死者若是死於肺癌,他的家屬可能比較記得他的生前有無菸癮,若不是死於肺癌,死者生前的抽菸習慣家屬可能就比較記得沒那麼清楚。在這項研究進行的時後,抽菸與肺癌的關係已經廣為人知,因此死者若是死於肺癌,他的家屬可能比較記得他的生前有無菸癮,若不是死於肺癌,死者生前的抽菸習慣家屬可能就比較記得沒那麼清楚。
個別流行病學研究的侷限 • 這就是大部分流行病學研究的情形,每個研究都有某種瑕疵,因此對於每一項研究,批評者都可以指出某些可能發生的原因,使結果有偏差。
多種研究的共同結論 • 康菲德爾與五位共同作者,蒐集了一九五八年之前在不同國家、不同母體所進行的三十項流行病學研究。他們指出,正因為這麼多項根據各種母體進行的研究,竟得到了極為一致的結論,因此最終的結論應該是可信的。
反對意見的駁斥 • 他們把反對意見一一提出來討論,考慮了柏克森的批評,然後指出如何把某項研究應用在這些反對意見上。 • 尼曼曾指出,如果碰到抽菸的人活的比不抽菸的人久,或者肺癌是一種老年人的疾病,都會使原先的追溯性研究有所偏差,康菲爾德就舉出研究中的病人所得到的數據為例,說明這種描述對那些病人而言並不合理。
解釋機率樣本代表性的問題 • 他們從兩方面,談到機率樣本是否有代表性的問題。 • 他們指出,病人母體所涉及的範圍很大,因此得到的結論很可能適用於所有母體。 • 他們也指出,若這種因果關係成為基礎生物學的結果,那麼病人的社會經濟與種族背景,應該與研究結果無關。 • 審查了一些毒物學方面的研究之後,指出抽菸在動物實驗與組織培養上,的確有致癌反應。