140 likes | 260 Views
1 .2独立性检验的基本思想及其初步应用. 在不吸烟者中患肺癌的比重是. 在吸烟者中患肺癌的比重是. 探究 :. 分类变量. 为了调查 吸烟 是否对 肺癌 有影响,某肿瘤研究所随机地调查了 9965 人,得到如下结果(单位:人). 列联表. 0.54%. 2.28%. 吸烟者和不吸烟者都可能患肺癌,吸烟者患肺癌的可能性较大. 通过图形直观判断两个分类变量是否相关:. 等高条形图. 不患病 比例. 患病 比例. 在不吸烟者中不患肺癌的比重是. 在吸烟者中不患肺癌的比重是. 独立性 检验. H 0 :假设 吸烟 和 患肺癌 没有关系. 独立性 检验.
E N D
在不吸烟者中患肺癌的比重是 在吸烟者中患肺癌的比重是 探究: 分类变量 为了调查吸烟是否对肺癌有影响,某肿瘤研究所随机地调查了9965人,得到如下结果(单位:人) 列联表 0.54% 2.28% 吸烟者和不吸烟者都可能患肺癌,吸烟者患肺癌的可能性较大
通过图形直观判断两个分类变量是否相关: 等高条形图 不患病 比例 患病 比例
在不吸烟者中不患肺癌的比重是 在吸烟者中不患肺癌的比重是 独立性检验 H0:假设吸烟和患肺癌没有关系
独立性检验 H0:假设吸烟和患肺癌没有关系 构造随机变量(卡方统计量) 其中n=a+b+c+d 作为检验在多大程度上可以认为“两个变量有关系”的标准 。 若H0(吸烟和患肺癌没有关系)成立,则K2应该很小.
随机变量-----卡方统计量 独立性检验 H0:假设吸烟和患肺癌没有关系
临界值表 即在 成立的情况下,K2大于6.635概率非常小,近似为0.01 独立性检验 H0:假设吸烟和患肺癌没有关系 现在的K2≈56.632的观测值远大于6.635,小概率事件的发生说明假设H0不成立! 所以吸烟和患肺癌有关! 这种判断会犯错误,犯错误的概率不会超过0.010
反证法原理与假设检验原理 反证法原理: 在一个已知假设下,如果推出一个矛盾,就证明了这个假设不成立。 假设检验原理:在一个已知假设下,如果一个与该假设矛盾的小概率事件发生,就推断这个假设不成立。
随机变量-----卡方统计量 临界值表 0.1%把握认为X与Y无关 99.9%把握认X与Y有关 1%把握认为X与Y无关 99%把握认为X与Y有关 10%把握认为X与Y无关 90%把握认为X与Y有关
假设检验问题: 求解思路 • 在H0成立的条件下,构造与H0矛盾的小概率事件; • 2.如果样本使得这个小概率事件发生,则H0不成立,就能以一定把握断言H1成立;否则,断言没有发现样本数据与H0相矛盾的证据。
在秃顶中患心脏病的比重是 在不秃顶中患心脏病的比重是 例1.在某医院,因为患心脏病而住院的665名男性病人中,有214人秃顶,而另外772名不是因为患心脏病而住院的男性病人中有175人秃顶.分别利用图形和独立性检验方法判断是否有关?你所得的结论在什么范围内有效? 55.01% 43.03%
例1.在某医院,因为患心脏病而住院的665名男性病人中,有214人秃顶,而另外772名不是因为患心脏病而住院的男性病人中有175人秃顶.分别利用图形和独立性检验方法判断是否有关?你所得的结论在什么范围内有效?例1.在某医院,因为患心脏病而住院的665名男性病人中,有214人秃顶,而另外772名不是因为患心脏病而住院的男性病人中有175人秃顶.分别利用图形和独立性检验方法判断是否有关?你所得的结论在什么范围内有效? 根据联表的数据,得到 在犯错误不超过0.010的前提下,认为“秃顶与患心脏病有关”。
注意: 1、在解决实际问题时,可以直接计算K2的观测值k进行独立检验,而不必写出K2的推导过程; 因为这组数据来自住院的病人,因此所得到的结论适合住院的病人群体. 2、本例中的边框中的注解: 主要是使得我们注意统计结果的适用范围(这由样本的代表性所决定)