570 likes | 676 Views
数据处理及分析过程. 《 分析化学原理 》 复旦大学 吴性良、朱万森、马林. 篇 1 化学分析法 篇 2 电分析化学法 篇 3 光学分析法 篇 4 分离分析法 篇 5 化学计量学初步及分析过程. 这块说什么?. 数据处理及分析过程. 《 分析化学 》 到底如何教?什么内容重要?. 引起大家思考 我们近期也在大讨论 国内各校,谁做得好?. 数据处理及分析过程. 1. 分析数据的统计处理. 1.1 分布函数 1.2 参数估计 1.3 统计假设检验 1.4 回归分析 1.5 质量控制 1.6 不确定度. 1.1 分布函数.
E N D
数据处理及分析过程 《分析化学原理》 复旦大学 吴性良、朱万森、马林 篇1 化学分析法 篇2 电分析化学法 篇3 光学分析法 篇4 分离分析法 篇5 化学计量学初步及分析过程 这块说什么?
数据处理及分析过程 《分析化学》 到底如何教?什么内容重要? 引起大家思考 我们近期也在大讨论 国内各校,谁做得好?
数据处理及分析过程 1. 分析数据的统计处理 1.1 分布函数 1.2 参数估计 1.3 统计假设检验 1.4 回归分析 1.5 质量控制 1.6 不确定度 1.1 分布函数
每天抽样100个,1个月不合格数目的分布。 取什么值? 可列举出! 取值充满某区间! 什么样的概率? 某区间内的概率? 离散型 连续型 重复n次测定铁矿石中的%Fe 1 统计处理 1.1 分布函数 随机变量
1 统计处理 1.1 分布函数 离散型随机变量的分布函数之一:二项分布 对随机变量X进行n次独立试验 试验结果仅出现A或对立A之一 出现A的概率为p, 出现对立A的概率为q=1-p 塔板理论: 某组分在气液2相分布
1 统计处理 1.1 分布函数 离散型分布函数:二项分布 实例:某组分液气两相分配比k’=2/3。根据塔板理论,假设有10块塔板,计算每块塔板上气相中的分数。 气相出现的概率为p=0.6,液相概率q=0.4。
X :测定值 :总体均值 :总体标准差 1 统计处理 1.1 分布函数 连续型随机变量的分布函数:正态分布 正态分布的 形状和位置
1 统计处理 1.1 分布函数 连续型分布函数:正态分布 转换为标准正态分布 记为N(0,1)
数据处理及分析过程 1. 分析数据的统计处理 1.1 分布函数 1.2 参数估计 1.3 统计假设检验 1.4 回归分析 1.5 质量控制 1.6 不确定度 分析测量数据 的随机误差 正态分布 少量t分布 1.2 参数估计
1 统计处理 1.2 参数估计 总体均值的区间估计 (σ已知) 根据概率论中心极限定理 得到置信区间
1-α 1-α 双侧问题 α α/2 α/2 单侧问题 1-α α 1 统计处理 1.2 参数估计 置信区间
1 统计处理 1.2 参数估计 例. 测标准物质中某元素含量 80次测定的均值为12.37%,标准偏差0.056% 问 概率为95%, 总体均值应小于何值? 小于何值 单侧问题 样本数大 就是白色面积=0.95 σ=S u=1.645 α=1-95%=0.05 查表得 uα=1.645 95%的把握认为总体均值小于12.38
1 统计处理 1.2 参数估计 两个正态总体μ1- μ2的置信区间(σ1,σ2已知)
双侧问题 单侧问题 1 统计处理 1.2 参数估计
数据处理及分析过程 1. 分析数据的统计处理 1.1 分布函数 1.2 参数估计 1.3 统计假设检验 1.4 回归分析 1.5 质量控制 1.6 不确定度 根据测量结果 估计真值 概率区间 1.3 统计假设检验
两类错误 拒真概率α 纳伪概率β 1 统计处理 1.3 统计假设检验 假设检验方法 用随机样本中的测定值 检验总体参数(μ,σ) 建立H0,H1 统计假设(statistical hypothesis) 记做H0 样本判断总体,不可能不犯错啊! 计算统计量 查拒绝域临界值 α、 β不能同时都很小! 仔细阅读 p568 回答什么叫显著性检验? 检验假设(test hypothesis) 接受H0 接受H1 作出判断(接受或不接受)
第一类错误 第二类错误 1 统计处理 1.3 统计假设检验 H0正确,但拒绝 H0不正确,却接受
1 统计处理 1.3 统计假设检验 单个样本检验总体参数 例. 标准铁样含碳量遵从N(4.55,0.112) 某实验室检验5次: 4.28,4.40,4.42,4.35,4.30 分析系统是否正常? α=0.05 1. H0:μ=μ0 H1:μ≠μ0 2. 由正态分布,得到
1 统计处理 1.3 统计假设检验 单个样本检验总体参数 例. 标准铁样含碳量遵从N(4.55,0.112) 某实验室检验5次: 4.28,4.40,4.42,4.35,4.30 分析系统是否正常?α=0.05 测定值明显低于统计均值,检验正常?异常? 3. 双侧检验,查表得, 4. 因为 所以μ≠μ0 结论:分析系统不正常
两个样本的标准差同总体无差异 1 统计处理 1.3 统计假设检验 分析有无 显著性差异 两个样本检验总体参数 例. 赤铁矿样I和II分析铁含量 (%) ,结果如下, 双侧检验,查表得, 结论:两瓶铁矿无明显差异
数据处理及分析过程 1. 分析数据的统计处理 从统计学角度 一致性判断 1.1 分布函数 1.2 参数估计 1.3 统计假设检验 1.4 回归分析 1.5 质量控制 1.6 不确定度 1.4 回归分析
1 统计处理 1.4 回归分析 回归分析(regression analysis) 确定自变量和因变量之间的函数关系 变量之间相互影响,但关系不甚明了 1 相关关系 2 相关分析 研究变量之间是否存在相关关系 3 相关系数 变量对另一变量回归方程的离散程度
1 统计处理 1.4 回归分析 3 相关系数
1 统计处理 1.4 回归分析 回归分析(regression analysis) 多元线性回归 线性回归 一元线性回归 a,b如何求? 回归方程y=ax+b
1 统计处理 1.4 回归分析 例. 拟合样品中铀含量和荧光强度实验数据的线性回归方程
1 统计处理 1.4 回归分析 例. 拟合样品中铀含量和荧光强度实验数据的线性回归方程 最小二乘法 回归方程 y=4.32+7.72xr=0.9996
1 统计处理 1.4 回归分析 回归分析(regression analysis) 非线性回归
1 统计处理 1.4 回归分析 回归分析(regression analysis)
1 统计处理 1.4 回归分析 回归分析(regression analysis)
1 统计处理 1.4 回归分析 回归分析(regression analysis)
1 统计处理 1.4 回归分析 回归分析(regression analysis) 不能转换咋办呢??? 非线性建模,迭代/优化等
数据处理及分析过程 1. 分析数据的统计处理 1.1 分布函数 1.2 参数估计 1.3 统计假设检验 1.4 回归分析 1.5 质量控制 1.6 不确定度 建立相关关系考察相关系数线性模型最普及 GLP SOP QA & QC Control Chart 1.5 质量控制
数据处理及分析过程 1. 5 Quality Control (1) GLP (2) SOP (3) QA&QC (4) Control Chart GLP SOP QA & QC CC
1 统计处理 1.5质量控制 良好实验室操作规范 GLP (Good Laboratory Practice ) 人员以俺为例! 指严格实验室管理的一整套规章制度 (包括实验室建设、设备、人员条件、各种管理制度、操作规程、实验室及其出证资格的认可等) 包括对实验设计、操作、记录、报告、监督等 整个环节和实验室的规范要求。
1 统计处理 1.5质量控制 标准操作规程 SOP (Standard Operating Procedures) 将某一事件的标准操作步骤和要求以统一的格式描述出来,用来指导和规范日常的工作。 编写和使用SOP的主要目的: 保证操作的重现性和结果数据的可信性 由不同的人按SOP进行操作和试验,可保证能够达到较一致的结果。 讨论一下配制NaOH溶液 所用试剂?如何配制? 保存?标签?……
1 统计处理 1.5质量控制 标准操作规程 SOP 目的:为使分析测试的一切行为规范化,标准化 内容:记述的实验室内常规试验有关的各种工作 程序,技术方法及管理措施等的一整套 形式:一整套具有内部法规性的文件
1 统计处理 1.5质量控制 SOP 意义 明确人员职责统一操作标准保障物质条件保证数据质量 制定者修改者确认者批准者 该做什么?该如何做?
1 统计处理 1.5质量控制 发布3个SOP FXHXSOPT001:数据的修正 FXHXSOPT002:标签
1 统计处理 1.5质量控制 发布3个SOP FXHXSOPT001:数据的修正 FXHXSOPT002:标签 FXHXSOPM001:课程评分标准 FXHXSOPM001:见word文档
1 统计处理 1.5质量控制 质量保准QA (Quality Assurance) 质量控制QC (Quality Control) QA包括2方面: 分析质量控制和分析质量评定 控制空白样/检出限/校准曲线/测定不确定度 质量控制图Control Chart
3σ 2σ 1 统计处理 1.5质量控制 质量控制图 Control Chart • 均值为中心线 • 置信度99.73%的置信限 上下控制限 • UCL/LCL (upper/lower control limit) • 置信度95.44%的置信限 上下警戒限 • UWL/LWL (upper/lower warnin limit)
1 统计处理 1.5质量控制 质量控制图 Control Chart • 钢厂分析室测得st52-3型号钢中硅含量
数据处理及分析过程 1. 分析数据的统计处理 1.1 分布函数 1.2 参数估计 1.3 统计假设检验 1.4 回归分析 1.5 质量控制 1.6 不确定度 规范化是核心 1.6 不确定度
1 统计处理 1.6不确定度 • 误差与真值相联系 • 但不能用于测量结果可靠程度的表征 历史: 分析测量结果用误差概念 更加完整合适的表达:不确定度 不确定度 Uncertainty 1993年 Guide to the Expression of Uncertainty in Measurement GUM测量不确定表示指南--GUM 包括IUPAC等多个国际组织批准
1 统计处理 1.6不确定度 不确定度 Uncertainty 传统定义 一个以被测值为 中心的数值范围 它以一定的概率 包含着真值。
1 统计处理 1.6不确定度 不确定度 Uncertainty GUM新定义 测定结果所含有的一个参数, 它用以表征合理赋予 被测量值的分散性。 这个定义偏抽象 还是右图
1 统计处理 1.6不确定度 不确定度 Uncertainty 概念 测量结果是被测量值的估计值(近似值) 含有不确定度时,才是完整表达 重要分析结果 (如产品质量、标准器校正、涉及鉴定) 不确定度也更为重要
1 统计处理 1.6不确定度 标准不确定度的类型和表达 A类标准不确定度 uA B类标准不确定度 uB 合成标准不确定度 uC
1 统计处理 1.6不确定度 A类标准不确定度 uA 建立在观察数据的概率分布上 用统计方法评定的标准不确定度 常用标准偏差S、极差R uA=Si
1 统计处理 1.6不确定度 uB=Sj估得 B类标准不确定度 uA 用非统计方法评定的标准不确定度 估计出的“近似”/ “等价”标准偏差 ① 以前的观察数据 ② 技术资料(含生产部门提供的)及仪器特性的了解 ③ 校准/检定证书等提供的数据、准确度级别 ④ 手册等资料给出的参考数据及不确定度 ⑤ 技术规范中对某些测量方法规定的重复性