530 likes | 641 Views
Data mining in pharma sector: benefit. Jayanthi Ranjan 管理技术研究所信息管理及技术领域,印度. 数据挖掘在药学领域中的应用 —— 好处. 摘 要. 目前,各个领域产生的数据量均十分巨大,医药行业也不例外。 众所周知,文本挖掘是从大量数据集中发现信息的科学,有助于医药公司发现改进药物开发及供给的模式。 本文旨在显示数据挖掘技术如何在医药行业中发挥作用 ; 怎样在制药行业中取得了良好效果 ; 怎样利用药物数据真正地加强决策。. 本文的内容组织. 1 、前言 2 、制药行业中数据挖掘及其技术的简要概述
E N D
Data mining in pharma sector: benefit Jayanthi Ranjan 管理技术研究所信息管理及技术领域,印度
摘 要 • 目前,各个领域产生的数据量均十分巨大,医药行业也不例外。 • 众所周知,文本挖掘是从大量数据集中发现信息的科学,有助于医药公司发现改进药物开发及供给的模式。 • 本文旨在显示数据挖掘技术如何在医药行业中发挥作用; 怎样在制药行业中取得了良好效果; 怎样利用药物数据真正地加强决策。 摘要
本文的内容组织 • 1、前言 • 2、制药行业中数据挖掘及其技术的简要概述 • 3、数据挖掘在医药行业中的作用 • 4、总结
1、前言及相关研究 • 在当今的后工业信息化社会中,数据是最宝贵的资源之一。然而,只有将数据处理、转化为可以带给企业竞争优势的信息,才是有用的。 • 此外,注重效率的医药企业会产生不断增长的数据。所以,我们应该怎样处理这么多的数据,才能帮助检验假说、得出结论、确定趋势和机遇? 1、前言
正是在这种环境下,数据挖掘把数据转换成信息,使其用于分析、数据挖掘、趋势确定,并以有利的方式应对这些趋势。因此,企业可以利用数据挖掘技术处理著名的信息超载现象。当然,这里要求数据应该是可获得的、可用的、通用的、灵活的及可理解的。正是在这种环境下,数据挖掘把数据转换成信息,使其用于分析、数据挖掘、趋势确定,并以有利的方式应对这些趋势。因此,企业可以利用数据挖掘技术处理著名的信息超载现象。当然,这里要求数据应该是可获得的、可用的、通用的、灵活的及可理解的。 • 此外,要成为一个成功的增值型制药企业,数据挖掘必须与商业策略处于平等位置,以确保投资的回报是成功的。 1、前言
数据挖掘的定义 • Feelders等对数据挖掘的定义:通过应用统计学、机器学习及数据库管理系统领域的算法和技术,从大型数据集中抽取信息的过程。 • 传统的数据分析方法通常包括数据的人工操作和解释,这种方法较慢,价格昂贵,且主观性强。 1、前言
如何有效组织数据 • 一个典型(尤其是大型和/或多中心)的临床试验拥有大量数据资源,其中包括了由网络和中心实验室收集转化的电子数据。 • 此外,许多项目的多个试验都在研究相同的化合物或药物,因此,问题是如何管理所有这些数据,而不是去重复收集它们。 1、前言
如何有效组织数据 • 大型跨国制药行业巨头针对多种药物进行了大量的临床试验,其数据收集和分析工作遍布世界。对于他们来说,执行数据标准及制药公司需要的程序和验证标准的难度更大。 • 许多国家都在进行临床试验,而且各专业的临床医生和统计学家均需要这些收集而来的数据,以进行分析和产品辩护。 • 数据挖掘在有效组织数据方面发挥着非常关键的作用。 1、前言
最近,专家预测,医药行业收入增长的趋势变缓(从12 %降至5 %~6 %)。Cosper描述了这一趋势。此现象对药物研究技术企业产生了许多影响。 • 最重要的是,收入增长放慢将减少整个行业的支出。许多药物研究技术企业正在试图通过数据挖掘方法来解决这一难题,使新药“fail faster and faster”。 1、前言
选择最佳的市场策略 • 现有的药物信息(包括药理性质、剂量、禁忌证、警告等)数量巨大。然而,这些反映的均是市售药品—而不是关于每个产品的详细信息。如果可收集到所有产品的详细信息,一定会为行业创造价值。但这个解决方案往往夸大或低估了降低临床治疗失败率的障碍。 • 因此,以增加收入为中心的市场策略将比倾向于降低费用的策略更有说服力。这表明,医药企业应以特定的客户群为目标市场,而实现这个设想的技术将会增多。而且会使以降低成本和提高临床试验产量为目标的设计成为可能。 1、前言
医疗管理中决策支持面临的挑战 • Hampshire与Rosborough强调了医疗管理过程中,决策支持的重要性。Dutta与Heda测试了各种决策支持能力,这种能力能增加医务人员的生产力、分析护理结果、不断完善医疗服务流程,以保持盈利,同时,保持成本界限,维持医疗服务的质量。 • 医疗护理决策支持面对的挑战:复杂多样的数据、知识形式与任务;较基础科学而言,标准化术语的缺乏;严格的性能、精确的需求及遗留陈旧系统的普及。 1、前言
2、数据挖掘技术 • 随着医药行业领域的迅速变化,决策支持系统发挥了越来越重要的作用。医药行业正在以数据挖掘作为战略决策的支持工具。 • 由于数据量巨大(如流行病学领域的临床试验结果),人们必然需要相应的数据挖掘解决工具。后者提供了获得医疗数据并从中提取相关信息的方法,而且可以将这些知识提供给医药部门的所有人员。 2、数据挖掘技术
医药行业的相关数据资源 • 一般的指南性规则 • 临床数据(患者数据、药学数据、医疗数据、住院时间) • 管理数据(治疗成本、药物成本、员工工资、会议、成本-效益研究) • 组织数据(病房占有率,设施,设备) 2、数据挖掘技术
数据挖掘可用于支持 • 提供医疗服务的医师 • 临床治疗过程的控制 • 行政管理任务 • 机构和经济数据的有效管理 2、数据挖掘技术
制药行业依赖于面向决策、系统的选择模型,该模型使决策者得以评价实施建议方案后产生的期望盈利。它超出了有效性系数大小的检查范围,而且带来了一系列问题。如公司的资本预算、战略成果评估。制药行业依赖于面向决策、系统的选择模型,该模型使决策者得以评价实施建议方案后产生的期望盈利。它超出了有效性系数大小的检查范围,而且带来了一系列问题。如公司的资本预算、战略成果评估。 2、数据挖掘技术
很多机构产生了大量关于其新药的数据,以及药物性质的报告等。这些数据是一种战略资源。如今,利用大部分这些战略资源将会改善医药行业的质量。很多机构产生了大量关于其新药的数据,以及药物性质的报告等。这些数据是一种战略资源。如今,利用大部分这些战略资源将会改善医药行业的质量。 • 数据挖掘,又称为大型数据集的模式分析。该技术可以使用工具(如相关、聚类、分割及分类)更好地处理数据,帮助制药公司通过节约成本、改善药物开发及销售方法的质量来参与竞争。 2、数据挖掘技术
制药部门应用的数据挖掘技术主要为聚类、分类及神经网络。见表1。制药部门应用的数据挖掘技术主要为聚类、分类及神经网络。见表1。 • 表1说明了数据挖掘技术怎样实现医药数据的增值。 2、数据挖掘技术
表1 2、数据挖掘技术
3、数据挖掘在制药行业中的好处 • 药学信息的确认和量化对患者、医生、药师、卫生机构、保险公司、监管机构、投资者、律师、药品生产企业、药品检测企业等是有用的。 • 如非处方药之间的相互作用;处方药与非处方药的相互作用;处方药之间的相互作用;药物与食物、饮料、维生素、矿物质补充剂的相互作用;特定药物群与其过敏食物、饮料、药物的共同特点等,应用数据挖掘技术分析这些信息,可以得出有价值的结果。 3、数据挖掘在制药行业中的好处
药学信息的缺乏 • 药学数据的一个主要问题是信息的缺乏。 • 大多数卫生保健单位根本没有时间填写可能存在的药品不良反应报告。 • 对于制药公司,进行彻底的数据收集工作是昂贵且浪费时间的,尤其是当法律规定其中的大部分信息是人们所不需要的。 3、数据挖掘在制药行业中的好处
开发数据挖掘技术的意义 • 通过医疗保健领域的数据挖掘技术,可以建立一个易用的支持医务人员与临床管理者做出决策的决策支持平台。这是现代医疗服务的新方向,因为它开创了医疗卫生行业信息技术的创新应用领域。 • 医疗机构(如医疗保险公司),其主要兴趣在于提高患者的治愈率及减少治疗费用。数据挖掘技术可通过避免重复试验、应用自动化操作及简化会计、管理的流程来节省时间,保证长期的经济性。 3、数据挖掘在制药行业中的好处
开发数据挖掘技术的意义 • 数据挖掘为医疗工作带来警示,支持临床或商业决策,为医务人员(临床医生、医师、护士)及其他决策(临床管理、人力资源)者提供依据或专案报告。 • 本文的意义在于,证明数据挖掘方法构成了临床决策支持系统的一个可靠且有效的工具。 3、数据挖掘在制药行业中的好处
开发数据挖掘技术的意义 • 正如Morrisey指出,医疗保健部门的信息已十分密集,而且已有迹象表明,医疗业正在逐渐认识到,在新的医疗管理环境下,信息处理越来越重要。 • Prins与Stegwee强调,多数医疗机构缺少合适的信息系统,难以做出关于其他信息的可靠报告,这种报告不仅仅与财务或业务量有关。 • 在成本、疗效与患者满意度之间关系混乱的情形下,需要一个适当的平衡,这个平衡可以通过即将出现的信息、交流技术找到。研究表明,富含分析解决方案的成功的决策系统对于医疗信息系统是必要的。 3、数据挖掘在制药行业中的好处
检索性能 • 如果给定了查询数据库的大小,就需要权衡信息精确度与处理时间的关系。抽样技术及显著性检验对于一些常见关系的确定效果较好;然而,对于罕见关系的处理时间可能会很长。 • 检索的彻底性取决于查询的重要性(如“生命威胁”与“很想知道”)、索引结构的使用、查询的详细程度。当然,数据挖掘面对的真正挑战是用户只输入最少的信息。如:找到食物、任何类型或品牌的抗酸药可能存在的严重不良反应。而且这些不一定在厂商的产品文献中报道。 3、数据挖掘在制药行业中的好处
用户资料 • 用户界面可接收来自用户的各种信息(如体重、性别、年龄、进餐情况、曾报告的反应、剂量、用药时间)。然后,根据数据库中的信息及用户输入的相关数据,可以得出一系列的警告或已知反应(包括概率)。 • 需要注意的是,用户记录中可包括大量信息,需要开发高效的数据挖掘工具,以便从数据库中探查有关信息。 • 其次,患者(匿名)记录应包括患者告知的所有不良反应,以便于将来发现这些关联。随着时间的推移,这些数据库会变得更大,并且,已有药物的相关作用的数据会更加复杂。 3、数据挖掘在制药行业中的好处
数据挖掘可以从以下方面提供情报 • 药物定位信息 • 人口特征 • 处方医生特点 • 地区优先性 • 疾病的流行 • 执行中的程序 • 与疾病有关的信息 • 对于不同方案,控制其资本,优化分配资源 3、数据挖掘在制药行业中的好处
数据挖掘可以在以下方面提供情报 • 监控及分析患者资源,得出各种药物有效性参数 • 在跨较广泛地理分布的不同数据计划中,操纵复杂及大量的数据元素,得出风险识别及趋势分析。 • 整合统计数据库 • 通过绩效板或个人报告中,对产品、地区、经销商或销售表的情况描述,监管、分析及提取销售的关键性能指标 • 将电子表格中的信息转换为高度智能及信息化的绩效板及报告。 • 监测研究及进展的追踪系统,绩效板展示,符合监管要求的详细报告,以及最新市场信息的概述 3、数据挖掘在制药行业中的好处
面临的挑战 • 是否能够充分利用现有的技术力量,升级和补充现有的系统,以创新可行的医药系统。 • 是否能提供检索正确信息的入口,而且支持决策过程。 3、数据挖掘在制药行业中的好处
数据挖掘对于医药行业的意义 • 时间就是金钱,对于医药行业来说,这个观念更为重要。 • 加快药物的开发、试验及批准的速度,可意味着数百万的股东价值。 • 帮助医生理解产品的不同用途与价值,可能会延长产品寿命,获取高额利润。 • 这是数据挖掘引起注意的地方。 • 制药企业应充分利用信息技术,以超越其商业目标。 3、数据挖掘在制药行业中的好处
新药的研究及开发需要大量费用,包括极高的人力资源投资、临床试验成本及由时间延长导致的附加费用。新药的研究及开发需要大量费用,包括极高的人力资源投资、临床试验成本及由时间延长导致的附加费用。 • 除外试验方面的原因,多个试验药物中,只有一两个能成功转化为可行的药物。 • 因此,开发一个药物需要分析源于多种临床试验平台(如全球范围的患各种不同疾病的患者)的大量数据。要分析的参数数量也比其他任何领域多。 • 其中,化合物在多种试验环境下的各种化学、物理及生物参数(以贮存条件、保存期限、副作用、不良反应为例)均必须检测。 3、数据挖掘在制药行业中的好处
另外,对于药物的批准,监管机构有更严格的参数范围,与其他行业比较,其参数的误差范围极小,因此,需要一个有力的数据分析处理流程以排除差错。另外,对于药物的批准,监管机构有更严格的参数范围,与其他行业比较,其参数的误差范围极小,因此,需要一个有力的数据分析处理流程以排除差错。 3、数据挖掘在制药行业中的好处
数据挖掘在医药行业中的应用 • 临床数据分析:评估、简化了大量信息。数据挖掘有助于发现产品开发过程中的趋势、不规则数据及风险。 • 市场营销及销售分析:可以确定最赚钱的产品,分配营销资金。数据挖掘有助于根据处方执行及产品购买情况,检查消费者的行为。 • 客户分析:通过数据挖掘,可以开发更有目的性的客户资料,这种资料不仅关注产品,还通过结合历史健康趋势与人口统计数据来关注产品的可购买力。 3、数据挖掘在制药行业中的好处
数据挖掘在医药行业中的应用 • 确认可能尚未诊断的个人及人群,以他们为目标,鼓励他们接受针对某种疾病的筛查与检查 • 结合产品销售信息与客户群体、客户渠道信息,分析哪些因素使客户更加一致地执行处方,或什么导致医生开具某种药物的频率较高。 • 经营业绩及财务分析:分析某地理区域或地区的处方行为,以根据市场大小或渗透力进行销售队伍调整。 • 剖析最大客户的购买趋势(包括管理式医疗服务的提供者、政府机构),积极制定对买方及企业均有利的价位。 3、数据挖掘在制药行业中的好处
数据挖掘在医药行业中的应用 • 销售及营销分析:为一直未联系的销售人员提供移动分析方式,让他们不仅回答详细的药物信息问题,还要回答历史趋势问题。 • 以经常开具某药或给予某种治疗的医师为目标,向他们提供可以治疗互补症状或疾病的新药信息。 • 产品分析:分析购买趋势及治疗效果,直接针对不同年龄组及危险因素开发更多的药物及产品类型。 3、数据挖掘在制药行业中的好处
数据挖掘在医药行业中的应用 • 结合人口统计学与患者健康情况的历史趋势,以患者的“生活质量”要求(改善生活方式的药物)为目标,来改善患者(尤其是不可治愈的患者)日常生存水平。 • 供应链分析:分析哪些药品在架上的销售时间最长,及各药品的销售情况,以改进生产进度。 • 以历史趋势及患者行为为基础,更有效地管理库存,以预防零售商及药店缺货。 3、数据挖掘在制药行业中的好处
药物开发的4个阶段 • 研究 • 试验开发及药物行为预测 • 临床试验测试 • 药物在人体内的临床试验测试 • 最后,药品商业化运作,并把它出售给可能的消费者(医生与患者)。 3、数据挖掘在制药行业中的好处
发现新药 • 总体目标是找到药物在相关基因上的作用或寻找具有特定功能的药物化合物。 • 可用的数据挖掘技术是聚类、分类及神经网络。 • 目标是确定具有相似活性的化合物(由于具有相似活性的化合物可能具有相似的作用)。 • 有两种情况:①化合物已知,要寻找更好的;②化合物未知,但它具有想要的活性,人们要寻找具有此活性的化合物。 3、数据挖掘在制药行业中的好处
发现新药 • 可以通过聚类分析,根据分子的化学特性,对分子进行聚类。 • 这样,每当一个新的分子被开发,该分子就会与其他化学性质相似的分子进行分组。这将有助于研究者发现该分子将属于哪个治疗组。 3、数据挖掘在制药行业中的好处
发现新药 • 挖掘有助于测定分子在特定疾病中(如结核病)的化学活性,找出分子的哪部分起作用。这样,我们可以将大量分子结合形成一个超级分子,使其仅具有可以发挥作用的特定部分,而抑制其他部分的作用。 • 这将大大减少药物带来的副作用。 3、数据挖掘在制药行业中的好处
药物预测 • 许多问题可以影响已上市药物的成功,并可影响药物的发展。 • 首先,药物不良反应报告是自发的,没有组织性。 • 其次,我们只能比较自己公司药品的不良反应,而不能与竞争公司的其他药品做比较。 • 第三,我们仅拥有患者的用药信息,而没有患者的不良反应信息。 3、数据挖掘在制药行业中的好处
药物预测 • 所有这些都可能通过数据挖掘工具来解决,一些基本的分类工具即可解决大部分问题。 • 人们可以找出与特定药物有关的不良反应,而且进一步判断是否一些特定条件可以使其加重,如年龄、性别及肥胖。 • 这可以有助于执业医师向已开具这些药物的患者提示可能出现的不良反应。 3、数据挖掘在制药行业中的好处
药物预测 • 制药公司认为药物可能具有额外的好处。人们通过动物及人体组织试验以观察药物疗效,确定用多少药物可达到预想的效果及药物的安全性。 • 可用的数据挖掘技术包括分类及神经网络。目的是预测治疗是否会帮助患者。 3、数据挖掘在制药行业中的好处
药物预测 • 当我们拥有用药数据支持,而且有可证明药物(正面或负面)疗效的训练数据,就可以预测药物的效应。这种试验应该可以预测哪些患者会获益、哪些治疗会对镰状细胞贫血患者有所帮助。 • 此时,一些信息(如性别、体重、疾病状态等)将发挥重要作用。应将这些关键数据输入神经网络,以预测患者是否能够在该药物治疗中获益。 3、数据挖掘在制药行业中的好处
临床试验的统计分析 • 医药公司在实际患者中进行了更大规模的药物试验,而且必须保持跟踪患者的进展数据。 • 政府要保护公民的健康,制定了许多条例来管理临床试验。在发达国家,食品药品监督管理部门监督这些试验。 • 这里能用到的数据挖掘工具是神经网络。 3、数据挖掘在制药行业中的好处
制药公司收集并统计、分析数据,确认试验成功后,将数据上报至食品与药品监督管理部门,接受严格的检查。制药公司收集并统计、分析数据,确认试验成功后,将数据上报至食品与药品监督管理部门,接受严格的检查。 • 负面反应过多可能表明药物过于危险。 • 药物导致嗜睡即是一个药物不良事件。 3、数据挖掘在制药行业中的好处
事实上,数据挖掘在食品药品监管中的应用并没有在制药企业中应用的那么频繁。目的是检测出现大量不良事件的时间或者药物与某不良事件的联系。事实上,数据挖掘在食品药品监管中的应用并没有在制药企业中应用的那么频繁。目的是检测出现大量不良事件的时间或者药物与某不良事件的联系。 • 过多不良事件与一种药物有关联,可能表示该药物很危险,或者患者的健康状况存在风险。 • 当怀疑某种关联有危险时,该不良事件会被上报至食品药品监管部门。 3、数据挖掘在制药行业中的好处
人们可以将一个药物导致过多不良事件的信息输入神经网络,让神经网络得出“过多”的意义。人们可以将一个药物导致过多不良事件的信息输入神经网络,让神经网络得出“过多”的意义。 • 药物的有效性往往通过药物治愈疾病的时间来衡量。一个简单的相关技术可以有助于结果的判断,进而大大提高患者的生存质量(如使机体功能恢复得更快)。这正是患者要寻求的好处,而且可能有助于企业在竞争中更好地为药品定位。 3、数据挖掘在制药行业中的好处
4、结论 • 不久的未来,我们期待随着电脑化的普及与消费意识的提高,与医药产品有关的数据量会呈现巨幅增长,医务人员将很容易通过网络上报数据,医院及长期护理保健部门数据收集简单易行。而且由于此类机构通常给予患者适宜的饮食,保持精确的治疗记录、实验室检查及处方管理,所以,这些信息的质量很高。 • 此外,由于互联网的普及,消费者相对容易去自愿填写及提交自己的详细资料。总之,有可能存在许多相关信息资源,从而组成一个巨大且有价值的数据储存库。 4、结论