310 likes | 541 Views
首届全国生物多样性信息学研讨会 —— 交流材料. 野生植物种质资源 数据采集、处理的技术和方法. 报告人:周 兵 单 位:中国科学院昆明植物研究所 日 期: 2009 年 8 月 27 日 地 点:内蒙古 · 锡林浩特. 报告内容. 工作背景 数据采集、处理的技术和方法 采集、处理规范的制定 采集模板和录入工具的定制 数据上传及意见反馈 数据整理分类和规范化处理 种质资源管理信息系统研发 工作成效. 工作背景. 国家大科学工程 —— 中国西南野生生物种质资源库
E N D
首届全国生物多样性信息学研讨会——交流材料首届全国生物多样性信息学研讨会——交流材料 野生植物种质资源数据采集、处理的技术和方法 报告人:周 兵 单 位:中国科学院昆明植物研究所 日 期:2009年8月27日 地 点:内蒙古·锡林浩特
报告内容 • 工作背景 • 数据采集、处理的技术和方法 • 采集、处理规范的制定 • 采集模板和录入工具的定制 • 数据上传及意见反馈 • 数据整理分类和规范化处理 • 种质资源管理信息系统研发 • 工作成效
工作背景 • 国家大科学工程——中国西南野生生物种质资源库 • 2004年,国家发改委正式批复,2005年开工建设,2007年建成并投入试运行。 • 是国际两大野生植物种质资源保存基础科学设施之一,将在未来的十五年收集保存19000种190000份(株)野生生物种质资源,将为科学研究、生物多样性保护和资源的持续利用提供材料、信息服务。
中国西南野生生物种质资源库——种质保存目标中国西南野生生物种质资源库——种质保存目标 • 植物种子 10000 种 100000 份 • 植物离体种质 2000 种 20000 份 • 动物种质 100 种 1000 份 • 微生物种质 2000 种 20000 株 • DNA 3000 种 30000份 • 种质资源圃 1000 种 10000 份
中国西南野生生物种质资源库——种质资源采集网络中国西南野生生物种质资源库——种质资源采集网络 红色部分为2008年前种质采集网覆盖地区,青色为2009年新增采集地区。
中国西南野生生物种质资源库——种子采集情况中国西南野生生物种质资源库——种子采集情况 • 合作单位和采集队伍逐年增加,种子采集数量不断攀升。
工作背景 • 为了有计划地对野生植物种质资源进行科学地收集,使种质材料的采集和处理方法更加完善,作为国家的大科学装置,对野生生物种质资源的采集、处理必须是科学、有序、客观、积极的。 • 为了构建一个数字化的种质资源库,实现真正意义上的种质资源库的共享,从而提供优质的共享服务,为后续野生植物种质资源的保护、研究、开发及合理利用提供信息和科学决策依据,数据采集、处理过程中的数据质量控制是关键,这就需要采用适合的技术和方法来予以保障。
数据采集、处理的技术和方法 • 采集、处理规范的制定 • 随着种质资源库采集网络的不断扩大、种质采集数量的逐年增加,为了保证信息数据的采集质量,必须有相应的数据采集规范来规范数据采集的标准、上报的流程以及各模块的分工和职能,以形成有效的数据采集、反馈机制来保证数据采集工作的顺利开展。 • 制定了“野生植物种质资源数据采集整理整合标准规范”,按统一规定采集数据,以保证数据的统一、完整和科学性;并严格按规范规定来检查、审核数据采集、处理工作的每一个环节,保证数据质量。
数据采集、处理的技术和方法 • 采集模板和录入工具的定制 • 对野生植物种质资源数据的采集包括资源信息和多媒体信息两类信息的采集。资源信息是关于种质的基本描述;多媒体信息是种质的多媒体描述。 • 基于“国家自然科技资源平台植物种质资源共性描述规范(试行)”的数据标准,结合野生植物种质资源数据信息的特性,定制了数据采集模板和与之相匹配的数据录入工具,方便用户信息的录入,保证了数据信息的统一、完整和科学性。
当前记录 添加记录 编辑记录 删除记录 首条记录 保存记录 上条记录 记录总数 下条记录 最后记录 数据采集、处理的技术和方法
数据采集、处理的技术和方法 • 多媒体信息采集 • 图片格式要求 • 图片清晰,色彩还原准确; • 必须是jpg格式; • 图片的大小不能小于1024×768。 • 图片内容要求 • 大生境图片一张,用于反映植被类型,土地类型。 • 小生境图片一张,用于反映植物小生境以及伴生物种。 • 植株一张,用于反映植物习性和特征。 • 果实、叶子或花特写,1到3张,用于反映植物形态特征。
数据采集、处理的技术和方法 • 数据上传及意见反馈 • 通过FTP方式架设开通了文件传输服务器,为每个采集小组分别分配了上传账号,让种质资源库采集网络的所有成员单位定期将各自负责收集的采集信息表和多媒体数据远程上传到服务器。 • 信息管理员负责对上传数据信息进行审核,负责将审核结果以电子邮件方式进行信息反馈,并同步通过种质资源库网站及时公布种质资源采集的汇总统计信息。
数据采集、处理的技术和方法 • 数据整理分类和规范化处理 • 信息管理员负责对上传到服务器上的采集数据进行整理分类和规范化处理,清除数据冗余,弥补数据缺失,形成符合种质资源库管理信息系统要求的数据文件格式。 将Excel表转换成ACCESS,并重新优化调整表结构成新表,设置主键
数据采集、处理的技术和方法 数据库位置 对每一列进行检查整理 对不同的列进行检查,调整,整理。对于同一列中同样的字符问题可以进批量修改。在不损失内容的前提下整理数据,确保数据的一致性。 根据需求替换列中的某些字符串 根据需求删除中文或英文字符 微调单行数据
数据采集、处理的技术和方法 数据处理前 数据处理后
数据采集、处理的技术和方法 • 数据整理分类和规范化处理——多媒体信息 • 多媒体描述表
数据采集、处理的技术和方法 将经纬度由度分格式转换成度分秒格式 存放位置 数据操作 图片校验检查
采集计划 监测评价 研究创新 凭证标本 打印标本标签 物种 鉴定 • 计划采集/获得采集许可 采集种子 快速运回种子库 实验分析 录入采集信息 种子 打印处理标签 清理 TZ实验 湿度检测 X光分析/切割检验 分发利用 种子数量估计 初次发芽试验 再次发芽试验 入库 再生/增殖 打印入库标签 研究 中国西南野生生物种质资源库——种子管理流程
数据采集、处理的技术和方法 • 种质资源管理信息系统研发 • 系统采用B/S体系架构建立种质数据库数据信息处理平台(前台、后台),实现对数据(包括图片)的录入、编辑和查询,管理灵活方便。 • 系统实现对种子、离体材料、遗传物质(DNA)三种植物保存材料的采集、处理(包括实验)数据信息的数据结构优化设计。 • 系统实现对用户的分级管理。对用户的权限进行界定,不同专业用户对只能对不同领域的数据进行查询、录入、修改、报表(各类标签)打印等操作。 • 系统实现数据批量导入和导出所需数据,导出数据格式满足国际种质资源信息交换需求。
种子系统 外部访问模块 业务处理模块 系统维护模块 采集信息管理 种子信息统计 标 签打印 鉴定信息管理 处理信息管理 库存信息管理 种子信息查询 查 询 统 计 业务字典管理 用户权限管理 系统管理 数据采集、处理的技术和方法 功能模块
工作成效 • 初步实现了野生植物种质资源信息数据从野外采集-登记-处理-鉴定-入库等所有环节业务数据采集、处理的信息化,保证了种质资源库所有入库种质资源信息数据的完整性、科学性和系统性,为“数字化种质资源库”目标的实现、真正意义上的种质资源共享服务的实现奠定了良好的基础。
工作成效 • 开通了中国西南野生生物种资源资源库网站信息平台http://www.genobank.org,初步实现了野生植物种质资源数据信息的分级共享和服务。