1 / 56

成果地质资料电子文件 应采用开放文档格式

成果地质资料电子文件 应采用开放文档格式. 朱学立 吴继臣 马海新. 河南省地质调查院 二 00 六年八月. 摘 要. 本文汇总了国土资源部成果地质资料电子文件汇交格式规定的文件格式,指出了采用二进制封闭文件格式存在的主要问题,分析了地质电子文件格式的需求,最后提出了建立地质图文更新机制应当采用开放电子文档格式的建议。. 摘 要. 1引言 2成果地质资料电子文档的现状 3目前电子文档格式的主要问题 4对文档格式的需求 5国外进展情况 6结束语. 1. 引言.

keena
Download Presentation

成果地质资料电子文件 应采用开放文档格式

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. 成果地质资料电子文件应采用开放文档格式 朱学立 吴继臣 马海新 河南省地质调查院 二00六年八月

  2. 摘 要 本文汇总了国土资源部成果地质资料电子文件汇交格式规定的文件格式,指出了采用二进制封闭文件格式存在的主要问题,分析了地质电子文件格式的需求,最后提出了建立地质图文更新机制应当采用开放电子文档格式的建议。

  3. 摘 要 1引言 2成果地质资料电子文档的现状 3目前电子文档格式的主要问题 4对文档格式的需求 5国外进展情况 6结束语

  4. 1. 引言 在丙戌年大年初一,中国人民的传统节日,全国地质工作者收到了一个大礼包,国务院办公厅下发了国发[2006] 4号文,国务院关于加强地质工作的决定。在《决定》中,要求建立地质图文更新机制,为社会提供有效快捷的地质信息服务。

  5. 1. 引言 建立地质图文更新机制有三个方面的要求,第一,在工作区域上,重点安排在重要经济区域,重点成矿区带,重大地质问题地区;第二,在工作方法上,要按照多目标、多学科、多技术的要求综合开展工作;第三,在专业分工上,要系统开展区域地质、地球物理、地球化学和遥感地质等调查

  6. 1. 引言 2001年,国土资源部制定了《成果地质资料电子文件汇交格式》,格式规定了地质资料电子文档文字、表格、图形和图片的保存格式,为地质资料的数字化服务网上查询打下了基础,为地质资料的长期保存制定了规范,为建立地质资料的图文更新机制提供了技术保障。

  7. 1. 引言 但是越来越明显的趋势表明,目前封闭的电子文档格式逐渐成为地质资料交流共享的桎梏,增加了地质资料的使用成本,抬高了地质资料保存数据的风险。长此以往,整个地质系统都会因此付出巨大代价。

  8. 1. 引言 作者希望通过本文的分析,宣扬建立地质资料电子文档采用开放文档格式标准的重要性和紧迫性,并希望能够引起政府决策部门的关切和注意,未雨绸缪总比亡羊补牢要强的多。

  9. 2 电子文档的现状 在国土资源部《成果地质资料电子文件汇交格式》中,将成果地质资料电子文件定义为完整反映成果地质资料内容的各类电子文件总和。成果地质资料电子文件分为正文、附件、附表、附图、审批文件和其它六类;

  10. 2 电子文档的现状 正文类是指全部正文, 附表类是指除正文插表外的各种表格,附图类是除正文插图外的各种图件,审批类是指成果地质资料经评审验收,评审认定或鉴定所形成的文件,其它类是指成果地质资料中上述类以外的内容。

  11. 2 电子文档的现状  格式中还指定了电子文件命名的规则和方法。  文字部分排版格式统一采用Word软件中文简体编辑排版,  附图类文件格式采用JPEG或PDF格式。

  12. 2 电子文档的现状  纵观表1中所列举的部分不同软件的文档格式,除了图像类具有开放的文档格式之外,其它软件仍然采用了封闭的文档格式。兼容这些采用封闭格式的软件相对更加困难。封闭的文件格式不但使地质资料的开发性遭到了质疑,也使得地质资料的保存过分依赖于某一公司,将地质资料的保管推倒了万劫不复的地步。

  13. 2 电子文档的现状 花无百日红,人无千日好,作者也衷心希望这些公司能够长久生存下去,更希望能够越办越好,但历史经验和科学规律告诉我们,任何事物都有其生长壮大消亡的过程,在这个世界上百年老店又有几何,何况是在发展极其迅速的软件行业。

  14. 3封闭文档格式的主要问题 电子文件采用封闭的文档格式究竟有什么危害呢?为什么兼容封闭文档格式越来做越困难呢?现在有什么好的解决办法呢?地质资料电子文档应该向什么方向努力才能根本解决这个问题呢?让我们先了解采用成果地质资料电子文件采用封闭格式存在的主要问题。

  15. 3主要问题 3.1格式信息不完整 所谓封闭的软件文档格式,也就是说无法通过合法途径获得文档格式的完整、准确的描述信息。早期的办公软件如WordStar、VisiCalc、Lotus 1-2-3、dBase功能相对简单,文档结构也比较简单,没有复杂的加密措施,通过努力就可以 “猜测”出其中的内部逻辑结构;

  16. 3主要问题 3.1格式信息不完整 而对于功能复杂、数字签名和加密功能很发达、且可能含有某些特意的“噪声”数据的现代软件的文档格式来说,即使是可以通过观察数据流和反复试验来猜测其内部结构,但是实际上也是不可能确保100%地准确了解,即所谓“完全兼容”和“精确兼容”实际上是“不可能完成的任务”,也是永无止境的负担。

  17. 3主要问题 3.1格式信息不完整  而且对于嵌入数字权限管理模块的软件文档来说,脱离原软件系统甚至很可能是根本无法阅读的。封闭的软件文档格式使得不同软件间的完全、透明的互操作难以实现。

  18. 3主要问题 3.1格式信息不完整  对于成果地质资料电子文件来说,封闭的文档格式的另一个巨大隐患是此格式的文档无法稳妥地长期保存。因为封闭的文档格式只有用特定的专有软件才能完全读取其内部信息,它的互操作性很差。

  19. 3主要问题 3.1格式信息不完整  成果地质资料在长期保存的过程中无法确定未来仍然可以获得该特定的专有软件来访问这些文档。对于需要保存年代久远的成果地质资料,如果因为使用了封闭的文档格式,未来可能而最终无法读取这些珍贵的资料,那将成为巨大的损失。

  20. 3主要问题3.2 有限制的许可方式  即使某些办公软件文档格式是公开的,但是相关的许可限制可能会导致该文档格式实际上无法广泛使用。比如,在微软Office 2003 XML文件格式规范附带的法律声明和专利许可证中,就明确要求根据该格式规范编写的软件必须附带微软的相关专利许可证声明,并且不得再分发该许可权利,它的目的实际上就是限制其竞争对手实现兼容软件。

  21. 3主要问题3.2 有限制的许可方式  该XML文件格式规范中的专利许可状况也是未知的,而微软正在努力为其在世界各国申请相关专利。该专利许可证也并未注明是永久授权,也就是说微软可以随时收回或停止其许可。

  22. 3主要问题3.2 有限制的许可方式 另外一些相关的文档格式可能是有著作权限制的,比如Adobe公司关于PDF文件格式规范中的著作权声明就表示该规范只可以用来编写阅读和保存成PDF文件格式的软件,但是并未明确表示可以用来制作编辑PDF文件的软件,这也是以PDF为交换文件格式的潜在风险。

  23. 3主要问题 3.3 供应商依赖性 封闭文件格式一个很严重的问题是特定供应商的依赖性。由于文档格式封闭,只有软件著作者的供应商具有访问文档结构数据的完全能力,并享有相关的软件著作权、甚至专利权。如此以来,用户掌握自己的文件的能力要依赖于该软件厂商的“善意”,而无法真正拥有自己制作的文件中的数据信息。

  24. 3主要问题 3.3 供应商依赖性  封闭文件格式另一个严重问题是扩展性相当差。由于大多数封闭的软件文档格式都是采用二进制方式存储数据,所以在遇到软件的功能改善和提高时通常都不得不重新设计文件格式,以至于一个软件的不同版本间所支持的缺省文件格式相差很大。

  25. 3主要问题 3.4 庞大的文件尺寸 封闭的文档格式通常尺寸相当庞大,这是因为其内部保存了诸多软件相关的冗余信息和隐藏信息。大体积的文件不适于进行保存、归档和传输,尤其会对通过网络传输造成很大阻碍,这对于需要大量归档并长期保存的机构来说,需要的存储空间和资金投入都是非常庞大的数字,较小尺寸的文档具有明显的成本优势。

  26. 3主要问题   3.5 互操作性差 封闭的软件文档格式会导致不同软件间的互操作性差,进而阻碍不同软件间的良性竞争和技术创新,使软件厂商固守现有的用户和市场而失去改进的动力。

  27. 3主要问题   3.5 互操作性差 互操作性差还导致软件用户被锁定在封闭的专有格式、以及其相关的软件之上,从而必须使用为私有文件格式开发的兼容工具,而且无法保证这些工具是可以完全访问这些数据的。而且开发这些兼容工具也增加了软件开发的成本,提高了用户采购软件的费用,也为售后服务和第三方软件支持的附加费用埋下了伏笔。

  28. 4 成果地质资料电子文件格式需求 成果地质资料电子文档往往需要在几十年或者更长的时间内仍能查阅与引用,而且公益性、基础性的地质资料有更多的机构或人群要访问其中的文档,不管他们现在或者将来使用什么样的设备或者什么样的软件。成果地质资料对文档格式的要求有以下几个方面。

  29. 4 格式需求 4.1 基于XML的格式 由于XML已经可用,政府希望采用可以使用XML的单一格式,因为它具有众多优点:易于处理标准、具有灵活性、文档易于扩展到任意大小、便于修复(恢复)以及相互兼容。譬如说,二进制格式在扩展性方面存在严重问题,如果用户为某个值分配一个字节,随后会发现需要的不仅仅是一个字节,而且很难进行改变,而换成是XML,你只要写入较大的号码。

  30. 4 格式需求 4.1 基于XML的格式 如果使用XML格式,修复及恢复受损数据也要简便得多,杂乱的二进制文件常常无法恢复,而未详细说明的二进制格式情况更糟糕(如果程序显示“无法加载”,你就毫无办法,即便文件在变得杂乱前有部分数据是可以恢复的)。要是换成XML,如果一些数据变得杂乱,其余的所有数据通常可以恢复,所以生成程序即使出现错误,通常仍能够生成基本上正确的数据,又可以防止信息丢失。

  31. 4 格式需求 4.1 基于XML的格式 选择XML的最大优势就是,任何人都能够极其方便地迅速开发能够读取、写入及处理数据的工具。如果你只能用一种程序来读取格式,那么即便这种格式不尽如人意(就像微软目前的二进制格式一样),它照样有生存空间。

  32. 4 格式需求 4.1 基于XML的格式  但现在一切都联网了,大家希望能够迅速从多个来源获取数据片段,用新方法加以结合,而这需要具有灵活性极高、使用极方便的一种数据格式,以便任何工具都能使用。XML就是为了实现这种功能而设计的,所以人们想要某种XML格式。

  33. 4 格式需求4.2 独立完整的格式规范  从长远来看,所有格式都将消失。大家一度使用WordStar作为文字处理程序。而今天,甚至没有人使用可读取这种格式的过滤器。幸好,WordStar格式类似ASCII,因而基本上可以恢复。

  34. 4 格式需求4.2 独立完整的格式规范 如今,你无法用现在的PowerPoint读取一些重要的PowerPoint 4文件——政府着眼的是几十年、几百年之后的情景。然而这种无法读取的情况却有发生,因为(现已过时的)微软Office格式仍缺少规范。没有规范,也就没有标准。

  35. 4 格式需求4.2 独立完整的格式规范 可以肯定:微软的格式不可能像过去旧的二进制格式那样在将来成为主导性的办公文档格式,除非发生戏剧性的局面。Word和Excel等原有的二进制格式已经变得极其普遍,几乎每个办公套件都能够读写这种格式。

  36. 4 格式需求4.2 独立完整的格式规范 但由于没有规范,又加上基于有限的二进制格式,这种普遍性反而变得问题重重。这些老格式基本上未详细说明、难以处理,而且过于依赖老版本微软Office的底层结构。连微软的最新版本Office也经常无法读取这种格式。微软更新程序后,原有文档无法读取的可能性越来越大。

  37. 4 格式需求  4.3 多种实施方法 要确保用户的所有重要需求得到满足,不想被哪家厂商所套牢,必须有多种实施办法。条件就是让众多不同组织一起制订规范,并吸纳公众的反馈意见。现在只有一家厂商真正支持微软的文档格式。注意,拥有多个实施标准才是确保规范真正提供兼容性的最佳方法。

  38. 4 格式需求 4.4 谁都能实施规范 谁都能实施文档格式规范,封闭的文档格式却不能,微软的文档格式也不能。如今,有许多人和许多程序需要访问文档里面的数据。因而,谁都能实施文档格式就至关重要,尤其是因为这是使用XML的意义所在。这个意义对有些人而言理解特难,不妨细述一下。

  39. 4 格式需求 4.4 谁都能实施规范  微软对该格式采用了这样的许可方式: “你可以免费使用,但前提是你不是我的竞争对手。”这对此类格式来说无疑是一剂毒药,因为政府希望竞争。微软自己也承认需要开放标准,声称“改用开放、提供文档说明、免费使用的文档格式确实非常重要……因为这样可以让你的文件完全属于你,进而可以控制它们。”说得真好!但实际行动并非如此。

  40. 4 格式需求 4.4 谁都能实施规范  为了满足这样的要求,任何此类格式都要可以被任何专有程序和任何开放源代码软件实施,至少使用各自典型的许可证。15年前,人们往往忽视开放源代码,而如今市场上拥有各种开放源代码软件。如今,从公开合理的角度讲,政府不可能选用禁止使用最流行的开放源代码软件许可证的实施标准。

  41. 4 格式需求 4.4 谁都能实施规范  政府应该按自己的要求来行事:   提出合理要求,然后选择满足要求(这里指兼容的格式)的供应商。这不是跟哪一个公司过不去。

  42. 5 国外进展情况 去年9月,美国马萨诸塞州正式签文支持OpenDocument标准作为办公软件、文本文档、电子表格、图表及图形文档(如图纸和演示报告)的标准格式。该州的所有政府部门都要在2007年1月1日前迁移至OpenDocument,而不是迁移至微软新的Office XML格式(即微软Office Open XML文件格式)。

  43. 5 国外进展情况 接下来可能还会有更震惊的消息。美国马萨诸塞州、欧洲及其他地区的政府官员一再告诉微软不要再故作姿态,而是要真正满足客户的需求: 没有限制地提供完全兼容的功能。然而微软仍然坚持不愿满足客户的需求,结果久而久之,客户抛弃了微软的格式。马萨诸塞州只是开了个头罢了。

  44. 5 国外进展情况 世界各国的政府正在开发标准,准备积极采用基于XML的办公文档格式。业界其余人士可能会亦步亦趋,因为他们有着同样的需求:——需要长期保存和方便地交换文档。多国政府出于自身的考虑,希望并寻求Office的替代品,

  45. 5 国外进展情况 IT厂商则在试图撬动微软对桌面软件市场的控制,去年11月份,由IBM和Sun公司牵头召开了ODF峰会,讨论了关于如何促进OpenDocument普及的问题。与会的包括多家业界组织和至少13家高科技公司的代表,其中包括甲骨文、Google、Novell、Red Hat、Adobe、冠群、Corel、诺基亚和英特尔等。

  46. 5国外进展情况 前不久,印尼研究和技术部宣布,它将把Java桌面系统(JDS)实施在Linux上,作为全国统一的标准桌面。该部门计划在全国统一安装JDS,从政府相关部门开始着手。JDS包括StarOffice,预计很快就会发布OpenDocument实施标准,作为其默认的文件格式。随着时间的推移,这必然会成为不可阻挡的潮流,而欧盟可能会是背后的主要推动力。

  47. 5国外进展情况 比利时政府6月26日宣布,批准政府机构的文件使用OpenDocument格式,这使微软Office再次受到打击。比利时政府是世界上第二个采用OpenDocument格式的政府机构。到2007年9月,比利时联邦政府所有机构使用的软件都必须能够阅读以OpenDocument(ODF)格式存储的报告、电子数据表、演示文稿和其他类型的数据文件。

  48. 6 结束语  电子文件的保管与维护和传统方式截然不同,其数字化特性决定了保管的复杂性和维护的难度性,如何确保电子文件内容的完整性、真实性以及载体的安全性是管理和维护电子文件的关键。针对上述发现的问题,在此提出以下针对性意见,以进一步推动地质图文更新机制的建设。

  49. 6结束语 6.1 建立科学的归档制度 成果地质资料是广大地质工作人员辛勤工作的结晶,保管好是地质工作的重要任务之一。因此必须建立科学的归档制度,在成果地质资料形成以后,不但要及时地建立相应的数据库,同时应按规范要求制备合格的电子文档,并汇缴保存。

More Related