660 likes | 1.06k Views
《 出版物上数字用法 》 解读 詹卫东 北京大学中文系. 国家语委语言文字规范标准培训 · 北京 · 2012-12-15. 提纲. 历程 理论 实践 问题. 一 历程. 国家语言文字应用重点科研项目:出版物上数字用法规范修订(项目编号: BZ2005-03 ), 2006 年。(计划两年完成) 《出版物上数字用法》 中华人民共和国国家标准 GB/T 15835-2011 , 2011 年 7 月 29 日发布, 2011 年 11 月 1 日起实施。标准文本由 中国标准出版社 于 2011 年 11 月出版。
E N D
《出版物上数字用法》解读詹卫东北京大学中文系《出版物上数字用法》解读詹卫东北京大学中文系 国家语委语言文字规范标准培训·北京· 2012-12-15
提纲 • 历程 • 理论 • 实践 • 问题
一 历程 • 国家语言文字应用重点科研项目:出版物上数字用法规范修订(项目编号:BZ2005-03),2006年。(计划两年完成) • 《出版物上数字用法》中华人民共和国国家标准GB/T 15835-2011,2011年7月29日发布,2011年11月1日起实施。标准文本由中国标准出版社于2011年11月出版。 • 《〈出版物上数字用法〉解读》语文出版社,2012年9月出版。
成果封面 http://www.ywcbs.com/books/more.asp?id=181 http://www.sac.gov.cn/gjbzgg/201112/
确定修订原则,撰写新标准文本(2007年7月 — 2008年2月 8个月) • 多次征求意见,对标准文本进行反复修改(2008年4月— 2010年9月) • 《出版物上数字用法》发布(2011年7月) • 《〈出版物上数字用法〉解读》出版(2012年9月) 2006 — 2012 • 开展广泛的调研 (2006年3月 — 2007年6月 18个月)
调研工作 2006年3月 — 2007年6月 1 • 调查语料 • 调查文献 网络语料 传统语料 百度、谷歌、门户网站、论坛…… http://ccl.pku.edu.cn 对原标准的评论和讨论文章 关于数字用法的学术研究文献 国外数字用法规范状况调查
数字在文本中的用法类型 • 计量 17 种具体用法 • 计时 10 种具体用法 • 编号 24 种具体用法 • 概数 3 种具体用法 • 成词 10 种具体用法 • 竖排文本 1 种具体用法 65 种类型
数字在文本中的用法类型:计量 17种具体用法
数字在文本中的用法类型:计时 10种具体用法
数字在文本中的用法类型:编号 24种具体用法
数字在文本中的用法类型:概数 3种具体用法
数字在文本中的用法类型:成词 10种具体用法
语料中阿拉伯数字和汉字数字的分布对比 数据来源:谷歌网站。查询日期:2006-11-29
国外数字用法规范考察 • Gregg Reference Manual: A Manual of Style, Grammar, Usage, and Formatting(《Gregg英语写作参考手册》) • 2004年McGraw Hill(麦格劳·希尔)公司出版了该书的第10个修订版。国内的中译本是2003年出版的,是该书第9版的译本(由柯江华、冯桂媚翻译,以《最新英文商务写作手册》为书名在机械工业出版社出版)。该书第四章是关于英文出版物当中有关如何选择和使用数字表达形式的规范。
国外数字用法规范考察(续) • 《Gregg英语写作参考手册》第四章分为两个部分:第一部分描写了数字表达的基本规则,共6条规则;第二部分描写了数字表达的详细规则,共64条规则,两个部分合计70条规则(原书中规则的标号是从第401条到第470条)。
国外数字用法规范考察(续) • 跟中文写作一样,英文写作中对于数字是选择阿拉伯数字书写形式还是选用英文单词书写形式,并没有一个泾渭分明的界限。一般可以从表达效果的角度把两种数字书写系统的区别表述为: • 阿拉伯数字形式起到的表达效果是醒目和紧凑 ,适于一般的不需要太正式的和太庄重的场合 。 • 英文单词书写形式起到的表达效果则是比较正式庄重。因为数字的英文单词跟周围的其他英文单词具有同样的字母序列形式,因而没有凸显和被强调的感觉。 • 阿拉伯数字形式和英文单词数字形式的具体选用和使用规则都建立在上面这一基本区分的基础上。
国外数字用法规范考察(续) (1)要求数字表达形式的编码长度尽可能短,这样便于书写和理解。 (2)要求在一段文字中,同类型的数字尽可能采用相同的表达形式。 (3)数字的表达形式应考虑传统习惯。 (4)不同的领域的文体可以根据领域自身的特点调整数字的表达形式。 (5)对于不同的特定的使用环境,可以分别制订详细的使用规范,但一般每一种使用环境都应该允许写作者有几种可选的表达形式,采取从宽的原则。
国外数字用法规范考察(续) (例1) 21,000,000 twenty-one million 21 million 。 (例2)一段文字中,有的数字大于10,有的小于10,如果大于10的数字采用了阿拉伯数字形式,那么小于10的数字也会采用阿拉伯数字表达形式。 (例3)位于句首的数字以及数值不太确定的数字通常采用英文单词表达形式。 (例4)科技出版物中一般多采用阿拉伯数字的表达形式。 (例5)日期、金额、序数词等不同的环境中,选用何种数字书写系统会有不同的情况。就可以分别制订规则。
征求意见 2008年4月 — 2010年8月 3 • 征求意见的对象:(1)出版社、(2)新闻媒体、(3)语文教育界、(4)辞书研究和编纂机构、(5)语言文字研究单位、(6)信息科学技术研究单位、(7)信息技术公司、(8)海外相关研究机构
二 理论 • 数字的主要表达功能是什么? • 数字的表达形式与表达功能之间是什么关系? • 影响人们选择不同数字书写形式的因素是什么? • 选择数字的书写形式应遵循哪些原则? 参看:《〈出版物上数字用法〉解读》上编,第1.1,1.2节
数字的主要表达功能 1 • Stevens(1946)指出,统计测量所获得的数据可根据数据所适用的运算尺度级别的不同分为四级 • 定类 数据 • 定序 数据 • 定距 数据 • 定比 数据 例:《学科分类与代码》 定性 编号功能 Nominal 例: 1 满意 2 很满意 3 非常满意 Ordinal 例: 摄氏温度 定量 计量功能 Interval 例: 工资收入 Ratio Stevens, S.S (1946). On the Theory of Scales of Measurement, Science, Vol.103, No.2684 (June 7, 1946), pp.677–680.
数字的主要表达功能(续) • 百分之百地肯定、千万要注意、一百八十度大转弯 • 911,360 • 零容忍、不管三七二十一、MP3 • 故国三千里,深宫二十年,一二三四五、上山打老虎 成词、构词、修辞
数字的书写形式与表达功能之间的关系 2 • 数字的表达功能 • 数字的书写形式 • 阿拉伯数字 | 汉字数字 • 精确计量 • 模糊计量 • + + • - + - • 计量 • 编号 • 成词 - • + + - • - + + + -
影响人们选择不同数字书写形式的因素 3 (1)功能因素,即“需要用数字做什么?” (2)效率因素,即“需要多少数字来做?” 实用功能 审美功能 情感因素 理性因素
选择数字书写形式的原则 4 • 编码效率原则 • 尊重传统原则 • 表义清晰原则 • 系统一致原则 编码短的书写形式优先 历史悠久的书写形式优先 无歧义的书写形式优先 无矛盾的书写形式优先
表义清晰原则示例 (1) a 他在等晚1点的航班 b 他在等晚一点的航班 (2) a 涨1点你就可以卖了 b 涨一点你就可以卖了
四个基本原则之间的关系 • 编码效率原则会突出阿拉伯数字的功用 • 尊重传统原则会突出汉字数字的功用 • 表达清晰原则会对前两条规则进行约束,无论是阿拉伯数字,还是汉字数字,其具体的使用形式,都应该追求清晰、准确的表达效果,比如不能因为强调编码效率高,就省略过多的成分,造成歧义可能性增加,这样反而导致最终的交际效率下降。 • 系统一致原则(同类别同形式原则)将更多的选择主动权交给文本的作者,就是由作者来决定文本中哪些数字是同类的表达功能,那么这些数字就应该选用相同的表达形式,不能随意换用不同的表达形式。
四个基本原则之间的关系(续) • 数字用法的四个原则各有自己的倾向,在具体实践中,遵循不同的原则可能会选用不同的数字形式,从而出现原则之间的冲突。如果出现这种情况,应该有更基本的“元规则”(meta rule)来决定如何处理冲突。这个元规则就是:应该选用适用原则多的那种数字形式,而不应该选用明显违反某个原则的那种数字形式。
四个基本原则之间的关系(续) 例1 a 今年产值达到五亿多,比上年增加了1.24亿元。 b 今年产值达到5亿多,比上年增加了1.24亿元。 例2 a 这么大的孩子每天尿六七次或10余次都是正常的。 b 这么大的孩子每天尿六七次或十余次都是正常的。 例3 a 你等我1分钟,就1分钟,很快的! b 你等我一分钟,就一分钟,很快的!
三 实践 • 出版物上数字用法的九类常见情况 • 《出版物上数字用法》新标准与原标准对比,主要修订有哪些? • 《出版物上数字用法》跟相关的国家语言文字标准及有关规范的关系
出版物上数字用法的九类常见情况 1 • 数字和时间 • 数字和普通词汇 • 数字和模糊计量 • 数字和标点符号 • 数字表达的省略形式 • 数字表达的准确性 • 阿拉伯数字与汉字数字同时使用 • 阿拉伯数字与汉字数字换用 • 数字的排版 64 个 问答 《〈出版物上数字用法〉解读》,上编,第1章,1.3 — 1.11
数字用法示例 • 2003年餐饮消费增长幅度为16%,2004年1季度近20% • 《20几岁一定要知道的56个经济常识》 • 打死9人,打伤数10人,抓走200余名乘客 • ……收录诗人10余年200余首诗歌 • “金三角”地区当年有60~130吨海洛因进入国际市场 • 这个孩子大概八、九岁的样子 • 今天下午一、二组的同学打扫教室,三、四组的同学打扫清洁区 • 短道世界杯加拿大站 中国夺女子3千米接力金牌 • 1个苹果加3个苹果等于几个苹果 √ × ? × √ √ × √ √ √
《出版物上数字用法》跟相关标准的关系 3 1 ) GB 3100—93 《国际单位制及其应用》 GB3100—93对数字和计量单位共现时的表达形式做了规定,就是计量单位写在相关的全部数值(比如表达数值范围的两个数字)之后,也就是说,第一个数字之后不需要写计量单位。我们认为,这种规定在科技文献中是合理的,但不能理解为是所有出版物上的数字用法都必须遵循的强制规定。如果多个数值后分别附加计量单位对表义清晰有帮助,那么在多个数值后分别使用计量单位也有合理性,特别是在日常语言使用场合,跟科技文献中的语言使用还是有区别的,不应该一概而论,做出硬性的规定,做非此即彼的取舍。 a. 5~10 kg b. 5kg ~ 10kg c. 1 ~ 1斤2两d. 1两~ 1斤2两 × √ √ √ 《〈出版物上数字用法〉解读》,上编,第2章
《出版物上数字用法》跟相关标准的关系 2 ) GB 3101-93 《有关量、单位和符号的一般原则》 GB 3101—93的3.3.1节对数字的印刷形式做规定时指出,“为使多位数字便于阅读可将数字分成组从小数点起向左和向右每三位分成一组组间留一空隙,但不得用逗号、圆点或其他方式”。GB/T 15835—2011《出版物上数字用法》对多位数分节的处理意见跟原《出版物上数字用法的规定》保持一致,仍然允许使用“千分撇”和“千分空”两种形式,并进一步指出,两种形式各有适用场合,可根据实际需要选择。 a. 1,241,100,000 b. 1∶50 000 000 √ √ 《〈出版物上数字用法〉解读》,上编,第2章
《出版物上数字用法》跟相关标准的关系 3) GB 3102.11—93 《物理科学和技术中使用的数学符号》 GB 3102.11—93的2.4节“杂类符号表”(第10页)中规定:用“~”表示数字范围(the range of numbers)。GB/T 15835—2011《出版物上数字用法》允许用“~”和“—”两种连接号,但强调系统一致原则,具体就是“同类别同形式”原则,不能在同一个使用场合中随意换用这两种连接符号。 • 李白(701 — 762) b. 北京南 — 徐州东 • c. 3% ~ 5%d. 第一 ~ 五课 《〈出版物上数字用法〉解读》,上编,第2章
《出版物上数字用法》跟相关标准的关系 4) GB/T 15416—94 《中国科学技术报告编号》 GB/T 15416—94对科学技术报告的编号的具体形式做了详细的规定。其中3.2节规定了中国科学技术报告号结构,是以CSRN为前缀,由字母、数字字符组成的代码。4.2节规定顺序段该由年份、顺序号组成,年份用公元年的后两位数字表示,占2字符位。顺序号用四位数字表示,占4字符位。顺序号四位数字仅起序号作用,该段最长8个字符。4.3节规定报告代码后缀由任意长度的字母、数字组成。4.3.1节规定报告分类号采用国家标准GB/T 13745中学科分类与代码的一级类号。分类号由数字组成,占3个字符位。4.3.2节规定报告密级采用国家标准GB 7156规定的文献保密等级的数字码表示。附录部分列出了国务院各部、委名称代码,中国省、直辖市、自治区代码,学科分类与代码。《出版物上数字用法》在4.1.2节的示例中列举了大量的编号实例,但没有涉及技术报告的编号。这方面可参考GB/T 15416—94的规定。 《〈出版物上数字用法〉解读》,上编,第2章
《出版物上数字用法》跟相关标准的关系 5) GB 9704—1999 《国家行政机关公文格式》 GB 9704—1999的8.1.1节规定公文份数序号使用阿拉伯数码,并标识在版心左上角第1行。8.1.5节规定发文字号中的序号、年份都使用阿拉伯数码标识,用六角括号“〔〕”括入,序号不编虚位,不加“第”字。8.2节规定了公文正文中的数字、年份不能同行,并对成文日期、印发日期做了具体规范。8.2.5节规定公文成文日期用汉字将年、月、日标全,“零”写为“○”。《出版物上数字用法》有关日期中使用汉字数字形式的规定与GB9704—1999相同。 《〈出版物上数字用法〉解读》,上编,第2章
《出版物上数字用法》跟相关标准的关系 6) GB/T 7714—2005 《文后参考文献著录规则》 GB/T 7714—2005的6.2节规定,著录数字时,须保持文献原有的形式,但卷期号、页码、出版年、版次等用阿拉伯数字表示。外文书的版次用序数词的缩写形式表示。8.3节有关版本的部分规定第1版不著录,其他版本说明需著录。版本用阿拉伯数字、序数缩写形式或其他标志表示。8.4.3.1节规定出版年采用公元纪年,并用阿拉伯数字著录。如有其他纪年形式时,将原有的纪年形式置于“()”内。比如1947(民国三十六年)、1705(康熙四十四年)。8.5节规定专著或期刊中析出文献的页码或引文页码,要求用阿拉伯数字著录。《出版物上数字用法》没有关于参考文献中数字表示形式的具体规定。这方面可以参考GB/T 7714—2005的规定。 《〈出版物上数字用法〉解读》,上编,第2章
《出版物上数字用法》跟相关标准的关系 7) GB/T 7408—2005 《数据元和交换格式 信息交换 日期和时间表示法》 GB/T 7408—2005规定了公历日期和时间以及时间间隔的多种表示法,其中有些具体规定跟《出版物上数字用法》的规定不完全一致。《出版物上数字用法》规定,只有在年月日的完整表达形式中才能用“-”替代“年”和“月”。而在GB/T 7408—2005中,“-”可以用于分隔时间元素“年”“月”“日”和“星期”,也可以用在年月日的不完整表达形式中,比如:“1985-04”。其次,《出版物上数字用法》中规定,四位阿拉伯数字的年份表达不可以简写为两位数字,即“1989”年不能简写成“89年”,这样可以避免产生歧义。GB/T 7408—2005的5.2.1.3节中规定“截短表示法”允许“缺省世纪”,即“1985年4月12日”可以采用基本格式,写作“850412”,也可以采取扩展形式,写作“85-04-12”。最后,GB/T 7408—2005的5.3节中提到“本标准是以现在通用的24小时计时系统为基础”,而GB/T 15835—2011《出版物上数字用法》在5.1.5节中规定,计时方式既可以采用12小时制,也可以采用24小时制。 《〈出版物上数字用法〉解读》,上编,第2章
《出版物上数字用法》跟相关标准的关系 8) GB/T 8170—2008 《数值修约规则与极限数值的表示和判定》 GB/T 8170—2008规范了科学技术与生产活动中实验测定和计算得出的各种数值在需要修约时应该遵循的规则。《出版物上数字用法》没有涉及数值的修约问题。修约值均适用阿拉伯数字表达形式。 《〈出版物上数字用法〉解读》,上编,第2章
《出版物上数字用法》跟相关标准的关系 9) GB/T 15834—2011 《标点符号用法》 五四 × √ 六一 《〈出版物上数字用法〉解读》,上编,第2章