110 likes | 278 Views
先秦文献的古今字、通假字标注. 汇报人: 吉志薇 作者:冯敏萱 刘浏 南京师范大学 文学院. 本研究提出了利用 《 汉语大词典 》 、 25 种先秦传世文献和十三经注疏等各类资源构建古今字、通假字知识库的方法,希望能为更有效地利用古汉语资源进行信息处理提供借鉴。同时针对不同类型的先秦语料进行实验,探讨了知识库在古今字、通假字标注中的应用;为总结出先秦时期古今字和通假字的特点,进行更为细致的断代性研究打下了基础。. 实验贡献和意义:. 构建古今字、通假字标注知识库: 古今字、通假字频次统计表(利用 《 汉语大词典 》 、汉达文库的 25 种先秦传世文献和十三经注疏构建)
E N D
先秦文献的古今字、通假字标注 汇报人: 吉志薇 作者:冯敏萱 刘浏 南京师范大学 文学院
本研究提出了利用《汉语大词典》、25种先秦传世文献和十三经注疏等各类资源构建古今字、通假字知识库的方法,希望能为更有效地利用古汉语资源进行信息处理提供借鉴。同时针对不同类型的先秦语料进行实验,探讨了知识库在古今字、通假字标注中的应用;为总结出先秦时期古今字和通假字的特点,进行更为细致的断代性研究打下了基础。本研究提出了利用《汉语大词典》、25种先秦传世文献和十三经注疏等各类资源构建古今字、通假字知识库的方法,希望能为更有效地利用古汉语资源进行信息处理提供借鉴。同时针对不同类型的先秦语料进行实验,探讨了知识库在古今字、通假字标注中的应用;为总结出先秦时期古今字和通假字的特点,进行更为细致的断代性研究打下了基础。
实验贡献和意义: • 构建古今字、通假字标注知识库: • 古今字、通假字频次统计表(利用《汉语大词典》、汉达文库的25种先秦传世文献和十三经注疏构建) • 专书通假字数据库(利用文字学、训诂学研究文献) • 中研院语料假借字库(利用台湾中研院上古汉语标记语料构建)
1.古今字、通假字频次统计表 • 从《汉语大词典》中提取了 • 242组古今字(利用关键字“古字”和“后作”,如亞 “≦婭≧”的古字,塗后作“鍍”) • 4577组通假字(利用“通”或“同”在释义中作首字的特征,如,丂同“≦考≧”,亂通“≦率≧” ) • 根据汉达文库的25种先秦文献语料 • 同时利用十三经注疏补充古今字、通假字频次信息
2.专书通假字数据库 • 文献来源:康晓玲.试论通假字[D].山西大学硕士研究生学位论文.2005. • 葛树魁.《诗经》通假音考[J].连云港师范高等专科学校学报,2007,(2):66~69,96. • 崔竹朝,周晓波.《荀子》通假研究(上)(下)--《荀子》通假的测查统计[J].石家庄职业技术学院学报,2002,14(3):33~35. 2003,15(1):28~31. • 聂中庆,李定.郭店楚简《老子》通假字研究[J].语言研究,2005,25(2):103~106. • 武丹丹.《墨子》通假字音义关系研究[D].兰州:兰州大学硕士学位论文,2008.
2.专书通假字数据库 • 字段:通假字、本字、含义、例句、出处、频次、篇目数、备注 • 规模:225个通假字,共473频次。涉及5种专书:《墨子》、 • 《荀子》、《孟子》、《诗经》、《老子》
3.中研院语料假借字库 从台湾中央研究院的上古汉语标记语料库中提取标记为“/jj”的词(即假借字)及句子,但无对应本字信息。 共收录了507个假借字(涉及23种文献,1070频次)
实验贡献和意义: • 总结不同类型语料的标注方法 • 古今字辅助标注工具可以提示语料中古字对应的今字并给出相关的频次信息 • 《墨子》、《荀子》、《孟子》、《诗经》、《老子》通假字标注适用通假字频次统计表+专书通假字数据库+中研院语料假借字库 • 《孝经》、《公羊传》通假字标注适用通假字频次统计表+注疏文献信息 • 《楚辞》、《孙子兵法》、《吴子》通假字标注适用通假字频次统计表+词性标注语料
基于知识库的自动标注方法 • 基于古今字频次统计表标注古今字 • 基于专书通假字数据库标注通假字 • 基于通假字频次统计表和注疏文献标注通假字 • 基于通假字频次统计表和词性标注语料标注通假字
实验贡献和意义: • 知识库在古汉语信息处理中的应用等级 • 传统训诂学成果最为可靠,但专书通假字数据库规模较小 • 中研院语料假借字库可以成为通假字标注的有益补充 • 没有上述两种资源时,注疏文献和词性标注语料亦可以提供部分信息