140 likes | 376 Views
NiuParser 1.0.0 Beta. 总览. 中文句法语义分析系统 分词,词性标注,命名实体识别,组块分析,成分句法分析,依存句法分析,语义角色标注 C++ 语言,无别人开源代码 分析速度快,业内最好性能. 功能关系. 系统形式. 使用方法. 分词: Niuparser-v1.0.0-beta-for-research-win.exe --WS -in < 输入文件路径 > -out < 输出文件路径 > -c < 配置文件路径 > 词性标注:
E N D
总览 • 中文句法语义分析系统 • 分词,词性标注,命名实体识别,组块分析,成分句法分析,依存句法分析,语义角色标注 • C++语言,无别人开源代码 • 分析速度快,业内最好性能
使用方法 • 分词: Niuparser-v1.0.0-beta-for-research-win.exe --WS -in <输入文件路径> -out <输出文件路径> -c <配置文件路径> • 词性标注: Niuparser-v1.0.0-beta-for-research-win.exe --POS … • 命名实体识别: Niuparser-v1.0.0-beta-for-research-win.exe --NER … • 组块识别: Niuparser-v1.0.0-beta-for-research-win.exe --CHK … • 成分句法分析: Niuparser-v1.0.0-beta-for-research-win.exe --CP … • 依存句法分析: Niuparser-v1.0.0-beta-for-research-win.exe --DP … • 语义角色标注: Niuparser-v1.0.0-beta-for-research-win.exe --SRL …
分词 ctb分词测试数据,348句,13738汉字。 消耗时间:0.443sec 分词结果:最后一行“(完)”丢了
词性标注 • 标注规范:CTB规范,33个词性标记。
词性标注 • ctb标注测试数据,348句,8008个词。 • 0.568sec
命名实体识别 • 18种命名实体
成分句法分析 • 标注规范:CTB规范,23个句法标记。
依存分析 • 输出格式:CoNLL格式
语义角色标注 • 标注规范:中文PropBank。