标题: | 人名、地名、机构名自动识别的形式化策略及意义 |
---|---|
基金项目: | 2007年度安徽省高校青年教师科研资助计划项目“现代汉语缩略词语的自动识别研究”(项目编号:2007jqw104); 巢湖学院科研启动基金; |
关键词: | 中文信息处理人名未登录词书面语专名号; |
摘要: | 未登录的人名、地名以及机构名的自动识别是中文信息处理中的一个难点,自动识别技术的突破对提高汉语自动切词和句法分析的准确性有很重要的作用。本文基于书面语的特点,在标点符号的启示下,提出一种新的形式化处理策略,即在现代汉语书面语中给人名、地名以及机构名加上专名号,以便于计算机识别,从而通过原始文本的书写改革从根本上彻底解决问题。如能实行,则能一举突破这一难点,召回率和准确率都将能达到100%,而且意义重大,影响深远。 |
下载地址: |
上一篇: 浅论《直斋书录解题》在目录学史上的地位
上一篇: 大学生特殊群体的行为表现及解决方法