开题报告内容:(包括拟研究或解决的问题、采用的研究手段及文献综述,不少于2000字)拟研究和解决的问题:随着医药行业的信息化程度不断加深,在其过程中产生了大量的医药相关自然语言资源。
对这些资源进行信息处理的基础工作是对这些文本进行医药概念即命名实体的识别。
在语言中,命名实体通常作为一个整体,由人们创造,用于表示一个特定的概念。
在医药临床语境中,命名实体主要包括药名,疾病名,不良反应等医药学专业词汇。
随着命名实体仍在不断的增加,通过建立词典的方法难以完成识别工作。
命名时这些实体在构造中有着各自的规律性,故实体识别的工作也难以通过词汇形态处理的方式解决。
所以中文医药命名实体识别仍然是一项具有挑战性的工作。
传统的方法可以分为基于规则和词典的方法和基于统计的方法。
基于规则的方法主要依赖于由行业专家进行人工标注的知识库和词典。
剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付
以上是毕业论文文献综述,课题毕业论文、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。