(12)发明专利申请
(21)申请号 CN201610317795.8 (22)申请日 2016.05.12 (71)申请人 大连理工大学
地址 116024 辽宁省大连市甘井子区凌工路2号
(10)申请公布号 CN106021225A
(43)申请公布日 2016.10.12
(72)发明人 黄德根;田雪
(74)专利代理机构 大连理工大学专利中心
代理人 温福雪
(51)Int.CI
G06F17/27; G06K9/62;
权利要求说明书 说明书 幅图
(54)发明名称
一种基于汉语简单名词短语的汉语最长名词短语识别方法
(57)摘要
本发明属于人工智能的自然语言处理子领
域,提供了一种基于汉语简单名词短语的汉语最长名词短语识别方法。包括如下步骤:S1数据预处理;S2选用SVM方法,训练汉语SNP识别模型,识别出汉语SNP;S3使用缩略替换方法简化文本,得到新的训练及测试语料;S4在经S3处理得到的新语料中,再次提取样本集,针对简化
后的汉语MNP进行模型训练、识别;S5还原语料,还原后的汉语MNP为本方法最终识别结果。本发明的汉语MNP识别方法可以降低汉语MNP在自动识别中因其长度过长、语义及结构复杂等因素带来的不利影响,因此能有效提高汉语MNP的识别效果。
法律状态
法律状态公告日2016-10-12 2016-10-12 2016-11-09 2016-11-09 2018-12-21
法律状态信息
公开 公开
实质审查的生效 实质审查的生效 授权
法律状态
公开 公开
实质审查的生效 实质审查的生效 授权
权利要求说明书
一种基于汉语简单名词短语的汉语最长名词短语识别方法的权利要求说明书内容是....请下载后查看
说明书
一种基于汉语简单名词短语的汉语最长名词短语识别方法的说明书内容是....请下载后查看
因篇幅问题不能全部显示,请点此查看更多更全内容