您的当前位置:首页正文

一种基于检索结果数量的短文本相似度计算方法[发明专利]

2023-01-08 来源:欧得旅游网
专利内容由知识产权出版社提供

专利名称:一种基于检索结果数量的短文本相似度计算方法专利类型:发明专利

发明人:李琳,钟珞,袁景凌,夏红霞,刘东飞申请号:CN201110458376.3申请日:20111231公开号:CN102567537A公开日:20120711

摘要:本发明公开了一种基于检索结果数量的短文本相似度计算方法,包括如下步骤:(1)对短文本进行预处理;(2)将单个短文本和短文本的两两组合作为检索查询词分别提交给大规模语料库;(3)利用返回的检索结果数量来计算短文本两两之间的相似度。本计算方法不依赖传统的文本处理,而且能够快速和有效地得到计算结果。将短文本作为检索词,大规模语料库将返回包含该短文本的检索结果。检索结果内容包含该短文本的文本解释,而其数量可以看作是一个压缩器,蕴含着该短文本在该语料库的语义解释。

申请人:武汉理工大学

地址:430070 湖北省武汉市洪山区珞狮路122号

国籍:CN

代理机构:武汉开元知识产权代理有限公司

代理人:潘杰

更多信息请下载全文后查看

因篇幅问题不能全部显示,请点此查看更多更全内容