专利名称:多语言模型的训练方法和装置、存储介质和电子设
备
专利类型:发明专利
发明人:童丽霞,雷植程,杨念民申请号:CN202010774741.0申请日:20200804公开号:CN112749556A公开日:20210504
摘要:本发明公开了一种多语言模型的训练方法和装置、存储介质和电子设备。该方法包括:将多语言语料包和多语言共享词汇表输入至待训练语言模型中,对待训练语言模型进行训练,得到预训练语言模型,多语言语料包为包括多种语言的语料包,多语言共享词汇表中存储了对多语言语料包进行分词得到的分词集合;使用带分词标注的第一语言的第一语料集合和带分词标注的第二语言的第二语料集合,对预训练语言模型进行调整,得到意图识别模型,其中,意图识别模型用于识别第一语言和第二语言的语句所表示的语义和语义之间的关系;将多种语言的语句输入意图识别模型,得到目标多语言模型,目标多语言模型用于识别多种语言的语句所表示的语义和语义之间的关系。
申请人:腾讯科技(深圳)有限公司
地址:518000 广东省深圳市南山区高新区科技中一路腾讯大厦35层
国籍:CN
代理机构:北京康信知识产权代理有限责任公司
代理人:周婷婷
更多信息请下载全文后查看
因篇幅问题不能全部显示,请点此查看更多更全内容