构建人名语料识别模型的方法及装置
Abstract:
本发明公开了一种构建人名语料识别模型的方法及装置,属于信息技术领域。方法包括:根据至少两种不同的人名语料训练模型,对每个建模中文语料进行标注;当根据标注结果对建模中文语料的预测结果的一致性达到预设指标时,将建模中文语料添加到语料训练列表中;提取语料训练列表中每个建模中文语料的语料特征;根据建模中文语料的语料特征,构建人名语料识别模型。本发明借助多种不同的人名语料训练模型,对每个建模中文语料进行标注,基于标注结果,构建人名语料识别模型。在该过程中,无需用户进行人工标注,降低了语料标注成本,且在构建人名语料训练模型时,综合了多种人名语料训练模型的标注结果,提高了所构建的人名语料识别模型的识别精度。
Public/Granted literature
Patent Agency Ranking
0/0