一种基于关系抽取模型的样本优化方法及系统
Abstract:
从本申请提出一种基于关系抽取模型的样本优化方法及系统,属于数据处理技术领域,方法包括:获取训练样本集,所述训练样本集包括M条样本,每条样本由多个已标记的实体以及实体之间的关系组成;构建已知实体的关系列表;根据已知实体的关系列表,在训练样本集中,若实体以及实体之间的关系不存在于已知实体的关系列表中,则删除训练样本集中该实体以及实体之间的关系,得到新的训练样本集;在新的训练样本集中取出任一样本,将任一样本改造成正样本与负样本的集合,所有样本均经过阈值处理,得到最终的输入样本。本申请在训练结果的精度不产生影响的前提下,降低了“关系抽取”的硬件资源消耗,提高计算效率。
Public/Granted literature
Patent Agency Ranking
0/0