-
公开(公告)号:CN112906349A
公开(公告)日:2021-06-04
申请号:CN202110342499.4
申请日:2021-03-30
Applicant: 苏州大学
IPC: G06F40/117 , G06F40/14 , G06F40/211 , G06F40/279 , G06F40/30 , G06N20/00
Abstract: 本申请公开了一种数据标注的方法,包括:根据输入的数据标注任务确定待标注数据;调用数据标注模型对待标注数据进行数据标注,得到对应的数据标注结果;判断数据标注结果与输入的人工标注结果是否一致;若一致,则确认数据标注结果正确。相较于人标人校和机标人校的方式,本申请可以从根本上解决标注者的认同倾向问题,充分挖掘对问题的理解差异,促进标注指南的完善、标注者水平的提高;本申请通过结合机器自动标注的辅助,相较于多人独立标注的方法可以有效减少标注的时间成本和金钱成本,在保证数据标注质量的同时极大的降低了成本。本申请同时还提供了一种数据标注的系统、设备及可读存储介质,具有上述有益效果。
-
公开(公告)号:CN112232024A
公开(公告)日:2021-01-15
申请号:CN202011089840.1
申请日:2020-10-13
Applicant: 苏州大学
IPC: G06F40/117 , G06F40/211 , G06F40/289 , G06K9/62 , G06N3/04
Abstract: 本申请公开了一种基于多标注数据的依存句法分析模型训练方法,包括:获取词序列以及多种标注结果;将词序列输入依存句法分析模型,得到弧得分和标签得分;根据目标损失函数,计算弧得分和标签得分相对于多种标注结果的损失值;通过迭代训练,以最小化损失值为目的,调整依存句法分析模型的模型参数,以实现模型训练。可见,该方法能够根据目标损失函数计算模型输出结果相对于全部标注结果的损失值,并据此完成对模型的迭代训练,实现了充分利用全部标注数据中的有效信息的目的,提升了模型的依存句法分析能力。此外,本申请还提供了一种基于多标注数据的依存句法分析模型训练装置、设备及可读存储介质,其技术效果与上述方法相对应。
-