基于无监督聚类的长文本可信度评估方法及系统

    公开(公告)号:CN110287314B

    公开(公告)日:2021-08-06

    申请号:CN201910418900.0

    申请日:2019-05-20

    Abstract: 本发明涉及一种基于无监督聚类的长文本可信度评估方法,包括:以已知长文本获取训练数据,提取该训练数据的训练特征以构建训练特征向量集,对该训练特征向量集进行无监督聚类,得到多个训练类心;以待评估长文本获取评估数据,提取该评估数据的评估特征向量;获取该评估特征向量相对该训练类心的评估值,并以该评估值得到该待评估长文本的可信度。本发明通过无监督聚类对长文本进行可信度评估,在实施过程中不需要标注数据,节省了人力、物力与时间,避免了数据中标签稀疏带来的困扰;提取了长文本的文本特征,对于可信度评估任务更加适用,使用该模型得到的文本的可信度更具有可解释性,同时在平台之间可以迁移。

    基于分布式数据采集任务调度方法及装置

    公开(公告)号:CN111857983A

    公开(公告)日:2020-10-30

    申请号:CN202010355882.9

    申请日:2020-04-29

    Inventor: 刘春阳 张旭 王鹏

    Abstract: 本发明公开了一种基于分布式数据采集任务调度方法,其包括:获取待处理任务;对待处理任务分类得到多个周期性重复任务;记录每个周期性重复任务在前n次执行中每次执行的起止时间点;计算每个周期性重复任务在前n次执行中的平均间隔时长 每个周期性重复任务下一次执行的起始时间点,确定多个周期性重复任务的下一次执行顺序;记录每个任务执行器的负载;向多个任务执行器分别发送任务请求信号,并接受各个任务执行器的反馈信号;向接受到的第一个反馈信号对应的任务执行器发送需要最先执行的周期性重复任务。本发明还公开了一种基于分布式数据采集任务调度装置。本发明能够使得分布式系统执行任务时取得最优效果,运行更加稳健。

    基于知识标注评价的任务分配方法及系统

    公开(公告)号:CN110443476A

    公开(公告)日:2019-11-12

    申请号:CN201910667446.2

    申请日:2019-07-23

    Abstract: 本发明公开了一种基于知识标注评价的任务分配方法,其特征在于,包括:对标注员往期标注任务进行评分,并按任务完成时段及按任务类型将综合分数存储于标注员人物库中;根据待分配任务的类型和任务发布时间所属时段检索标注员人物库,筛选综合分数高于预定阈值的标注员,并从中选出已分配任务量最少的标注员,向其下发待分配任务。本发明公开了一种基于知识标注评价的任务分配系统。本发明在任务分配时综合利用标注员评价结果,根据知识库类型、业务方向、标注效果等维度建立任务分配策略,将新的标注任务自动分配给合适的标注员,提升任务分配的效率及知识标注的整体质量。

Patent Agency Ranking