-
公开(公告)号:CN112149422A
公开(公告)日:2020-12-29
申请号:CN202011010471.2
申请日:2020-09-23
Applicant: 中冶赛迪工程技术股份有限公司
IPC: G06F40/295 , G06F40/258 , G06F16/951 , G06K9/62
Abstract: 本发明涉及一种基于自然语言的企业新闻动态监测方法,属于自然语言处理领域。该方法包括步骤:步骤1:构建数据库;步骤2:训练命名实体识别NER模型;步骤3:读取新闻数据并进行数据清洗;步骤4:从新闻标题中提取企业实体和业务动态信息;步骤5:从新闻正文中提取企业实体;步骤6:筛选正文企业实体;步骤7:根据筛选后的企业实体从新闻正文中提取相应的业务动态信息;步骤8:将结果写入数据库,以企业为主体建立企业、新闻、业务动态维度的关联关系。本发明可快速、大量、自动化的从网络获取新闻信息,实现企业的高效新闻动态监测;大幅度降低了无关信息对识别结果的干扰,具有较高的稳定性和准确率。
-
公开(公告)号:CN112149422B
公开(公告)日:2024-04-05
申请号:CN202011010471.2
申请日:2020-09-23
Applicant: 中冶赛迪工程技术股份有限公司
IPC: G06F40/295 , G06F40/258 , G06F16/951
Abstract: 本发明涉及一种基于自然语言的企业新闻动态监测方法,属于自然语言处理领域。该方法包括步骤:步骤1:构建数据库;步骤2:训练命名实体识别NER模型;步骤3:读取新闻数据并进行数据清洗;步骤4:从新闻标题中提取企业实体和业务动态信息;步骤5:从新闻正文中提取企业实体;步骤6:筛选正文企业实体;步骤7:根据筛选后的企业实体从新闻正文中提取相应的业务动态信息;步骤8:将结果写入数据库,以企业为主体建立企业、新闻、业务动态维度的关联关系。本发明可快速、大量、自动化的从网络获取新闻信息,实现企业的高效新闻动态监测;大幅度降低了无关信息对识别结果的干扰,具有较高的稳定性和准确率。
-