-
公开(公告)号:CN111709244B
公开(公告)日:2023-09-26
申请号:CN201911144453.0
申请日:2019-11-20
Applicant: 中共南通市委政法委员会 , 江苏飞搏软件股份有限公司
IPC: G06N3/0455 , G06N3/08 , G06N5/025 , G06F40/30 , G06Q50/18
Abstract: 本发明涉及一种用于矛盾纠纷事件因果关系识别的深度学习方法,所述方法包括以下步骤:步骤1:获取训练语料文本;步骤2:训练语料文本预处理;步骤3:自动标注提取的每个句子数组,输出标注后的M个包含1个结果句子、1个原因句子和15随机句子的句子数组;步骤4:训练基于上下文注意力机制的因果关系识别模型;步骤5:待识别的矛盾纠纷事件描述文本预处理,输出对应的句子的语义特征向量;步骤6:将语义特征向量组合后输入训练好的因果关系识别模型中;步骤7:输出矛盾纠纷事件间的因果关系。该技术方案解决了传统的基于机器学习的分类方法的因果关系识别准确度不高的问题。
-
公开(公告)号:CN111709244A
公开(公告)日:2020-09-25
申请号:CN201911144453.0
申请日:2019-11-20
Applicant: 中共南通市委政法委员会 , 江苏飞搏软件股份有限公司
Abstract: 本发明涉及一种用于矛盾纠纷事件因果关系识别的深度学习方法,所述方法包括以下步骤:步骤1:获取训练语料文本;步骤2:训练语料文本预处理;步骤3:自动标注提取的每个句子数组,输出标注后的M个包含1个结果句子、1个原因句子和15随机句子的句子数组;步骤4:训练基于上下文注意力机制的因果关系识别模型;步骤5:待识别的矛盾纠纷事件描述文本预处理,输出对应的句子的语义特征向量;步骤6:将语义特征向量组合后输入训练好的因果关系识别模型中;步骤7:输出矛盾纠纷事件间的因果关系。该技术方案解决了传统的基于机器学习的分类方法的因果关系识别准确度不高的问题。
-
公开(公告)号:CN111723297B
公开(公告)日:2023-05-12
申请号:CN201911144452.6
申请日:2019-11-20
Applicant: 中共南通市委政法委员会 , 江苏飞搏软件股份有限公司
IPC: G06F16/9536 , G06F40/30
Abstract: 本发明涉及一种面向网格社情研判的双重语义相似度判别方法,所述方法包括以下步骤:步骤1)获取训练语料库;步骤2)输入训练语料库,步骤3)通过抽象语义和具体语义相结合的相似度计算模型对特征向量a和特征向量b进行初步相似度计算并生成中间判别结果;步骤4)将中间判别结果进行线性组合;步骤5)通过线性判别模型cX1+dX2对中间判别结果进行二次计算;步骤6)利用二次计算结果,通过Sigmoid函数对线性判别模型进行参数调优,步骤7)利用BERT模型提取从多源网页上新采集的待判别的文本大数据的特征向量a和特征向量b;步骤8)对输入的文本特征向量a和文本特征向量b执行训练好的相似度判别模型cX1+dX2;步骤9)将相似度判别结果存入到HBASE中。
-
公开(公告)号:CN111723136A
公开(公告)日:2020-09-29
申请号:CN201911143455.8
申请日:2019-11-20
Applicant: 中共南通市委政法委员会 , 江苏飞搏软件股份有限公司
Abstract: 本发明涉及一种面向网格事件分类分级处置的单维聚类分析方法,所述方法包括以下步骤:步骤(1)获取网格事件记录;步骤(2)对获取的网格事件记录进行清洗,仅保留网格事件情况文本;步骤(3)利用BERT模型提取网格事件情况文本的语义特征,生成多维特征向量;步骤(4)利用单维聚类算法对网格事件情况文本数据进行聚类;步骤(5)生成K个不同类型的网格事件类型簇,并存入到HBASE中;步骤(6)识别高发的网格事件类型。该方案可以高效的对分散的网格事件记录进行融合分析,准确地对高发的网格事件进行重点监测预警,提升了网格事件分类分级处置的效率。
-
公开(公告)号:CN111723297A
公开(公告)日:2020-09-29
申请号:CN201911144452.6
申请日:2019-11-20
Applicant: 中共南通市委政法委员会 , 江苏飞搏软件股份有限公司
IPC: G06F16/9536 , G06F40/30
Abstract: 本发明涉及一种面向网格社情研判的双重语义相似度判别方法,所述方法包括以下步骤:步骤1)获取训练语料库;步骤2)输入训练语料库,步骤3)通过抽象语义和具体语义相结合的相似度计算模型对特征向量a和特征向量b进行初步相似度计算并生成中间判别结果;步骤4)将中间判别结果进行线性组合;步骤5)通过线性判别模型cX1+dX2对中间判别结果进行二次计算;步骤6)利用二次计算结果,通过Sigmoid函数对线性判别模型进行参数调优,步骤7)利用BERT模型提取从多源网页上新采集的待判别的文本大数据的特征向量a和特征向量b;步骤8)对输入的文本特征向量a和文本特征向量b执行训练好的相似度判别模型cX1+dX2;步骤9)将相似度判别结果存入到HBASE中。
-
-
-
-