-
公开(公告)号:CN113157866A
公开(公告)日:2021-07-23
申请号:CN202110459121.2
申请日:2021-04-27
Applicant: 平安科技(深圳)有限公司
IPC: G06F16/33 , G06F40/295 , G06K9/62
Abstract: 本申请实施例提供了一种数据分析方法、装置、计算机设备及存储介质,该方法应用于大数据技术领域,该方法可以包括:获取舆情数据;对所述舆情数据进行实体抽取,得到多个实体;根据所述舆情数据对所述多个实体进行关系抽取,得到多个关系对;确定所述多个关系对中每个关系对包括的各实体对应的标准命名;将所述每个关系对包括的各实体间的关系映射为所述每个关系对包括的各实体对应的标准命名间的关系。采用本申请,可以从舆情数据提取有效信息以发现潜在的事物间的联系。本申请涉及区块链技术,如可从区块链获取舆情数据的摘要信息,并基于摘要信息查询舆情数据。
-
公开(公告)号:CN113157866B
公开(公告)日:2024-05-14
申请号:CN202110459121.2
申请日:2021-04-27
Applicant: 平安科技(深圳)有限公司
IPC: G06F16/33 , G06F40/295 , G06F18/214
Abstract: 本申请实施例提供了一种数据分析方法、装置、计算机设备及存储介质,该方法应用于大数据技术领域,该方法可以包括:获取舆情数据;对所述舆情数据进行实体抽取,得到多个实体;根据所述舆情数据对所述多个实体进行关系抽取,得到多个关系对;确定所述多个关系对中每个关系对包括的各实体对应的标准命名;将所述每个关系对包括的各实体间的关系映射为所述每个关系对包括的各实体对应的标准命名间的关系。采用本申请,可以从舆情数据提取有效信息以发现潜在的事物间的联系。本申请涉及区块链技术,如可从区块链获取舆情数据的摘要信息,并基于摘要信息查询舆情数据。
-
公开(公告)号:CN115204176A
公开(公告)日:2022-10-18
申请号:CN202210899520.5
申请日:2022-07-28
Applicant: 平安科技(深圳)有限公司
IPC: G06F40/295 , G06F16/33 , G06F16/35 , G06K9/62
Abstract: 本申请提供了一种命名实体识别方法、系统及存储介质,将样本中的字符进行类别标签标注,得到第一数据集;将第一数据集的字符进行实体标签标注,得到第二数据集;根据第二数据集,训练BERT模型及其衍生模型,得到实体边界识别模型;根据第一数据集,训练实体边界识别模型,得到实体综合识别模型;通过实体识别模型进行命名实体识别。本申请提高了模型训练效果以及命名实体识别准确性,一定程度上解决了目前实体边界识别不清导致的实体识别错误的问题。
-
公开(公告)号:CN112989042B
公开(公告)日:2024-03-15
申请号:CN202110277638.X
申请日:2021-03-15
Applicant: 平安科技(深圳)有限公司
IPC: G06F16/35 , G06F40/211 , G06F16/951
Abstract: 本申请涉及大数据处理领域,揭示了一种热点话题的提取方法、装置、计算机设备及存储介质,其中方法包括:获取文本数据;对所述文本数据进行数据预处理,剔除所述文本数据中的噪音数据,得到候选文本数据;对所述候选文本数据进行句法结构分类,并根据句法结构特征将分类后的候选文本数据组合生成句子文本;基于深度语义学习模型提取所述句子文本中的核心成分后生成热度短句,并输出所述热度短句,所述热度短句用于描述热点话题。本申请能够大量的文本数据中识别出热点话题,提高热点话题的提取效率,并用精简的热度短句描述所述热点话题,使得热点话题的语义信息含量更加丰富,提高热点话题的信息阅读效率。
-
公开(公告)号:CN113836303A
公开(公告)日:2021-12-24
申请号:CN202111131337.2
申请日:2021-09-26
Applicant: 平安科技(深圳)有限公司
IPC: G06F16/35 , G06F40/216
Abstract: 本发明涉及人工智能领域,公开了一种文本类别识别方法、装置、计算机设备及介质,方法包括:获取待识别的目标文本;将目标文本和标准集中各文本进行拼接,生成第一拼接文本集;将第一拼接文本集中每条文本逐一输入预先训练的文本类别识别模型中,输出第一拼接文本集中每条文本的预测值;其中预先训练的文本类别识别模型是基于第二拼接文本集中的拼接文本训练生成的,第二拼接文本集是将训练集、测试集中每条文本与标准集中每条文本进行拼接生成的;基于第一拼接文本集中每条文本的预测值确定目标文本的类别。由于本申请将训练集、测试集与标准集拼接后建立起了相关性,利用具有相关性的数据训练模型后,使得模型的识别结果更加准确。
-
公开(公告)号:CN113780832A
公开(公告)日:2021-12-10
申请号:CN202111076746.7
申请日:2021-09-14
Applicant: 平安科技(深圳)有限公司
IPC: G06Q10/06 , G06F40/216 , G06F40/242 , G06F40/30
Abstract: 本申请涉及人工智能领域,提供了一种舆情文本评分方法、装置、计算机设备和存储介质,获取待评分文本;将待评分文本中的每个句子分别输入预设的质量语句判断模型中确定各个句子是否属于高质量语句,确定待评分文本中的高质量语句;根据高质量语句确定待评分文本的第一评分;获取预设时间段内的资讯标题;将资讯标题进行分组处理,得到M个资讯分组;按照预设规则确定各个资讯分组的中心资讯标题;根据中心资讯标题确定待评分文本的第二评分;根据第一评分和第二评分计算待评分文本的目标评分。通过本申请提供的舆情文本评分方法、装置、计算机设备和存储介质,根据文章内容质量与舆情热度两方面进行评分,能够更加准确的对舆情资讯进行评分。
-
公开(公告)号:CN115204176B
公开(公告)日:2023-06-06
申请号:CN202210899520.5
申请日:2022-07-28
Applicant: 平安科技(深圳)有限公司
IPC: G06F40/295 , G06F16/33 , G06F16/35 , G06F18/24
Abstract: 本申请提供了一种命名实体识别方法、系统及存储介质,将样本中的字符进行类别标签标注,得到第一数据集;将第一数据集的字符进行实体标签标注,得到第二数据集;根据第二数据集,训练BERT模型及其衍生模型,得到实体边界识别模型;根据第一数据集,训练实体边界识别模型,得到实体综合识别模型;通过实体识别模型进行命名实体识别。本申请提高了模型训练效果以及命名实体识别准确性,一定程度上解决了目前实体边界识别不清导致的实体识别错误的问题。
-
公开(公告)号:CN113780832B
公开(公告)日:2023-04-25
申请号:CN202111076746.7
申请日:2021-09-14
Applicant: 平安科技(深圳)有限公司
IPC: G06F16/35 , G06F16/335 , G06F40/216 , G06F40/242 , G06F40/30
Abstract: 本申请涉及人工智能领域,提供了一种舆情文本评分方法、装置、计算机设备和存储介质,获取待评分文本;将待评分文本中的每个句子分别输入预设的质量语句判断模型中确定各个句子是否属于高质量语句,确定待评分文本中的高质量语句;根据高质量语句确定待评分文本的第一评分;获取预设时间段内的资讯标题;将资讯标题进行分组处理,得到M个资讯分组;按照预设规则确定各个资讯分组的中心资讯标题;根据中心资讯标题确定待评分文本的第二评分;根据第一评分和第二评分计算待评分文本的目标评分。通过本申请提供的舆情文本评分方法、装置、计算机设备和存储介质,根据文章内容质量与舆情热度两方面进行评分,能够更加准确的对舆情资讯进行评分。
-
公开(公告)号:CN114219602A
公开(公告)日:2022-03-22
申请号:CN202210028876.1
申请日:2022-01-11
Applicant: 平安科技(深圳)有限公司
Abstract: 本申请涉及人工智能技术领域,揭示了一种违约预测模型的生成方法、装置、设备及存储介质,其中方法包括:获取全量标签数据和行业标签数据;对预设的初始决策树模型和初始梯度迭代树模型进行训练,分别得到全量决策树模型和全量梯度树模型,以及分量决策树模型和分量梯度树模型;对全量决策树模型、全量梯度树模型、分量决策树模型和分量梯度树模型进行融合计算,得到第一融合模型和第二融合模型;获取验证数据集,通过第一融合模型和第二融合模型分别对验证数据集进行违约概率计算;根据违约概率进行预测准确性分类,并根据预测准确性的分类结果在第一融合模型和第二融合模型中选取目标违约预测模型,从而提高违约预测模型预测的有效性。
-
公开(公告)号:CN112989042A
公开(公告)日:2021-06-18
申请号:CN202110277638.X
申请日:2021-03-15
Applicant: 平安科技(深圳)有限公司
IPC: G06F16/35 , G06F40/211 , G06F16/951
Abstract: 本申请涉及大数据处理领域,揭示了一种热点话题的提取方法、装置、计算机设备及存储介质,其中方法包括:获取文本数据;对所述文本数据进行数据预处理,剔除所述文本数据中的噪音数据,得到候选文本数据;对所述候选文本数据进行句法结构分类,并根据句法结构特征将分类后的候选文本数据组合生成句子文本;基于深度语义学习模型提取所述句子文本中的核心成分后生成热度短句,并输出所述热度短句,所述热度短句用于描述热点话题。本申请能够大量的文本数据中识别出热点话题,提高热点话题的提取效率,并用精简的热度短句描述所述热点话题,使得热点话题的语义信息含量更加丰富,提高热点话题的信息阅读效率。
-
-
-
-
-
-
-
-
-