特定人员的聚集场所模型的训练方法、装置、介质及设备

    公开(公告)号:CN119669763A

    公开(公告)日:2025-03-21

    申请号:CN202411836060.7

    申请日:2024-12-13

    Abstract: 本申请公开了一种特定人员的聚集场所模型的训练方法、装置、介质及设备,属于机器学习技术领域。获取特定人群的金融行为特征、交通行为特征和地理区域特征;根据金融行为特征和交通行为特征生成第一训练集,训练样本包括第一时段内的金融行为特征和交通行为特征、第二时段内的金融行为特征和交通行为特征,第二时段晚于第一时段;根据第一训练集训练RNN模型;根据金融行为特征、交通行为特征和地理区域特征生成第二训练集,训练样本包括金融行为特征、交通行为特征、地理区域特征以及标注信息,标注信息表示特定人员在某个时间出现在某个地理区域内的某个聚集场所的概率;根据第二训练集训练PSO‑ELM模型,以提高预测的准确率。

    跨语种的专利文本检索方法、装置、存储介质及设备

    公开(公告)号:CN116843515A

    公开(公告)日:2023-10-03

    申请号:CN202310626537.8

    申请日:2023-05-30

    Abstract: 本申请公开了一种跨语种的专利文本检索方法、装置、存储介质及设备,属于数据处理技术领域。所述方法包括:获取输入的第一查询文本;利用转换模型将第一查询文本转换为第二查询文本,第一查询文本是基于第一语言的文本,第二查询文本是基于第二语言的文本;利用BERT模型从分类号库中筛选与第二查询文本相似的多个IPC分类号;利用BERT模型从专利文本库中筛选与多个IPC分类号对应的多篇专利文本,专利文本是基于第二语言的文本;利用BERT模型对第二查询文本和多篇专利文本进行检索,得到检索结果。本申请可以先进行语种转换,再利用IPC分类号对专利文本进行初选,以缩小专利文本的检索范围,从而提高了检索效率。

    专利文本中的领域命名实体识别方法、装置、介质及设备

    公开(公告)号:CN114444470A

    公开(公告)日:2022-05-06

    申请号:CN202210081976.0

    申请日:2022-01-24

    Abstract: 本申请公开了一种专利文本中的领域命名实体识别方法、装置、介质及设备,属于计算机技术领域。所述方法包括:获取训练数据,训练数据中包含多篇专利文本的至少一个字段和已经标注好的领域命名实体;利用训练数据对BART预训练模型进行训练;根据预设的Prompt模板和训练数据生成Prompt数据,其中,Prompt模板是针对同一专利领域中领域命名实体的特点创建的,且不同专利领域的Prompt模板不同;利用Prompt数据对训练后的BART模型进行调优,得到领域命名实体识别模型;利用领域命名实体识别模型识别各个专利文本中的领域命名实体。本申请既降低了专利文本中的领域命名实体的识别难度,也提高了识别的准确率。

    重点人员的守信评价模型的训练方法、装置、介质及设备

    公开(公告)号:CN119862545A

    公开(公告)日:2025-04-22

    申请号:CN202411836063.0

    申请日:2024-12-13

    Abstract: 本申请公开了一种重点人员的守信评价模型的训练方法、装置、介质及设备,属于深度学习技术领域。获取大量重点人员的个人数据,个人数据中的直接量化数据包括人口学统计数据、家庭与社会背景数据、经济数据;间接量化数据包括社交数据、特定行为数据、心理和认知数据、管理表现数据;将直接量化数据量化成特征;利用大语言模型将间接量化数据量化成特征;利用基尼系数的计算公式对特征进行计算,得到第一数值;利用卡方检验的计算公式对特征进行计算,得到第二数值;根据第一数值和第二数值训练守信评价模型的模型参数。本申请能使用大语言模型量化数据,并根据基尼系数和卡方检验确定守信评价模型的模型参数,提高模型的准确率。

    一种基于CBOW和skip-gram词向量的多层级多分类文本分类方法

    公开(公告)号:CN119336908A

    公开(公告)日:2025-01-21

    申请号:CN202411386146.4

    申请日:2024-09-30

    Abstract: 本申请公开了一种基于CBOW和skip‑gram词向量的多层级多分类文本分类方法。本方法构建了包含多层级标签的专利文本数据集,为后续分类提供丰富的标注数据;利用CBOW模型对文本进行预处理,生成词频向量,降低数据维度并提取关键信息。然后通过BiLSTM网络对词频向量进行聚合,捕捉文本中的长距离依赖关系,并使用skip‑gram模型提取文本的语义特征,最后将BiLSTM和skip‑gram生成的文本表示向量进行加权平均,得到文本的最终表示,用于训练多层级分类模型。该技术通过结合上下文信息和语义信息,有效提高了文本分类的精度,提高了分类效率。

Patent Agency Ranking