一种基于迁移学习的医学数据处理和系统

    公开(公告)号:CN108520780B

    公开(公告)日:2021-08-06

    申请号:CN201810186122.2

    申请日:2018-03-07

    Abstract: 本发明公开了一种基于迁移学习的医学数据处理和系统,包括:获取医学领域外的本文数据,训练得到文本分类模型;获取医学领域内的病例集合,其中病例集合包含症状和标签,标签为症状对应的病症;使用文本分类模型提取症状的特征向量作为症状向量,并根据症状对应的病症类型,将标签转化为标签向量;通过集合症状向量及其对应的标签向量,构建多标签训练样本集,根据多标签训练样本集,训练得到多标签分类模型;将待分析的医学样本输入至多标签分类模型,判断医学样本属于每一种标签的概率值,并根据概率值得到分析标签集合,作为医学样本的分析结果。由此本发明通过迁移学习避免了人工选择特征的缺点,提高了基于门诊病例的医学疾病预测准确率。

    一种基于症状向量的医学数据处理方法和系统

    公开(公告)号:CN108764280B

    公开(公告)日:2021-04-27

    申请号:CN201810343909.5

    申请日:2018-04-17

    Abstract: 本发明公开了一种基于症状向量的医学数据处理方法和系统,包括:通过将数据库中的症状进行向量化处理,得到由症状向量组成的初始症状集合,并根据初始症状集合得到疾病向量,集合疾病向量作为初始疾病集合;获取多个病例样本,根据病例样本的样本向量与疾病向量间的相似度,并结合损失函数对疾病向量和症状向量进行更新,以将初始疾病集合和初始症状集合分别更新为最终疾病集合和最终症状集合;用户输入症状,根据输入症状与最终症状集合中各疾病向量的相似度,对数据库中的疾病进行筛选,并将筛选出的疾病作为处理结果返回给用户。

    基于神经网络和远程监督的医学知识图谱构建方法和系统

    公开(公告)号:CN110019839B

    公开(公告)日:2021-11-05

    申请号:CN201810005385.9

    申请日:2018-01-03

    Abstract: 本发明涉及一种基于神经网络和远程监督的医学知识图谱构建方法和系统,包括:获取医学文本集和医学实体集,根据医学实体集,采用远程监督法对医学文本集中各词语进行实体信息标注,生成包含实体信息的数据集,以训练神经网络,得到用于实体识别的实体识别模型;获取医学实体集中实体间的关系类别,以使用数据集中用于关系分类的特征,训练神经网络,得到用于关系分类的关系分类模型;通过对待构建知识图谱的语料文本进行分句处理,获得待提取句子集合,使用实体识别模型,提取待提取句子集合中的所有候选实体,并使用关系分类模型确定候选实体间关系,以从大规模非结构化数据中自动构建包含候选实体和候选实体间关系的医学知识图谱。

    基于神经网络和远程监督的医学知识图谱构建方法和系统

    公开(公告)号:CN110019839A

    公开(公告)日:2019-07-16

    申请号:CN201810005385.9

    申请日:2018-01-03

    Abstract: 本发明涉及一种基于神经网络和远程监督的医学知识图谱构建方法和系统,包括:获取医学文本集和医学实体集,根据医学实体集,采用远程监督法对医学文本集中各词语进行实体信息标注,生成包含实体信息的数据集,以训练神经网络,得到用于实体识别的实体识别模型;获取医学实体集中实体间的关系类别,以使用数据集中用于关系分类的特征,训练神经网络,得到用于关系分类的关系分类模型;通过对待构建知识图谱的语料文本进行分句处理,获得待提取句子集合,使用实体识别模型,提取待提取句子集合中的所有候选实体,并使用关系分类模型确定候选实体间关系,以从大规模非结构化数据中自动构建包含候选实体和候选实体间关系的医学知识图谱。

    一种基于迁移学习的医学数据处理和系统

    公开(公告)号:CN108520780A

    公开(公告)日:2018-09-11

    申请号:CN201810186122.2

    申请日:2018-03-07

    Abstract: 本发明公开了一种基于迁移学习的医学数据处理和系统,包括:获取医学领域外的本文数据,训练得到文本分类模型;获取医学领域内的病例集合,其中病例集合包含症状和标签,标签为症状对应的病症;使用文本分类模型提取症状的特征向量作为症状向量,并根据症状对应的病症类型,将标签转化为标签向量;通过集合症状向量及其对应的标签向量,构建多标签训练样本集,根据多标签训练样本集,训练得到多标签分类模型;将待分析的医学样本输入至多标签分类模型,判断医学样本属于每一种标签的概率值,并根据概率值得到分析标签集合,作为医学样本的分析结果。由此本发明通过迁移学习避免了人工选择特征的缺点,提高了基于门诊病例的医学疾病预测准确率。

    一种基于症状向量的医学数据处理方法和系统

    公开(公告)号:CN108764280A

    公开(公告)日:2018-11-06

    申请号:CN201810343909.5

    申请日:2018-04-17

    CPC classification number: G06K9/6256 G06N3/08 G16H50/70

    Abstract: 本发明公开了一种基于症状向量的医学数据处理方法和系统,包括:通过将数据库中的症状进行向量化处理,得到由症状向量组成的初始症状集合,并根据初始症状集合得到疾病向量,集合疾病向量作为初始疾病集合;获取多个病例样本,根据病例样本的样本向量与疾病向量间的相似度,并结合损失函数对疾病向量和症状向量进行更新,以将初始疾病集合和初始症状集合分别更新为最终疾病集合和最终症状集合;用户输入症状,根据输入症状与最终症状集合中各疾病向量的相似度,对数据库中的疾病进行筛选,并将筛选出的疾病作为处理结果返回给用户。

Patent Agency Ranking