病历生成方法及装置
    1.
    发明公开

    公开(公告)号:CN119049623A

    公开(公告)日:2024-11-29

    申请号:CN202410908792.6

    申请日:2024-07-08

    Abstract: 本公开提出一种病历生成方法及装置,该方法获取待模拟病历的要素;根据所述至少两个地点表征的病症类型特征和预设状态转移算法,生成空间特征,所述空间特征表征所述至少两个地点之间的状态转移关系;根据所述至少两个地点之间的状态转移关系的顺序,与所述时间序列中各时刻在所述时间序列中的顺序一一匹配,得到所述待模拟病历的时空特征;调用预训练的文本生成模型根据所述时空特征生成模拟病历数据。生成的模拟数据类别更加均衡且数据量大,且模拟病历数据中不涉及患者隐私的问题,为相关医学领域的研究提供了数据基础。

    基于行为与注意力机制的异常行为检测方法及系统

    公开(公告)号:CN114565002B

    公开(公告)日:2025-04-25

    申请号:CN202111314525.9

    申请日:2021-11-08

    Abstract: 本申请提供了一种基于行为与注意力机制的异常行为检测方法、系统及计算机介质,获取用户行为,并提取行为序列特征以及行为统计特征;融合行为序列特征以及行为统计特征,得到行为融合特征;将行为融合特征输入注意力机制的LSTM网络进行训练,得到异常行为检测模型;将待检测用户行为输入异常行为检测模型,得到异常行为检测结果。本申请使用用户历史行为与注意力机制相结合的技术手段来实现对不同用户行为模式的识别,最终实现更高精度和准确性的检测模型来降低一部分组织或企业因内部用户异常行为而造成的威胁以及损失。

    一种热点事件检测方法和系统

    公开(公告)号:CN110232149B

    公开(公告)日:2022-03-01

    申请号:CN201910385776.2

    申请日:2019-05-09

    Abstract: 本申请公开了一种热点事件检测方法和系统,包括:对文本进行预处理、分词和向量化,计算文本相似度矩阵;对文本相似度矩阵进行聚类,得到聚类结果集;提取聚类结果集中的关键词,计算关键词向量之间的距离;判断距离与阈值之间的关系,若小于等于阈值,则输出关键词向量对应的聚类结果,得到融合结果集;输入融合结果集至分类器,得到热点事件关键词和热点事件对应的文本分类器。通过提取聚类结果的关键词,使用词向量对聚类关键词进行向量化表示,判断关键词向量之间的距离,对同一事件的多方向讨论进行归并,提高语义识别程度。使用分类器对融合结果集进行分类,能够在包含固有话题的数据中检测热点事件,提高热点事件的识别准确率。

    对抗残差图变分自编码器的社交网络链接预测方法及系统

    公开(公告)号:CN113609306A

    公开(公告)日:2021-11-05

    申请号:CN202110893417.5

    申请日:2021-08-04

    Abstract: 本发明公开了一种对抗残差图变分自编码器的社交网络链接预测方法及系统,包括如下步骤:利用数据采集技术获取某一时刻下的社交网络数据,包括用户的推文数据和用户之间的交互数据;基于用户的交互进行社交网络图结构抽象,其中节点表示社交网络中的真实用户,边表示用户之间的关系;利用Bert模型提取用户推文数据中的内容语义信息,表示成固定长度的向量,作为用户的内容语义;将社交网络图结构和用户的内容语义作为输入,利用批量正则化下的对抗残差图变分自编码器提取拓扑结构特征和语义特征,融合得到低维连续向量空间中的节点表示;两两计算节点向量表示之间的点积,反映节点间的相似度,将高于给定阈值的两个节点认定为会在未来产生链接关系,从而实现社交网络链接预测。

    一种可定制的网络爬虫方法及系统

    公开(公告)号:CN110020062B

    公开(公告)日:2021-09-24

    申请号:CN201910292891.5

    申请日:2019-04-12

    Abstract: 本发明实施例提供了一种可定制的网络爬虫方法及系统,其中可定制的网络爬虫方法,包括:通过人工输入配置界面获取单个待生成爬虫任务的配置项;利用所述配置项中的第一爬虫名称,查找为所述第一爬虫名称预先配置的网站静态配置文件,作为目标静态配置文件;通过所述目标静态配置文件中包含的第一网站运行配置文件名称,查找为所述第一网站运行配置文件名称预先配置的网站运行配置文件,作为目标运行配置文件;基于所述目标静态配置文件、所述目标运行配置文件及所述配置项,生成包含所述配置项的爬虫任务;获取所述目标静态配置文件中包含的爬虫入口链接;执行用于对所述爬虫入口链接进行目标数据抓取的爬虫任务。

    一种基于改进层次聚类的多源网络舆情主题挖掘方法

    公开(公告)号:CN110222172B

    公开(公告)日:2021-03-16

    申请号:CN201910403573.1

    申请日:2019-05-15

    Abstract: 本发明公开了一种基于改进层次聚类的多源网络舆情主题挖掘方法,涉及主题挖掘领域。具体包括以下步骤:步骤一、获取词向量;步骤二、对所有数据进行预处理;步骤三、对步骤二预处理后总的样本数据句向量化;步骤四、进行句向量半监督层次主题挖掘;步骤五、输出树状图Dendrogram。本发明利用层次聚类算法包含层次信息的优点,并在此基础上从先验知识使用、模型输入向量化、优质主题筛选等角度进行优化,最终使得本文提出的方法能有效适用于主题广泛、文本噪声多、语法缺少规范的多源网络平台短文本的主题挖掘。

    一种基于领域语义关系图的文本领域确定方法与系统

    公开(公告)号:CN110413989B

    公开(公告)日:2020-11-20

    申请号:CN201910533898.1

    申请日:2019-06-19

    Abstract: 本申请公开了一种领域语义关系图的文本领域确定方法与系统,包括:对待分析文本进行处理得到语句集合和文本词汇集合;确定所述文本词汇集合中各词汇在领域语义关系图中的文本词汇得分,所述领域语义关系图为根据从网络平台中采集的文本生成的;根据语句集合和领域语义关系图,确定词汇联合得分;根据词汇联合得分和文本词汇得分确定领域总得分;根据所述领域总得分确定所述待分析文本所属的文本领域。根据从网络平台中采集的文本生成的领域语义关系图,通过确定待分析文本中的文本词汇集合中各词汇在领域语义关系图中的文本词汇得分,能够根据需要针对特殊领域对文本进行分析。通过设置语义关联关系、权重系数和专属属性,提高灵活性和针对性。

    一种网络社区用户识别方法、装置和可读存储介质

    公开(公告)号:CN109783805B

    公开(公告)日:2020-04-24

    申请号:CN201811544400.3

    申请日:2018-12-17

    Abstract: 本申请公开一种网络社区用户识别方法及装置,涉及机器学习及用户识别技术领域。所述方法包括:提取预先收集的网络社区文本数据的第一N‑gram特征并生成第一词向量;以交叉熵为代价函数,采用深度神经网络对第一词向量进行训练,得到文本内容分析模型;使用文本内容分析模型分析待识别用户的文本数据,得到内容属性;使用预设行为分析模型分析待识别用户的行为数据,得到行为属性;根据内容属性和行为属性识别待识别用户。本申请中,引入N‑gram特征,并结合用户内容以及用户行为两个维度的数据进行目标用户的识别,相较于现有的单一维度数据的用户识别,大大提升了识别性能及准确度。

Patent Agency Ranking