聚类方法、装置、计算机设备和存储介质

    公开(公告)号:CN118094273B

    公开(公告)日:2025-03-21

    申请号:CN202410078590.3

    申请日:2024-01-19

    Applicant: 北京大学

    Abstract: 本申请涉及一种聚类方法、装置、计算机设备、存储介质和计算机程序产品。所述方法包括:获取待聚类数据包括的多个样本以及各样本的目标权重;通过距离聚类算法以及各样本的目标权重,对多个样本进行聚类,得到第一聚类结果;确定第一聚类结果对应的区分参数,以及确定各簇分别对应的线性判别参数;基于各簇分别对应的线性判别参数对各样本的目标权重进行更新,基于更新后的目标权重,得到目标聚类结果。通过采用本方法,可以避免对数据进行压缩,保留数据的完整信息,通过加权距离以及实时更新的权重实现数据的聚类,提高了聚类的可靠性,通过动态迭代的方式实时对样本的权重进行更新,可以更好地适应动态变化的聚类过程,提升聚类效率。

    医学数据质量评估方法、装置、设备及存储介质

    公开(公告)号:CN119599474A

    公开(公告)日:2025-03-11

    申请号:CN202411402692.2

    申请日:2024-10-09

    Abstract: 本申请公开了一种医学数据质量评估方法、装置、设备及存储介质,涉及数据质量评估技术领域,该方法包括:确定医学数据质量评估维度对应的维度校验规则;基于维度校验规则对医学数据进行校验,获得数据校验结果;通过价值性评估维度对医学数据的价值性进行评估,获得价值性评估结果,价值性评估维度基于用户需求确定;基于数据校验结果和价值性评估结果生成医学数据对应的数据质量评估结果。应用上述技术方案,解决了现有技术中的医学数据质量评估方法通常采用统一的质量评价体系,无法充分考虑不同用户角色在数据使用过程中的特殊需求和应用场景,导致实用性不高的技术问题。

    心理咨询对话生成方法、装置、设备及存储介质

    公开(公告)号:CN118553412B

    公开(公告)日:2024-10-29

    申请号:CN202411028276.0

    申请日:2024-07-30

    Abstract: 本发明公开了一种心理咨询对话生成方法、装置、设备及存储介质,该方法包括:在接收到用户的对话输入指令时,基于时空知识图谱,并根据用户的历史对话信息和历史对话状态确定用户的当前对话状态;根据用户的当前对话对应的对话上下文和当前对话活动序列预测对话活动类型;利用检索增强生成技术,通过当前对话状态和对话活动类型从心理知识库中匹配目标文本片段;将当前对话状态、对话活动类型和目标文本片段输入至预设大语言模型生成目标答复语句。本发明根据用户的历史对话信息和历史对话状态确定用户的当前对话状态,利用检索增强生成技术从心理知识库中匹配目标文本片段,最后生成目标答复语句,保证了线上心理咨询回复的体系性和专业性。

    中文医学大语言模型训练方法及装置

    公开(公告)号:CN118485141B

    公开(公告)日:2024-10-29

    申请号:CN202410949277.2

    申请日:2024-07-16

    Abstract: 本申请公开了一种中文医学大语言模型训练方法及装置,涉及自然语言处理技术领域,所述的方法包括:通过医学文本对预设大语言模型进行预学习训练,使得大语言模型在语义层面上理解专业医学知识。根据开源中文医学考试数据集对预训练后的模型进行监督微调训练,从而降低计算复杂度和内存需求,这使得在保持模型性能的同时,能够在有限的计算资源下进行高效的微调。最后根据构建的知识图谱和强化学习数据集进行知识反馈的强化学习,有助于解决监督微调后由于模型过度拟合而出现的“幻觉”现象,从而将大语言模型的输出与相关的专业医学知识进行充分对齐,提高大语言模型在医学领域回答的准确度。

    基于大语言模型的诊疗辅助装置及诊疗辅助方法

    公开(公告)号:CN118471488B

    公开(公告)日:2024-10-29

    申请号:CN202410941564.9

    申请日:2024-07-15

    Abstract: 本申请公开了一种基于大语言模型的诊疗辅助装置及诊疗辅助方法,涉及人工智能技术领域,该装置包括:在检测到用户基于诊疗界面触发的用户治疗请求时,根据用户治疗请求获得用户意图信息;根据用户意图信息确定待治疗用户对应的治疗方式;在治疗方式为诊疗辅助方式时,通过预设诊疗辅助模型生成待治疗用户对应的辅助诊疗策略;预设诊疗辅助模型基于agent框架构建,agent框架中设置有规划器和反思器,规划器和反思器基于专家轨迹数据对预设诊疗辅助模型进行迭代调整。应用上述技术方案,解决了现有技术中CBTI治疗方法需要大量的人力和场地成本,且依赖专家执行,导致其普及范围受限,无法充分适应患者的多元化需求的技术问题。

    图像数据处理方法、装置、计算机设备和存储介质

    公开(公告)号:CN118038080A

    公开(公告)日:2024-05-14

    申请号:CN202410125078.X

    申请日:2024-01-30

    Applicant: 北京大学

    Abstract: 本申请涉及一种图像数据处理方法、装置、计算机设备、存储介质和计算机程序产品。所述方法包括:获取图像训练集,并基于编码器提取图像训练集中的图像结构特征和图像纹理特征;对图像结构特征和图像纹理特征进行重构,得到重构图像特征,并通过共享解码器对重构图像特征进行解码处理,得到重构损失值集;通过分类器对图像结构特征进行分类处理,得到分类损失值集,并基于重构损失值集和分类损失集更新编码器和共享解码器的参数;在更新后的编码器满足训练停止条件的情况下,将编码器中的共享编码器确定为特征提取模型;特征提取模型用于提取图像中的图像结构特征。采用本方法能够提高特征提取模型的准确性。

    医学数据汇交共享方法、平台、装置和计算机设备

    公开(公告)号:CN117909330A

    公开(公告)日:2024-04-19

    申请号:CN202410093555.9

    申请日:2024-01-23

    Applicant: 北京大学

    Abstract: 本申请涉及一种医学数据汇交共享方法、平台、装置、计算机设备、存储介质和计算机程序产品。方法应用于医学数据汇交共享平台,方法包括:当满足预设的共享价值预测条件时,获取医学数据汇交共享平台上目标医学数据的数据集大小、下载量和各项价值指标对应的指标值;根据目标医学数据的数据类型和预设的医学数据质量检测模型,对目标医学数据进行质量检测,得到目标医学数据的质量检测结果;根据数据集大小对应的指标值、下载量对应的指标值、各项价值指标对应的指标值、质量检测结果和预设的医学数据共享价值预测模型,确定目标医学数据的共享价值预测结果。采用本方法能够提高确定医学数据的共享价值的效率。

    信息检索知识图谱嵌入方法、装置和计算机设备

    公开(公告)号:CN116842109A

    公开(公告)日:2023-10-03

    申请号:CN202310766394.0

    申请日:2023-06-27

    Applicant: 北京大学

    Abstract: 本申请涉及一种信息检索知识图谱嵌入方法、装置和计算机设备。方法包括:获取信息检索知识图谱,并采集信息检索知识图谱的各子图信息;将各子图信息,转换为每个子图信息对应的文本序列,并对各文本序列进行编码转换处理,得到每个文本序列对应的掩盖实体向量、以及每个文本序列的掩盖关系向量;针对每个文本序列,基于文本序列对应的子图信息的图结构信息,更新文本序列的掩盖实体向量、以及文本序列的掩盖关系向量,并重建上述各向量得到信息检索知识图谱对应的各实体向量、以及信息检索知识图谱对应的各关系向量。采用本方法能够提升生成该信息检索知识图谱的实体向量和关系向量的精准度。

    面向基因数据的联邦分析系统和方法、设备及介质

    公开(公告)号:CN113792022A

    公开(公告)日:2021-12-14

    申请号:CN202110980697.3

    申请日:2021-08-25

    Applicant: 北京大学

    Inventor: 黄雨 豆乘风 金芝

    Abstract: 本发明属于大数据处理领域,公开了一种面向基因数据的联邦分析系统、设备及介质。所述系统包括:包括客户端、主控中心和分中心,其中:所述客户端包括展示层;所述主控中心包括主控制层、主任务层和主存储层;所述分中心包括分控制层、分任务层、分运算层和分存储层。本发明采用跨中心文件管理、多中心任务执行和联邦分析算法库三个核心策略来进行基因联邦分析。跨中心文件管理能够在确保数据安全的同时,允许联盟根据任务维护不同的虚拟目录结构,用户可以操作虚拟目录进行多中心基因分析;多中心任务执行针对不同类型的分析步骤,提供专门的资源分配方法,并能够对分析过程进行监控;联邦分析算法库能够为基因跨中心分析提供支持。

Patent Agency Ranking