文献搜索及学术报告生成方法、系统、设备及存储介质

    公开(公告)号:CN120011497A

    公开(公告)日:2025-05-16

    申请号:CN202411941756.6

    申请日:2024-12-26

    Applicant: 厦门大学

    Abstract: 本发明公开了一种文献搜索及学术报告生成方法、系统、设备及存储介质,其中方法包括:S10:获取用户问题;S20:对用户问题进行问题改写;S30:从搜索引擎获取相关文献,并计算文献摘要与用户问题之间的相似度以进行文献初筛;S40:获取初筛后的文献详细信息,结合秩和比法与相似度对文献进行重排序,得到推荐的相关论文;S50:选取TOP‑N篇相关论文进行深度搜索与再次推荐;S51:用户在推荐的所有论文内选定论文进行查阅,并基于大语言模型辅助用户理解;S52:获取步骤S50中的TOP‑N篇相关论文,提取论文信息输入大语言模型,生成学术报告。本发明提高了论文推荐的准确性和论文搜索的全面性,同时简化了用户阅读文献的难度。

    DIA-PASEF色谱峰数据分析方法、装置、设备及存储介质

    公开(公告)号:CN120009455A

    公开(公告)日:2025-05-16

    申请号:CN202411941755.1

    申请日:2024-12-26

    Applicant: 厦门大学

    Abstract: 本发明公开了DIA‑PASEF色谱峰数据分析方法、装置、设备及存储介质,其中方法包括:从原始质谱数据中提取目标肽段,同时构建参考谱图库,基于参考谱图库提取原始质谱数据中目标肽段的色谱峰信号;随机从参考谱图库中抽取肽段组成内源肽列表,以对齐原始质谱数据与参考谱图库的RT与IM;对色谱峰信号进行提取和比对,使用混合特征对色谱峰信号进行表征;根据参考色谱峰信号的不同,计算色谱峰信号的混合判别得分并以FDR值进行过滤,进行色谱峰层面的分析;基于已确定的最优候选峰信号组中色谱信号的信噪比对色谱信号与保留时间所围面积进行加权,以加权值作为该肽段的相对定量结果。本发明提高了现有蛋白质鉴定准确度。

    一种个体差异表达蛋白质的识别方法

    公开(公告)号:CN114220484B

    公开(公告)日:2024-10-22

    申请号:CN202111362073.1

    申请日:2021-11-17

    Applicant: 厦门大学

    Abstract: 本发明公开了一种个体差异表达蛋白质的识别方法,该方法包括以下步骤:S1、对蛋白质丰度数据进行预处理;S2、验证正常队列的蛋白质丰度数据中是否存在高度显著的蛋白质对;S3、选取个体层面差异表达算法中的参考组;S4、基于参考组采用个体层面差异表达算法识别差异表达蛋白质;该发明首先基于蛋白质丰度数据的特征,对蛋白质丰度数据进行预处理,去除变异系数高以及缺失值比例高的蛋白质,减少蛋白质定量误差对个体差异蛋白结果的影响;其次基于蛋白质稳定对选取参考组,并且利用迭代的方法,不断优化参考组中存在差异表达的蛋白质,保证了参考组的稳定性,可在个体水平上有效识别差异表达的蛋白质,识别精度高,应用前景好。

    一种基于RNA测序的癌症溯源方法
    4.
    发明公开

    公开(公告)号:CN115798594A

    公开(公告)日:2023-03-14

    申请号:CN202211567334.8

    申请日:2022-12-07

    Applicant: 厦门大学

    Inventor: 方韩 俞容山

    Abstract: 本发明公开了一种基于RNA测序的癌症溯源方法,包括以下步骤:S1、获取癌症数据中的TCGAFRESH数据、TCGAFFPE数据和TCGAMETASTATIC数据,并对癌症数据进行预处理;S2、基于transformer模型搭建癌症溯源网络模型;S3、采用预处理后的TCGAFRESH数据,对癌症溯源网络模型进行训练,得到训练后的癌症溯源网络模型;S4、将预处理后的TCGAFFPE数据和TCGA METASTATIC数据作为测试数据,将两个测试数据集分别送入训练后的癌症溯源网络模型中,对癌症进行分类溯源;本发明将transformer模型应用到了两万维RNA测序数据上,且可以使用所有的基因作为输入,不会存在基因筛选导致的丢失原始基因信息的问题,可有效提高癌症溯源分类的精确度。

    一种智能文献检索系统、方法、电子设备及存储介质

    公开(公告)号:CN119938807A

    公开(公告)日:2025-05-06

    申请号:CN202411941760.2

    申请日:2024-12-26

    Applicant: 厦门大学

    Abstract: 本发明公开了一种智能文献检索系统、方法、电子设备及存储介质,其中方法包括:通过爬虫工具得到引用文章作为外部知识,用于后续检索;将外部知识通过大语言模型进行指代消解操作,并对经过指代消解处理的外部知识进行文本分块,分解为子单元;对每个子单元进行文本的向量化处理,并对得到的文本向量进行降维;对降维后的文本向量进行层次聚类,根据层次聚类结果构建检索树,并通过大语言模型进行检索树中节点的信息合并;在检索过程中,根据用户输入查询的不同需求调整检索树的高度,根据经过调整的检索树进行匹配检索,输出检索结果;本发明解决了现有文献检索系统中指代消解、引用知识的利用以及降维聚类不足的问题。

    基于单细胞RNA测序数据的细胞类型识别方法、装置及设备

    公开(公告)号:CN117746995A

    公开(公告)日:2024-03-22

    申请号:CN202410194014.5

    申请日:2024-02-21

    Applicant: 厦门大学

    Inventor: 吴尚泽 俞容山

    Abstract: 本申请的实施例提供了一种基于单细胞RNA测序数据的细胞类型识别方法、装置及设备。该方法包括:获取并预处理单细胞RNA测序训练数据集;采用与数据来源对应的文本模板生成每一细胞样本对应的文本描述;将每一细胞样本对应的基因测序数据和文本描述分别输入至RNA编码器和文本编码器,得到对应的基因嵌入和文本嵌入;构建损失函数,以进行模型优化;将待识别细胞对应的基因测序数据经过预处理后,输入至RNA编码器,并将其可能的细胞类型对应的文本描述输入至文本编码器,得到目标基因嵌入和若干待匹配文本嵌入,进而确定待识别细胞对应的细胞类型。本申请实施例的技术方案可以有效区分不同细胞之间的差异性,提高细胞类型识别结果的准确性。

    联邦学习梯度交换中的差异化加噪方法及系统

    公开(公告)号:CN111260061B

    公开(公告)日:2022-07-19

    申请号:CN202010157458.3

    申请日:2020-03-09

    Applicant: 厦门大学

    Abstract: 本发明公开了一种联邦学习梯度交换中的差异化加噪方法、介质及系统,其中方法包括:多个数据方分别获取对应的训练数据集,并分别根据对应的训练数据集对深度学习模型进行训练,以更新深度学习模型的梯度;每个数据方将对应的梯度进行分层处理,并计算每一层梯度对应的二范数,以及根据二范数对每一层梯度进行加噪,并将加噪后的梯度发送至中心服务器;中心服务器对加噪后的梯度进行聚合,并将聚合后的梯度发送给每个数据方,以便每个数据方根据聚合后的梯度对本地深度学习模型进行更新;能够提高联邦学习的数据交换过程中隐私的保护强度,同时,相较于传统联邦学习中加密算法,可以降低数据传输的开销。

    一种基于UMI-tools和Spark的单细胞上游大数据处理方法

    公开(公告)号:CN114067910B

    公开(公告)日:2024-10-22

    申请号:CN202111346883.8

    申请日:2021-11-15

    Applicant: 厦门大学

    Abstract: 本发明公开了一种基于UMI‑tools和Spark的单细胞上游大数据处理方法,包括如下步骤:S1、通过HadoopBAM的接口读取FASTQ R1和FASTQ R2文件,并分别抽象为FASTQ R1数据集和FASTQ R2数据集;S2、从FASTQ R2数据集筛选出待处理的FASTQ数据集;S3、利用软件STAR将待处理的FASTQ数据集转化为SAM数据集;S4、读取GTF数据集和SAM数据集,分别根据各自记录中的染色体名进行聚合分组,得到GTF数据集组和SAM数据集组;S5、将GTF数据集组和SAM数据集组中具有相同染色体名的SAM记录和GTF记录进行拼接,并计数;S6、将计数的结果保存为结果文件。本发明大大减少了不必要的中间读写过程,提高数据处理的效率。

    一种个体差异表达蛋白质的识别方法

    公开(公告)号:CN114220484A

    公开(公告)日:2022-03-22

    申请号:CN202111362073.1

    申请日:2021-11-17

    Applicant: 厦门大学

    Abstract: 本发明公开了一种个体差异表达蛋白质的识别方法,该方法包括以下步骤:S1、对蛋白质丰度数据进行预处理;S2、验证正常队列的蛋白质丰度数据中是否存在高度显著的蛋白质对;S3、选取个体层面差异表达算法中的参考组;S4、基于参考组采用个体层面差异表达算法识别差异表达蛋白质;该发明首先基于蛋白质丰度数据的特征,对蛋白质丰度数据进行预处理,去除变异系数高以及缺失值比例高的蛋白质,减少蛋白质定量误差对个体差异蛋白结果的影响;其次基于蛋白质稳定对选取参考组,并且利用迭代的方法,不断优化参考组中存在差异表达的蛋白质,保证了参考组的稳定性,可在个体水平上有效识别差异表达的蛋白质,识别精度高,应用前景好。

    基于传统音乐的歌声评价方法及装置

    公开(公告)号:CN118197352A

    公开(公告)日:2024-06-14

    申请号:CN202410158020.5

    申请日:2024-02-04

    Applicant: 厦门大学

    Abstract: 本发明提出了一种基于传统音乐的歌声评价方法及装置,该方法包括:获取原始歌声音频数据和语音音频数据以作为训练数据对;构建声音转换模型,并将训练数据对输入到声音转换模型进行训练,以便通过训练好的声音转换模型获取转换后的歌声音频数据;对转换后的歌声音频数据和原始歌声音频数据进行特征提取以得到对应的歌声音频特征;获取转换后的歌声音频数据和原始歌声音频数据对应的平均意见分数,并采用极端梯度提升对歌声音频特征和平均意见分数进行回归分析,以得到歌声评价模型;由此,通过声音转换模型提供丰富的评价辅助数据以构建歌声评价模型,使得对传统音乐的评价不再局限于专业人士之间,从而拉近了大众与传统音乐的距离。

Patent Agency Ranking