-
公开(公告)号:CN117894376A
公开(公告)日:2024-04-16
申请号:CN202410095024.3
申请日:2024-01-23
Applicant: 厦门大学
Abstract: 本发明涉及单细胞相关技术数据分析技术领域,具体涉及一种基于自然语言处理的单细胞数据分析方法;S1、对单细胞文本数据集进行预处理及质量控制,得到单细胞测序数据;S2、通过自然语言处理技术,对单细胞测序数据进行特征提取,得到原始数据矩阵;S3、通过Specter聚类方法对原始数据矩阵进行聚类分析,得到最终聚类结果。本发明通过自然语言处理方法识别大规模文档单细胞测序数据中潜藏的语义信息,根据自然语言处理方法的结果来挖掘单细胞相关技术中的潜在信息,通过Specter聚类方法对原始数据矩阵进行聚类分析,得到最终聚类结果,解决了参数敏感性问题,提高了聚类的准确性,该算法在实际应用中具有较高的应用价值。
-
公开(公告)号:CN117746995B
公开(公告)日:2024-05-28
申请号:CN202410194014.5
申请日:2024-02-21
Applicant: 厦门大学
IPC: G16B40/00 , G16B30/00 , G06F16/35 , G06N3/0455 , G06F18/22 , G06F18/2415
Abstract: 本申请的实施例提供了一种基于单细胞RNA测序数据的细胞类型识别方法、装置及设备。该方法包括:获取并预处理单细胞RNA测序训练数据集;采用与数据来源对应的文本模板生成每一细胞样本对应的文本描述;将每一细胞样本对应的基因测序数据和文本描述分别输入至RNA编码器和文本编码器,得到对应的基因嵌入和文本嵌入;构建损失函数,以进行模型优化;将待识别细胞对应的基因测序数据经过预处理后,输入至RNA编码器,并将其可能的细胞类型对应的文本描述输入至文本编码器,得到目标基因嵌入和若干待匹配文本嵌入,进而确定待识别细胞对应的细胞类型。本申请实施例的技术方案可以有效区分不同细胞之间的差异性,提高细胞类型识别结果的准确性。
-
公开(公告)号:CN117746995A
公开(公告)日:2024-03-22
申请号:CN202410194014.5
申请日:2024-02-21
Applicant: 厦门大学
IPC: G16B40/00 , G16B30/00 , G06F16/35 , G06N3/0455 , G06F18/22 , G06F18/2415
Abstract: 本申请的实施例提供了一种基于单细胞RNA测序数据的细胞类型识别方法、装置及设备。该方法包括:获取并预处理单细胞RNA测序训练数据集;采用与数据来源对应的文本模板生成每一细胞样本对应的文本描述;将每一细胞样本对应的基因测序数据和文本描述分别输入至RNA编码器和文本编码器,得到对应的基因嵌入和文本嵌入;构建损失函数,以进行模型优化;将待识别细胞对应的基因测序数据经过预处理后,输入至RNA编码器,并将其可能的细胞类型对应的文本描述输入至文本编码器,得到目标基因嵌入和若干待匹配文本嵌入,进而确定待识别细胞对应的细胞类型。本申请实施例的技术方案可以有效区分不同细胞之间的差异性,提高细胞类型识别结果的准确性。
-
-