基于进化计算和多粒度代理模型近似的药物小分子优化方法

    公开(公告)号:CN119851812A

    公开(公告)日:2025-04-18

    申请号:CN202510007753.3

    申请日:2025-01-03

    Applicant: 安徽大学

    Abstract: 本发明公开了一种基于进化计算和多粒度代理模型近似的药物小分子优化方法,包括:1将药物小分子多属性优化问题建模为昂贵约束多目标优化问题;2在离散化学空间均匀地生成初始分子种群并对其进行昂贵的优化目标评价以及约束评价;3将评价后的药物小分子编码到连续潜在空间,得到分子的连续向量表示;4使用分子的连续向量表示、对应的目标值与约束值作为训练数据,训练多粒度代理模型;5执行代理模型辅助的进化算法,选出优质药物小分子解码到离散化学空间,并对其进行昂贵的优化目标评价以及约束评价;6重复步骤3‑5,从而输出最优药物分子。本发明旨在使用较低的评估代价高效优化药物小分子的多个属性,从而为药物研发提供技术支持。

    基于局部和全局的网络中心性分析的癌症驱动基因预测方法及系统

    公开(公告)号:CN113488104B

    公开(公告)日:2024-06-18

    申请号:CN202110638436.3

    申请日:2021-06-08

    Applicant: 安徽大学

    Abstract: 本发明公开了一种基于局部和全局的网络中心性分析的癌症驱动基因预测方法,包括以下步骤:S1:对标准化的体细胞突变数据和基因表达数据进行预处理,表达成基因‑矩阵的形式;S2:使用预处理完成的数据对下载的PPI网络加权;S3:模型构建,使用改进的重启随机游走算法分析网络的全局和局部特征;S4:使用构建好的模型对癌症数据集进行预测,以获取驱动基因的排名向量,实现对癌症驱动基因的预测。还公开了一种基于局部和全局的网络中心性分析的癌症驱动基因预测系统。本发明能够更好地识别驱动基因,大大提高对癌症驱动基因预测的精度,为癌症的诊断和精准医疗的发展做出了贡献。

    一种单细胞RNA-seq数据聚类方法、装置、设备和介质

    公开(公告)号:CN117935936A

    公开(公告)日:2024-04-26

    申请号:CN202410106779.9

    申请日:2024-01-25

    Applicant: 安徽大学

    Abstract: 本发明提供了一种单细胞RNA‑seq数据聚类方法、装置、设备和介质。该方法包括:数据预处理;使用深度降噪多尺度自编码器提取单细胞RNA‑seq数据的潜在特征信息;利用多尺度注意力机制融合来自多尺度自编码器的编码层、隐藏层和解码层的特征信息,从而能够探索同一尺度内的细胞关系,并捕获不同尺度上的深层特征;自监督聚类网络利用融合的潜在特征计算隶属度矩阵,并基于隶属度矩阵对聚类网络进行优化,同时采用自适应反馈机制监督多尺度自编码器的参数更新,从而获得更有效的细胞特征表示。本发明可以更全面地捕获网络层内的结构信息,有效降低单细胞RNA‑seq数据的高噪声、稀疏性的影响,从而获得更准确的聚类结果。

    基于邻域选择的多目标旅游推荐方法及其系统

    公开(公告)号:CN116501983A

    公开(公告)日:2023-07-28

    申请号:CN202310297729.9

    申请日:2023-03-24

    Applicant: 安徽大学

    Abstract: 本发明公开了一种基于邻域选择的多目标旅游推荐方法,包括以下步骤:S1:数据集构建:收集用户的历史访问序列,并对数据集进行数据筛选;S2:用户邻居池的构建:将用户划分为新用户和老用户,计算不同目标用户的邻居列表,最终选取相似度排名前m名的用户作为邻居放入邻居池;S3:多目标推荐模型建立:将用户所关心的推荐准确度和新颖性这两个指标转化为两个目标的多目标优化模型;S4:多目标进化算法优化邻居列表:使用改进的多目标进化算法对邻居列表进行优化,得到最优的邻居列表;S5:根据优化得到的最优邻居集产生目标用户的景点推荐列表。还公开了一种基于邻域选择的多目标旅游推荐系统。本发明能够得到满足要求的多个非劣解。

    基于多任务学习的生物医学触发词检测和命名实体识别方法

    公开(公告)号:CN113360667A

    公开(公告)日:2021-09-07

    申请号:CN202110617440.1

    申请日:2021-05-31

    Applicant: 安徽大学

    Inventor: 苏延森 詹飞

    Abstract: 本发明公开了一种基于多任务学习的生物医学触发词检测和命名实体识别方法,其步骤包括:1将非结构化的生物医学文本通过分词分句技术进行预处理,并对其进行标注以产生标准数据集;2构建基于多任务学习的生物医学触发词检测和命名实体识别神经网络模型;3对上述该神经网络模型进行训练并更新参数;4利用已训练好的最优的模型对未标注数据进行预测,以识别出其中的触发词和命名实体。本发明能够同时检测生物医学文本中的触发词和命名实体识别,从而能有效提高识别的准确率,并降低对计算资源的需求。

    一种基于网络分类的命名实体识别方法

    公开(公告)号:CN112487816A

    公开(公告)日:2021-03-12

    申请号:CN202011472395.7

    申请日:2020-12-14

    Applicant: 安徽大学

    Abstract: 本发明公开了一种基于网络分类的命名实体识别方法,包括:1:输入命名实体训练样本文本数据并将其转化为向量数据;步骤2:对所述的命名实体训练样本数据进行预处理;步骤3:通过迭代选择部分样本构造网络训练命名实体识别模型;命名实体识别包括:步骤4:输入待识别命名实体样本数据;步骤5:对所述待识别命名实体样本数据进行预处理;步骤6:通过命名实体分类模型对所待识别命名实体样本数据进行识别,判断所属命名实体的类别。本发明能快速有效从海量的文本中提取命名实体的关键属性并识别出该实体的类别,提高命名实体识别的效率并为信息提取、问答系统、句法分析、机器翻译等提供基础。

    一种基于历史数据的癌症疾病基因特征选择方法

    公开(公告)号:CN110070916A

    公开(公告)日:2019-07-30

    申请号:CN201910355711.3

    申请日:2019-04-29

    Applicant: 安徽大学

    Abstract: 本发明公开了一种基于历史数据的癌症疾病基因特征选择方法,包括以下步骤:A:将癌症疾病基因数据分为训练集和测试集;B:计算训练集上所有特征都被选择后的总平均错误率;C:生成初始种群,构造适应度函数;D:将所有特征选择方案记录到特征树中,调整特征选择方案的分布,以适应度值最小的特征选择方案作为最优特征选择方案,将结果返回给遗传算子和导向搜索算子;E:引导特征种群的进化方向;F:判断终止条件,若未达到终止条件,重复步骤D~F,若达到终止条件,输出最优解。本发明的优点在于:能够有效降低数据维度,提高预测准确性,通过特征树,结合遗传算法为癌症等疾病的相关基因进行筛选,为诊断和治疗提供辅助。

    基于自适应层数的GCN-LSTM重构时序基因调控网络

    公开(公告)号:CN119811484A

    公开(公告)日:2025-04-11

    申请号:CN202411734998.8

    申请日:2024-11-29

    Applicant: 安徽大学

    Abstract: 本发明公开了一种基于自适应层数的GCN‑LSTM重构时序基因调控网络,包括:使用不同时间点的基因表达矩阵和先验的基因调控网络在自适应层数的GCN中提取到对应的不同时间点的基因特征;不同时间点的基因特征输入LSTM获取下一时间点的基因特征;基于下一时间点的基因特征和先验的基因调控网络在受重力启发的GAE当中预测得到下一时间点的有向的基因调控网络。本发明采用自适应层数的GCN,可以根据数据集的大小不同来自适应GCN层数;借助LSTM学习时间点之间的更加丰富的基因特征,采用受重力启发的图自编码器(GAE)获取有向的基因调控网络(GRN),具有更高的细胞类型特异性推理准确性。

Patent Agency Ranking