-
公开(公告)号:CN118136136A
公开(公告)日:2024-06-04
申请号:CN202410413535.5
申请日:2024-04-08
Applicant: 上海交通大学
Abstract: 本发明公开了基于子结构搜索与阻转判别的手性轴寻找算法,涉及化学技术领域,包括以下步骤:遍历目标分子,基于目标分子所包含的螺环原子结构获得手性螺环原子列表csAtoms;基于目标分子所包含的螺环链结构获得手性螺环链列表csChains;基于目标分子所包含的联烯结构获得手性联烯列表cenes;基于目标分子中可对称旋转的单键获得手性单键列表csBonds;将上述结果汇总保存,得到分子的手性轴;若结果为空,则说明该分子不具有轴手性;本发明创造针对手性轴的不同形式,设计了寻找化学分子内手性轴的不同方法,填补了目前通过计算机处理轴手性化学信息领域的空白。
-
公开(公告)号:CN117393074A
公开(公告)日:2024-01-12
申请号:CN202311390314.2
申请日:2023-10-25
Applicant: 上海交通大学
IPC: G16C20/70 , G16C20/30 , G06V10/44 , G06V10/764 , G06V10/82 , G06V10/766 , G06N3/0464 , G06N3/048 , G06N3/082 , G06N3/096 , G06T7/00
Abstract: 本发明公开了基于元素表征添加微量元素的合金性能预测方法,获取预训练数据集,将预训练数据集中材料数据处理成PTR伪图像;基于PTR伪图像和长宽不变的卷积神经网络结构进行预训练,获得每种元素单质PTR伪图像对应的特征图;以特征图对应的该元素PTR位置为中心,离中心点的距离作为计算权重,加权求和特征图中每个位置的向量,得到特征通道维数的元素表征向量;对每个元素对应的元素表征进行加权求和得到和元素表征维数相同的嵌入描述符向量;基于计算好的嵌入描述符、可选择加入的其他材料特征和拟使用的机器学习算法,进行迁移学习,得到迁移学习模块预测模型。
-
公开(公告)号:CN110415763B
公开(公告)日:2023-05-23
申请号:CN201910722794.5
申请日:2019-08-06
Applicant: 腾讯科技(深圳)有限公司 , 上海交通大学
Abstract: 本申请公开了药物与靶标的相互作用预测方法、装置、设备及存储介质,属于计算机技术领域。方法包括:获取药物‑靶标对的样本集;获取样本集中的药物的第一特征和靶标的第一特征;基于样本集中药物的第一特征、靶标的第一特征、以及药物‑靶标对的相互作用信息,训练从药物空间到靶标空间的投影模型,得到目标投影模型;当接收到目标药物与目标靶标的预测指令时,获取目标药物的第一特征和目标靶标的第一特征,将目标药物的第一特征和目标靶标的第一特征输入目标投影模型,输出目标药物与目标靶标的相互作用结果。基于上述过程,目标投影模型的训练效果较好,基于目标投影模型预测的药物与靶标的相互作用的准确率较高。
-
公开(公告)号:CN112562788B
公开(公告)日:2022-06-28
申请号:CN202011575605.5
申请日:2020-12-28
Applicant: 上海交通大学
IPC: G16B30/00 , G16B50/30 , G16B20/00 , G06Q10/04 , G06N3/08 , G06F40/289 , G06F40/242
Abstract: 本发明公开了一种环状RNA‑RNA结合蛋白关系预测模型构建方法,解决了现有技术仅限制了预测准确率的问题,其技术方案要点是将初始的环状RNA序列数据集样本构造为环状RNA‑RNA结合蛋白序列对的形式;采用自监督学习的方式训练得到词向量字典;根据训练得到的词向量字典,将样本序列对映射成对应的词向量矩阵作为表征;将样本序列对的向量表征对应输入伪孪生网络,得到编码后的特征向量输入到度量函数中,计算绑定概率预测值并计算获得其与标签的差值,优化模型参数;模型训练迭代结束后保存得到的模型,本发明的环状RNA‑RNA结合蛋白关系预测模型构建方法,能针对RNA序列和蛋白质序列进行数据挖掘,能有效提高环状RNA‑RNA结合蛋白结合预测的准确率。
-
-
公开(公告)号:CN112562788A
公开(公告)日:2021-03-26
申请号:CN202011575605.5
申请日:2020-12-28
Applicant: 上海交通大学
IPC: G16B30/00 , G16B50/30 , G16B20/00 , G06Q10/04 , G06N3/08 , G06F40/289 , G06F40/242
Abstract: 本发明公开了一种环状RNA‑RNA结合蛋白关系预测模型构建方法,解决了现有技术仅限制了预测准确率的问题,其技术方案要点是将初始的环状RNA序列数据集样本构造为环状RNA‑RNA结合蛋白序列对的形式;采用自监督学习的方式训练得到词向量字典;根据训练得到的词向量字典,将样本序列对映射成对应的词向量矩阵作为表征;将样本序列对的向量表征对应输入伪孪生网络,得到编码后的特征向量输入到度量函数中,计算绑定概率预测值并计算获得其与标签的差值,优化模型参数;模型训练迭代结束后保存得到的模型,本发明的环状RNA‑RNA结合蛋白关系预测模型构建方法,能针对RNA序列和蛋白质序列进行数据挖掘,能有效提高环状RNA‑RNA结合蛋白结合预测的准确率。
-
公开(公告)号:CN1773517A
公开(公告)日:2006-05-17
申请号:CN200510110216.4
申请日:2005-11-10
Applicant: 上海交通大学
IPC: G06F19/00
Abstract: 一种计算机应用技术领域的基于中文分词技术的蛋白质序列特征提取方法,包括以下步骤:(1)根据训练样本中的序列建立词典,找出对分类有用的氨基酸序列子串的集合;(2)切分序列,即对所有样本进行切分,将序列样本与建立好的词典中的词条进行匹配,并选择最优切分方式;(3)切分完毕后进行序列统计,统计每条序列中出现词典中各个词的频率,把序列转化为数值向量;(4)最后用转化好的特征对蛋白质进行分类。本发明提取出的特征可以用于多种蛋白质分类问题,如蛋白质亚细胞定位、结构预测等等。用本发明的方法可提高分类精度,并大幅度减少特征向量的维数。
-
公开(公告)号:CN117350961A
公开(公告)日:2024-01-05
申请号:CN202311272439.5
申请日:2023-09-28
Applicant: 上海交通大学
IPC: G06T7/00 , G06N3/0455 , G06N3/0464
Abstract: 本发明公开了一种荧光原位杂交3D显微图像中的荧光点识别方法,包括:对3D荧光显微图像进行图像预处理,转化成2D样本,得到训练集;将2D荧光显微图像输入编码器得到亮点判别表征;将对应2D荧光点坐标转化成亮点判别目标,计算亮点判别表征与判别目标的差值并优化编码器的模型参数,进行多轮次迭代得到训练好的编码器;将2D荧光显微图像输入自编码器得到亮点分割表征,将对应2D荧光点坐标转化成亮点分割目标,计算亮点分割表征与分割目标的差值并优化自编码器的模型参数,进行多轮迭代得到训练好的自编码器;采用自编码器对3D荧光显微图像进行识别得到3D荧光点坐标。采用自编码器的网络结构,通过预训练编码器的方法,提高了荧光亮点识别的准确率。
-
-
公开(公告)号:CN109948703A
公开(公告)日:2019-06-28
申请号:CN201910211685.7
申请日:2019-03-20
Applicant: 上海交通大学
Abstract: 一种基于深度学习的基因图像处理方法、系统、介质及设备,获取原始图像,据以组建标注为样本集;划分样本集为训练样本和测试样本,获取并提取预选模型,据以迁移学习训练样本得图像预测模型;根据图像模型计算测试样本得预测计算结果;获取实际监测结果,比较实际监测结果与预测计算结果得指标计算信息,据以计算性能指标数据。本发明解决了现有技术存在的噪音图片过多、模型性能较差和图片标注效果较差的技术问题。
-
-
-
-
-
-
-
-
-