一种基于对偶的序列到序列生成的论文网络表示学习方法

    公开(公告)号:CN111104797A

    公开(公告)日:2020-05-05

    申请号:CN201911300281.1

    申请日:2019-12-17

    Applicant: 南开大学

    Inventor: 刘杰 李娜 何志成

    Abstract: 一种基于对偶的序列到序列生成的论文网络表示学习方法,该方法包括:论文平行序列生成部分;论文节点识别部分(论文内容嵌入,论文内容序列编码,论文标识序列生成);论文内容生成部分(论文节点标识嵌入,论文标识序列编码,论文语义解码,论文内容生成);和对偶融合部分。本发明综合论文网络中论文节点的内容信息(即论文的题目或摘要)和论文间的结构信息(即论文间的引用关系),通过两种信息的互相映射过程将两种信息融合得更充分,学习到更具有含义的论文节点的表征。本发明还可以在解码出输入论文序列的文本内容之后继续解码出新的文本,即考虑到输入的论文序列的结构信息和内容信息之后预测出的新的论文内容。

    一种基于对偶的序列到序列生成的论文网络表示学习方法

    公开(公告)号:CN111104797B

    公开(公告)日:2023-05-02

    申请号:CN201911300281.1

    申请日:2019-12-17

    Applicant: 南开大学

    Inventor: 刘杰 李娜 何志成

    Abstract: 一种基于对偶的序列到序列生成的论文网络表示学习方法,该方法包括:论文平行序列生成部分;论文节点识别部分(论文内容嵌入,论文内容序列编码,论文标识序列生成);论文内容生成部分(论文节点标识嵌入,论文标识序列编码,论文语义解码,论文内容生成);和对偶融合部分。本发明综合论文网络中论文节点的内容信息(即论文的题目或摘要)和论文间的结构信息(即论文间的引用关系),通过两种信息的互相映射过程将两种信息融合得更充分,学习到更具有含义的论文节点的表征。本发明还可以在解码出输入论文序列的文本内容之后继续解码出新的文本,即考虑到输入的论文序列的结构信息和内容信息之后预测出的新的论文内容。

    一种基于自适应Dropout非负矩阵分解的特征学习模型

    公开(公告)号:CN106779090B

    公开(公告)日:2019-03-08

    申请号:CN201611159985.8

    申请日:2016-12-15

    Applicant: 南开大学

    Abstract: 一种基于自适应Dropout非负矩阵分解的特征学习模型。本发明基于对NMF中隐藏特征之间关系的分析,提出一种基于自适应Dropout非负矩阵分解的特征学习模型(Adaptive Dropout Non‑negative Matrix Factorization),能够主动学习隐藏特征之间的相异度,并将其转化为隐藏特征的数据表示能力。然后在此基础上构造概率函数,并对隐藏特征进行Dropout,从而降低隐藏特征在优化过程中的相互影响,提高隐藏特征的语义独立性。本发明具有良好的可解释性和泛化性,能够在文本和图像数据上取得明显的性能提升,并能够应用到已有的基于NMF的算法中。此外,本发明还具有良好的可并行性,可以部署到并行平台上运行,用来处理大规模数据。

    一种对异质网络中的节点进行聚类的方法

    公开(公告)号:CN105512511B

    公开(公告)日:2018-07-06

    申请号:CN201510823808.4

    申请日:2015-11-24

    Applicant: 南开大学

    Abstract: 本发明公开了一种对异质网络中的节点进行聚类的方法,该聚类方法属于数据挖掘、生物信息领域,该聚类方法包括以下步骤:根据异质节点间的关联关系数据,构建相邻两层节点间关联矩阵;对于具有层次结构的节点,根据节点间的层次关联关系,构建不同层次的节点内层次关联矩阵;以节点间关联矩阵和节点内层次关联矩阵作为输入,构建一致性多非负矩阵分解模型,并进行优化,得到节点聚类矩阵;对节点聚类矩阵进行归一化处理,若节点与簇的相关性大于给定阈值,则认为该节点属于该簇,完成对节点的聚类。本发明实现了对异质节点间多层关联关系和节点内层次关联关系进行建模,达到了很好的节点聚类效果。

    一种基于自适应Dropout非负矩阵分解的特征学习模型

    公开(公告)号:CN106779090A

    公开(公告)日:2017-05-31

    申请号:CN201611159985.8

    申请日:2016-12-15

    Applicant: 南开大学

    CPC classification number: G06N99/005

    Abstract: 一种基于自适应Dropout非负矩阵分解的特征学习模型。本发明基于对NMF中隐藏特征之间关系的分析,提出一种基于自适应Dropout非负矩阵分解的特征学习模型(Adaptive Dropout Non‑negative Matrix Factorization),能够主动学习隐藏特征之间的相异度,并将其转化为隐藏特征的数据表示能力。然后在此基础上构造概率函数,并对隐藏特征进行Dropout,从而降低隐藏特征在优化过程中的相互影响,提高隐藏特征的语义独立性。本发明具有良好的可解释性和泛化性,能够在文本和图像数据上取得明显的性能提升,并能够应用到已有的基于NMF的算法中。此外,本发明还具有良好的可并行性,可以部署到并行平台上运行,用来处理大规模数据。

    一种基于一致性多非负矩阵分解的聚类方法

    公开(公告)号:CN105512511A

    公开(公告)日:2016-04-20

    申请号:CN201510823808.4

    申请日:2015-11-24

    Applicant: 南开大学

    CPC classification number: G06F19/24

    Abstract: 本发明公开了一种基于一致性多非负矩阵分解的聚类方法,该聚类方法属于数据挖掘、生物信息领域,该聚类方法包括以下步骤:根据异质节点间的关联关系数据,构建相邻两层节点间关联矩阵;对于具有层次结构的节点,根据节点间的层次关联关系,构建不同层次的节点内层次关联矩阵;以节点间关联矩阵和节点内层次关联矩阵作为输入,构建一致性多非负矩阵分解模型,并进行优化,得到节点聚类矩阵;对节点聚类矩阵进行归一化处理,若节点与簇的相关性大于给定阈值,则认为该节点属于该簇,完成对节点的聚类。本发明实现了对异质节点间多层关联关系和节点内层次关联关系进行建模,达到了很好的节点聚类效果。

Patent Agency Ranking