基于TF-IGM的文本特征向量生成方法和装置及文本分类方法和装置

    公开(公告)号:CN104750844B

    公开(公告)日:2016-03-02

    申请号:CN201510165395.5

    申请日:2015-04-09

    Applicant: 中南大学

    Abstract: 本发明公开了一种基于TF-IGM的文本特征向量生成方法和装置及文本分类方法和装置,通过建立反重力矩(IGM)模型来计算特征词在不同类别文本中分布的集中度,并在此基础上计算特征词的权重。计算所得权重更能逼真地反映特征词在文本分类中的重要性,提高了文本分类器的性能。基于TF-IGM方法的文本特征向量生成装置具备多个选项,可根据文本分类性能测试结果进行优化调节,适应具有不同特性的文本数据集。在公共的英文语料库和中文语料库上的实验表明,TF-IGM方法比TF-IDF、TF-RF等现有方法更加优越,尤其适合两类以上的多类别文本分类应用。

    一种测量铝合金连续冷却转变曲线的方法

    公开(公告)号:CN105044151A

    公开(公告)日:2015-11-11

    申请号:CN201510530618.3

    申请日:2015-08-26

    Applicant: 中南大学

    Abstract: 本发明涉及一种测量铝合金连续冷却转变曲线的方法,属于有色金属材料制备技术领域。本发明通过记录在不同温度区间的热当量的变化,从而依据热当量的变化来分辨在淬火过程中淬火反应的析出温度区间;本发明通过应用差示扫描量热法(DSC)来测量铝合金在淬火过程中的放热反应,结合微观组织分析和力学性能测试,从而获得铝合金的连续冷却转变曲线。与其他方法相比,本发明方法能够在一定冷却区间的精确冷却曲线和分辨不同淬火诱导析出相的起始和终止温度。本发明所得连续冷却转变曲线具有精度高,指导意义大等优势。

    基于TF-IGM的文本特征向量生成方法和装置及文本分类方法和装置

    公开(公告)号:CN104750844A

    公开(公告)日:2015-07-01

    申请号:CN201510165395.5

    申请日:2015-04-09

    Applicant: 中南大学

    Abstract: 本发明公开了一种基于TF-IGM的文本特征向量生成方法和装置及文本分类方法和装置,通过建立反重力矩(IGM)模型来计算特征词在不同类别文本中分布的集中度,并在此基础上计算特征词的权重。计算所得权重更能逼真地反映特征词在文本分类中的重要性,提高了文本分类器的性能。基于TF-IGM方法的文本特征向量生成装置具备多个选项,可根据文本分类性能测试结果进行优化调节,适应具有不同特性的文本数据集。在公共的英文语料库和中文语料库上的实验表明,TF-IGM方法比TF-IDF、TF-RF等现有方法更加优越,尤其适合两类以上的多类别文本分类应用。

    一种基于空间关系感知的地名实体识别方法、介质和设备

    公开(公告)号:CN119129600A

    公开(公告)日:2024-12-13

    申请号:CN202411603699.0

    申请日:2024-11-12

    Applicant: 中南大学

    Abstract: 本发明涉及自然语言处理技术领域,具体涉及一种基于空间关系感知的地名实体识别方法、介质和设备,所述方法包括如下步骤:通过网络中地名实体的自然语言句子以及处理地理数据集构造的伪句子构建语料库,利用伪句子和自然语言句子,采用对比学习和掩码语言建模学习进一步训练自然语言模型。本方法基于自然语言模型搭建一种中文命名实体识别模型:通过词向量转换学习字符级特征表示,自然语言模型学习词级特征表示,融合嵌入层整合字符级特征表示和词级特征表示生成新的特征表示,通过双向长短期记忆网络提取文本上下文语义特征,条件随机场获得全局最优的标签序列,实现地名实体识别。本发明方法提升了地名实体识别模型的整体性能。

    基于知识图谱和深度学习的跨模态数据融合方法和系统

    公开(公告)号:CN118898049B

    公开(公告)日:2024-12-13

    申请号:CN202411394834.5

    申请日:2024-10-08

    Applicant: 中南大学

    Inventor: 杨柳 唐琨 刘丽敏

    Abstract: 本申请公开了一种基于知识图谱和深度学习的跨模态数据融合方法和系统,本方法为每一个时间节点的不同模态数据构建对应的第一知识图谱,通过深度学习方法融合每一种模态数据相应的第一知识图谱,得到对应第二知识图谱,不仅保留了各模态的特异性信息,还能深入挖掘不同模态之间的复杂关系,从而实现更全面和精准的数据分析;本方法还考虑了时间维度,为每一个时间节点都构建出第二知识图谱,每个时间节点对应的图谱代表了该时间节点的数据状态,能体现数据随时间的变化,通过不同时间节点的图谱,使得时间上连续的数据能够被有效关联,结合不同时间节点下的融合后的第二知识图谱,从时间序列上实现更全面和精准的数据分析。

    一种面向异质图的图匹配方法、设备及介质

    公开(公告)号:CN118467793A

    公开(公告)日:2024-08-09

    申请号:CN202410923861.0

    申请日:2024-07-11

    Applicant: 中南大学

    Abstract: 本发明涉及数据处理技术领域,具体公开了一种面向异质图的图匹配方法、设备及介质,本发明方法基于扩散模型和注意力机制计算图对的结构相似特征,并通过多层匹配网络进行对比学习,得到超边‑超边的匹配向量以及超边‑超图的匹配向量,基于超边‑超边的匹配向量以及超边‑超图的匹配向量得到生成语义相似特征;将结构相似特征和语义相似特征拼接,得到图对的全局对比特征向量,将全局对比特征向量输入全连接神经网络,得到用于反应图对相似程度的相似度得分。本发明方法结合语义与结构特征,融合图结构自身的相似特征以及节点与从属社区特征学习语义信息,本发明提出的异质图相似学习方法考虑更全面,又能有效准确的得到图对的相似度得分。

    一种基于Motif的时序学术超图网络推理方法

    公开(公告)号:CN117350385A

    公开(公告)日:2024-01-05

    申请号:CN202311355192.3

    申请日:2023-10-19

    Applicant: 中南大学

    Abstract: 本发明公开了一种基于Motif的时序学术超图网络推理方法,包括如下步骤:步骤S1:构建时序学术网络图的超图;步骤S2:嵌入和聚合时序学术网络图的Motif特征;步骤S3:提取节点的时序特征;步骤S4:学术网络推理演绎:采用特征解码器对时序特征提取层输出的时序特征进行解码,输出最终的概率矩阵,基于概率矩阵和学术推理损失函数实现学术网络的推理演绎。优点是,本发明将Motif结构引入时序超图链路预测中,优化超图结构表征,并增加了额外的Motif信息使得预测效果提高。另外,本发明将Motif嵌入融入超图卷积中,使得信息传播的过程附带Motif特征,增加了卷积过程的信息量,使得聚合信息的内容更为完善。

    一种基于FastText-CRF的引文元数据抽取方法

    公开(公告)号:CN110516069B

    公开(公告)日:2023-07-25

    申请号:CN201910799548.X

    申请日:2019-08-28

    Applicant: 中南大学

    Inventor: 杨柳 胡雷 龙军

    Abstract: 本发明公开了一种基于FastText‑CRF的引文元数据抽取方法,考虑了引文段对引文元数据的影响,先从引文数据中提取引文段,然后利用FastText模型做一个分类器,对引文段做一个粗分类,最后将粗分类的结果输入到CRF(条件随机场模型)得出最后的分类标签。通过将FastText模型与CRF模型相结合的技术应用于引文元数据抽取,可以改进现有的引文元数据抽取的效果,极大缩短引文元数据抽取时间。

    一种面向学者学术网络构建的关系抽取方法

    公开(公告)号:CN116415005A

    公开(公告)日:2023-07-11

    申请号:CN202310684297.7

    申请日:2023-06-12

    Applicant: 中南大学

    Abstract: 本发明公开了一种面向学者学术网络构建的关系抽取方法,包括如下步骤:步骤S1:构建包括至少两个教师模型的多教师模型,计算教师模型权重;步骤S2:构建学生模型,根据灵活温度计算蒸馏目标分布,计算知识蒸馏损失,结合知识蒸馏损失和远程监督损失计算总损失;步骤S3,进行关系抽取,学生模型进行训练,得到关系抽取模型,利用关系抽取模型对输入的数据集进行关系抽取。优点是,本发明考虑到样本的差异而设置灵活温度,使用样本在隐藏层和分类层的信息熵相对差值,尽可能保留样本的有效信息,并降低样本标签软化的不确定性;另外,本发明将多教师的思想引入到了关系抽取之中,通过构建不同教师的全局关系,以传播更丰富且有效的知识。

Patent Agency Ranking