一种基于翻译匹配的跨语言属性级情感分类方法

    公开(公告)号:CN114238636B

    公开(公告)日:2024-12-06

    申请号:CN202111529633.8

    申请日:2021-12-14

    Applicant: 东南大学

    Abstract: 本发明公开了一种基于翻译匹配的跨语言属性级情感分类方法,该方法能够利用语料资源丰富的源语言提升语料资源稀缺的目标语言属性级情感分类的性能,包括领域分类和属性情感分类两部分,在模型构建过程中基于模型特征设置了模型的超参,包括多头自注意力层数量、梯度反转超参值等。领域分类利用领域判别器与语言编码器的对抗训练减小机器翻译导致真实语言与翻译语言的领域偏差问题,属性情感分类对属性序列表示和句子序列表示细粒度交互获得属性级句子表示,然后通过全连接层和softmax层获得最终情感预测结果。本发明提出的属性级情感分类模型构建代价小,并且对比试验验证结果表明,相较于其他模型,本发明提出的属性级情感分类模型结果最优。

    一种基于多模态主动学习的中文分词方法

    公开(公告)号:CN115496064A

    公开(公告)日:2022-12-20

    申请号:CN202210796242.0

    申请日:2022-07-07

    Abstract: 本发明公开了一种基于多模态主动学习的中文分词方法,使用音频特征作为模型补充输入,利用声学信息帮助分词。为了减少音频特征工程工作量,仅使用MFCC特征利用深度卷积神经网络ResNet进行音频特征提取。同时引入依存句法信息,利用异构图注意力神经网络实现依存句法结构图节点特征更新,使用注意力机制融合文本特征和句法结构特征得到句法文本特征,以缓解标注语料匮乏问题。本发明使用了主动学习策略,构造多样性预测模块,预测未标注样本所含信息量,选择富含信息的未标注样本进行人工标注,与已标注样本一起作为训练数据迭代提升模型性能。本发明在减少数据标注代价的基础上,在中文分词的各方面性能都较其他基线方法有了一定提升。

    一种基于solr技术的分布式搜索方法及系统

    公开(公告)号:CN104142968A

    公开(公告)日:2014-11-12

    申请号:CN201310577657.X

    申请日:2013-11-19

    Applicant: 东南大学

    CPC classification number: G06F17/30864

    Abstract: 本发明公开了一种基于solr技术的分布式搜索方法及系统。其中,该方法包括:1)当离线客户端系统对电子文件进行登记归档时,首先基于朴素贝叶斯算法,对电子文件进行自动分类;2)电子文件分类完毕后,根据电子文件所属类别,基于一致性哈希算法对电子文件进行分布式索引;3)索引文件建立完毕后,用户输入查询语句进行电子文件的查询。该系统采用开源搜索工具Solr的分发模式,将查询请求分发到分布式节点,各个分布式节点响应搜索请求,然后对结果进行合并去重,排序好后返回给用户,实现了分布式垂直搜索。通过上述方式,本发明能够提高电子文件自动分类的准确性,增强系统的稳定性。

    一种基于Hadoop中小文件优化和倒排索引的方法

    公开(公告)号:CN103678491A

    公开(公告)日:2014-03-26

    申请号:CN201310563664.4

    申请日:2013-11-14

    Applicant: 东南大学

    CPC classification number: G06F17/30194 G06F17/30094

    Abstract: 本发明公开了一种基于Hadoop中小文件优化和倒排索引的方法,能够向HDFS分布式文件系统上传海量小文件和对HDFS分布式文件系统上的文件建立倒排索引,所述方法包括小文件优化和建立倒排索引过程;主要包括以下步骤:(1)用户向Hadoop上传大量相对于HDFS块大小的小文件到小文件队列;(2)定时计算文件队列中小文件的大小;(3)使用Sequencefile序列文件方法将达到要求的小文件队列中的文件进行合并后上传到HDFS;(4)对HDFS上的文件建立倒排索引。该方法针对Hadoop处理小文件方便的不足提出优化方案,能够优化小文件的处理性能,释放内存,提高检索的速度和效率。

    一种利用深度神经网络进行论文多标签分类的方法

    公开(公告)号:CN112434159B

    公开(公告)日:2024-08-02

    申请号:CN202011286949.4

    申请日:2020-11-17

    Applicant: 东南大学

    Abstract: 本发明公开了一种利用深度神经网络进行论文多标签分类的方法,该方法将多标签分类视为标签序列生成过程;方法分为输入序列特征学习阶段和标签序列生成(预测)阶段;该方法将多标签分类视为标签序列生成过程;方法分为输入序列特征学习阶段和标签序列生成(预测)阶段;其中在所述输入序列特征学习阶段,本发明根据论文文本序列,利用双向长短时记忆网络生成特征向量序列;在所述标签序列生成阶段,将由特征向量序列构成的上下文向量和上一时刻的标签嵌入向量输入单向长短时记忆网络,来预测该论文可能所属的下一个标签。模型通过优化后的梯度下降算法进行迭代训练,最终使用训练好的模型,结合Beam Search算法对论文所属类别进行多标签分类。

    一种利用深度神经网络进行论文多标签分类的方法

    公开(公告)号:CN112434159A

    公开(公告)日:2021-03-02

    申请号:CN202011286949.4

    申请日:2020-11-17

    Applicant: 东南大学

    Abstract: 本发明公开了一种利用深度神经网络进行论文多标签分类的方法,该方法将多标签分类视为标签序列生成过程;方法分为输入序列特征学习阶段和标签序列生成(预测)阶段;该方法将多标签分类视为标签序列生成过程;方法分为输入序列特征学习阶段和标签序列生成(预测)阶段;其中在所述输入序列特征学习阶段,本发明根据论文文本序列,利用双向长短时记忆网络生成特征向量序列;在所述标签序列生成阶段,将由特征向量序列构成的上下文向量和上一时刻的标签嵌入向量输入单向长短时记忆网络,来预测该论文可能所属的下一个标签。模型通过优化后的梯度下降算法进行迭代训练,最终使用训练好的模型,结合Beam Search算法对论文所属类别进行多标签分类。

    一种利用卷积神经网络提高视频分辨率的方法

    公开(公告)号:CN108805808A

    公开(公告)日:2018-11-13

    申请号:CN201810293104.4

    申请日:2018-04-04

    Applicant: 东南大学

    CPC classification number: G06T3/4053 G06N3/0454

    Abstract: 本发明公开了一种利用卷积神经网络提高视频分辨率的方法,该方法针对视频图像序列构建了基于卷积神经网络的视频超分辨率重建模型,在模型构建过程中基于视频图像序列的特点设置了卷积神经网络的超参数,包括卷积核尺寸、神经网络层数等;然后利用单图像的超分辨率方法产生的图像训练权重用来初始化视频模型的权重参数,并充分利用视频帧间的冗余信息,以多帧视频图像作为卷积神经网络模型的输入,通过增量式的迭代方法,最终得到高分辨率的视频。本发明提出的视频超分辨率模型训练速度快且预测精度高,对比试验验证结果表明,相对于其他超分辨率算法,利用本发明的方法重建出的图像的峰值信噪比和结构相似性具有综合最优结果。

    一种自然语言处理系统化服务平台

    公开(公告)号:CN105183470B

    公开(公告)日:2018-11-30

    申请号:CN201510557337.7

    申请日:2015-09-06

    Applicant: 东南大学

    Abstract: 本发明公开了一种自然语言处理系统化服务平台,包括稳定的流式处理系统、非稳定的机器集群系统和分布式多副本下载系统;C‑API接口、Python接口和http服务端接口;多语言服务框架和分布式远程调用服务器;所述流式处理系统采用消息队列的设计方式,消息队列分为队头和队尾两个组件,算子从队尾组件中接收数据进行并行并消费,实现数据的传递。本发明利用了计算机多核并行计算的优势,充分均衡的利用高性能计算机的计算资源,构架出高效高可靠性的自然语言平台,本发明的HTTP接口、C++语言和python的接口,提供方便在接口方面的调用,支持多平台的调用,具有很好的工程应用价值。

    一种基于JMS消息总线的服务器实时推送系统及方法

    公开(公告)号:CN103780680B

    公开(公告)日:2017-05-24

    申请号:CN201410004255.5

    申请日:2014-01-06

    Applicant: 东南大学

    Abstract: 本发明公开了一种基于JMS消息总线的服务器实时推送系统及方法,用于LED隧道照明灯智能控制系统中,包括:串口通信模块、与串口通信模块相连接的JMS消息总线、与JMS消息总线相连接的数据处理模块、信息推送模块和控制转发模块、与数据处理模块相连接的JCS缓存,所述控制转发模块又与所述数据处理模块相连接。通过采用数据处理模块与JCS缓存中的数据进行比对,提高计算和处理速度;通过采用JMS消息总线和串口通信模块实现信息推送及远程控制,提高服务器的利用率和通讯的即时性;采用DIV+CSS布局的JSP界面作为系统界面,提高了服务器的信息解析、显示和传送速度,保证通讯即时性、友好交互性和高兼容性。

Patent Agency Ranking