-
公开(公告)号:CN114238636A
公开(公告)日:2022-03-25
申请号:CN202111529633.8
申请日:2021-12-14
Applicant: 东南大学
IPC: G06F16/35 , G06F40/211 , G06F40/263 , G06F40/58 , G06N3/04 , G06N3/08
Abstract: 本发明公开了一种基于翻译匹配的跨语言属性级情感分类方法,该方法能够利用语料资源丰富的源语言提升语料资源稀缺的目标语言属性级情感分类的性能,包括领域分类和属性情感分类两部分,在模型构建过程中基于模型特征设置了模型的超参,包括多头自注意力层数量、梯度反转超参值等。领域分类利用领域判别器与语言编码器的对抗训练减小机器翻译导致真实语言与翻译语言的领域偏差问题,属性情感分类对属性序列表示和句子序列表示细粒度交互获得属性级句子表示,然后通过全连接层和softmax层获得最终情感预测结果。本发明提出的属性级情感分类模型构建代价小,并且对比试验验证结果表明,相较于其他模型,本发明提出的属性级情感分类模型结果最优。
-
公开(公告)号:CN114238636B
公开(公告)日:2024-12-06
申请号:CN202111529633.8
申请日:2021-12-14
Applicant: 东南大学
IPC: G06F16/35 , G06F40/211 , G06F40/263 , G06F40/58 , G06N3/0455 , G06N3/0475 , G06N3/094 , G06N3/096
Abstract: 本发明公开了一种基于翻译匹配的跨语言属性级情感分类方法,该方法能够利用语料资源丰富的源语言提升语料资源稀缺的目标语言属性级情感分类的性能,包括领域分类和属性情感分类两部分,在模型构建过程中基于模型特征设置了模型的超参,包括多头自注意力层数量、梯度反转超参值等。领域分类利用领域判别器与语言编码器的对抗训练减小机器翻译导致真实语言与翻译语言的领域偏差问题,属性情感分类对属性序列表示和句子序列表示细粒度交互获得属性级句子表示,然后通过全连接层和softmax层获得最终情感预测结果。本发明提出的属性级情感分类模型构建代价小,并且对比试验验证结果表明,相较于其他模型,本发明提出的属性级情感分类模型结果最优。
-
公开(公告)号:CN115496064A
公开(公告)日:2022-12-20
申请号:CN202210796242.0
申请日:2022-07-07
Applicant: 东南大学 , 国网江苏省电力有限公司
IPC: G06F40/289 , G06F40/211 , G06K9/62 , G06N3/04 , G06N3/08
Abstract: 本发明公开了一种基于多模态主动学习的中文分词方法,使用音频特征作为模型补充输入,利用声学信息帮助分词。为了减少音频特征工程工作量,仅使用MFCC特征利用深度卷积神经网络ResNet进行音频特征提取。同时引入依存句法信息,利用异构图注意力神经网络实现依存句法结构图节点特征更新,使用注意力机制融合文本特征和句法结构特征得到句法文本特征,以缓解标注语料匮乏问题。本发明使用了主动学习策略,构造多样性预测模块,预测未标注样本所含信息量,选择富含信息的未标注样本进行人工标注,与已标注样本一起作为训练数据迭代提升模型性能。本发明在减少数据标注代价的基础上,在中文分词的各方面性能都较其他基线方法有了一定提升。
-
公开(公告)号:CN114693949A
公开(公告)日:2022-07-01
申请号:CN202210352426.8
申请日:2022-04-05
Applicant: 东南大学 , 国网江苏省电力有限公司电力科学研究院
Abstract: 本发明公开了一种基于区域感知对齐网络的多模态评价对象抽取方法,该方法针对社交媒体语料特点构建了具有编码层、共同注意力层、解码层的多模态评价对象抽取模型,在模型构建过程中基于社交媒体语料特点设置了RAN中超参数,包括句子长度、单词长度等,此外模型使用Xavier方法进行参数初始化。模型通过编码层分别获得语料文本和图片特征,之后通过共同注意力层将文本和图片特征融合得到多模态特征序列,最后将所得到的多模态特征序列通过解码层得到标签序列。对比试验验证结果表明,相较于其他模型,本发明提出的多模态评价对象抽取模型结果最优。
-
-
-