-
公开(公告)号:CN115292251A
公开(公告)日:2022-11-04
申请号:CN202210697122.5
申请日:2022-06-20
Applicant: 国网山东省电力公司营销服务中心(计量中心) , 国家电网有限公司
Inventor: 张雪梅 , 刘昳娟 , 陈云龙 , 吴雪霞 , 刘继彦 , 王者龙 , 鞠文杰 , 王为帅 , 于相洁 , 王倩 , 高玉华 , 李静 , 徐美玲 , 侯燕文 , 邹喜林 , 王若晗 , 任昶羽 , 李兆茹 , 隋欣 , 李丽
IPC: G06F16/16 , G06F40/151 , G06F40/166 , G06F40/30 , G06N3/04 , G06N3/08
Abstract: 本公开属于文本分类技术领域,提供了一种基于序列编码的文件分类标注方法与系统,包括以下步骤:获取待分类文件的位置特征;根据所获取的位置特征,对待分类文件中单词级的句法和语义信息进行词嵌入,对待分类文件中的句子级的关系和结构信息进行序列编码,完成待分类文件从文档空间到矢量空间的转换;提取待分类文件的矢量空间特征,对所提取的矢量空间特征进行序列编码;基于矢量空间特征的序列编码和预设的文件分类模型,进行文件的分类。