-
公开(公告)号:CN119578433A
公开(公告)日:2025-03-07
申请号:CN202411654900.8
申请日:2024-11-19
Applicant: 国网内蒙古东部电力有限公司信息通信分公司
Abstract: 本公开的实施例提供了一种基于人工智能对电力行业术语进行中蒙互译的方法及其装置,方法包括:构建电力行业术语的中文平行预料库以及蒙文平行语料库;基于所述中文平行预料库,生成电力行业术语的中文超图网络;基于所述蒙文平行语料库,生成电力行业术语的蒙文超图网络;对所述中文超图网络和所述蒙文超图网络进行双向语义关联,以建立电力行业术语的中文词语与蒙文词语之间的双向语义映射关系;获取用第一语言进行表述的电力文本内容,以与所述双向语义映射关系进行匹配,以得到用第二语言进行表述的电路文本内容,其中,当第一语言为中文时,所述第二语言为蒙文;当所述当第一语言为蒙文时,所述第二语言为中文。
-
公开(公告)号:CN119851302A
公开(公告)日:2025-04-18
申请号:CN202411908313.7
申请日:2024-12-24
Applicant: 国网内蒙古东部电力有限公司信息通信分公司
IPC: G06V30/412 , G06V30/16 , G06V30/164 , G06V30/18 , G06V30/146 , G06V30/162 , G06V30/246 , G06V10/82 , G06F40/58
Abstract: 本申请涉及图像处理、光学字符识别和自然语言处理领域,公开了基于图像识别进行蒙语电力表格数据提取的方法和系统,该方法包括以下步骤:对输入的电力表格图像样本进行图像预处理,提升图像质量;提取表格框架结构,优化表格线段位置,并分割出表格单元格;识别出各个单元格对应的电力业务字段并建立单元格和电力业务字段的映射关系;基于所述映射关系,生成结构化的电子表格数据,并将所述电力业务数据填充到所述结构化电子表格数据中。本发明通过引入表格结构优化、上下文关联字符提取及行业术语校正技术,有效提高了蒙语表格数据处理的效率与准确性,为电力行业的数字化管理和少数民族语言智能化应用提供了技术支持。
-