-
公开(公告)号:CN115292549B
公开(公告)日:2022-12-20
申请号:CN202211224562.5
申请日:2022-10-09
Applicant: 北京语言大学
IPC: G06F16/84
Abstract: 本发明提供了一种基于规则的树库自动转换方法及系统,涉及自然语言处理技术领域。包括:将输入的短语结构字符串进行多叉树数据结构构造;初始化xml存储根节点xml_root对象;对多叉树进行先序遍历;判断句子中是否存在小句,若不存在则进行规则转换流程;遍历每个子节点,判断子节点是否符合句法成分转换规则以及句式转换规则,新建xml_root的子节点;对终端节点进行词性规则的转换,根据词性转换规则表将其转换为句式结构树库的词性;将更新的xml_root转换为xml字符串,生成xml文件。充分利用短语结构树库和句式结构树库的标注体系的对应规律,为建立高质量的树库转换模型和句式结构句法分析器提供了有效的数据支持,对句式结构自动句法分析等研究具有重要意义。
-
公开(公告)号:CN115292549A
公开(公告)日:2022-11-04
申请号:CN202211224562.5
申请日:2022-10-09
Applicant: 北京语言大学
IPC: G06F16/84
Abstract: 本发明提供了一种基于规则的树库自动转换方法及系统,涉及自然语言处理技术领域。包括:将输入的短语结构字符串进行多叉树数据结构构造;初始化xml存储根节点xml_root对象;对多叉树进行先序遍历;判断句子中是否存在小句,若不存在则进行规则转换流程;遍历每个子节点,判断子节点是否符合句法成分转换规则以及句式转换规则,新建xml_root的子节点;对终端节点进行词性规则的转换,根据词性转换规则表将其转换为句式结构树库的词性;将更新的xml_root转换为xml字符串,生成xml文件。充分利用短语结构树库和句式结构树库的标注体系的对应规律,为建立高质量的树库转换模型和句式结构句法分析器提供了有效的数据支持,对句式结构自动句法分析等研究具有重要意义。
-