一种语言元素分析方法、装置、电子设备和存储介质
Abstract:
本公开实施例公开了一种语言元素分析方法、装置、电子设备和存储介质。本公开通过获取预设编程语言的源代码文件,在该源代码文件包括的多行源代码的每行源代码中添加行号,该行号可作为辅助信息可以更好的区分每行源代码。另外在此基础上识别多行源代码中的预设段落,并将预设段落替换为第一预设标识,降低了预设段落对语言元素分析的影响。进一步,识别多行源代码中的预设符号,并对预设符号相关联的部分源代码进行单行化处理,使得同一个语言元素可以分布在同一行中,避免同一个语言元素分布在多行中而影响对语言元素的分析。进一步,在单行化处理后的多行源代码的基础上识别语言元素,实现了一种能够较为准确的从源代码中提取语言元素的方法。
Public/Granted literature
Patent Agency Ranking
0/0