-
公开(公告)号:CN119830860A
公开(公告)日:2025-04-15
申请号:CN202411894311.7
申请日:2024-12-20
Applicant: 湖北天融信网络安全技术有限公司 , 北京天融信网络安全技术有限公司 , 北京天融信科技有限公司 , 北京天融信软件有限公司
IPC: G06F40/126 , G06F40/216 , G06F40/166 , G06F40/226
Abstract: 本申请提供了一种编码格式的识别方法、电子设备、存储介质及程序产品,包括:获取待检测编码文本;根据待检测编码文本的编码区间,判断编码区间是否属于至少两种编码格式的编码范围内;若是,根据每种编码格式对应的编码权重库中不同编码对应的权重值,确定每种编码格式对应的待检测编码文本的权重和;根据每种编码格式对应的待检测编码文本的权重和,确定待检测编码文本的目标编码格式。能够准确区分gbk编码格式和big5编码格式,提高了工作效率和编码格式识别的准确率。
-
公开(公告)号:CN114239493A
公开(公告)日:2022-03-25
申请号:CN202111582584.4
申请日:2021-12-22
Applicant: 湖北天融信网络安全技术有限公司 , 北京天融信网络安全技术有限公司 , 北京天融信科技有限公司 , 北京天融信软件有限公司
Inventor: 杨竣
IPC: G06F40/151 , G06F40/289
Abstract: 本申请实施例提供一种数据拦截方法及装置,涉及网络安全技术领域,该数据拦截方法包括:先获取数据中的待检测文本;再对待检测文本中的汉字进行拼音转换,得到文本拼音;并将文本拼音与预设的敏感关键字库进行匹配,得到匹配结果;当根据匹配结果确定出待检测文本中存在敏感关键字时,对数据进行拦截,能够在谐音字、拼音代替关键字的情况下,准确识别出敏感关键字并进行拦截,从而避免敏感关键字泄露,以保障信息安全。
-
公开(公告)号:CN114254591A
公开(公告)日:2022-03-29
申请号:CN202111580581.7
申请日:2021-12-22
Applicant: 湖北天融信网络安全技术有限公司 , 北京天融信网络安全技术有限公司 , 北京天融信科技有限公司 , 北京天融信软件有限公司
Inventor: 杨竣
IPC: G06F40/151
Abstract: 本申请实施例提供一种简繁转换工具的构建方法及装置,涉及数据处理技术领域,该简繁转换工具的构建方法包括:配置简体字库和繁体字库;然后构建简繁转换数组和繁简转换数组;在简体字库和繁体字库中,获取同一个汉字的简体字和繁体字;再将简体字和繁体字不相同的汉字,确定为目标汉字;最后将目标汉字的繁体字存入简繁转换数组中,以及将目标汉字的简体字存入繁简转换数组中,能够提高简繁转换速度,且转换速率不受简繁体字库大小的影响,在保证转换速率的同时保证转换精度,从而有利于提升简繁转换效率。
-
公开(公告)号:CN117744594A
公开(公告)日:2024-03-22
申请号:CN202311385686.6
申请日:2023-10-23
Applicant: 湖北天融信网络安全技术有限公司 , 北京天融信网络安全技术有限公司 , 北京天融信科技有限公司 , 北京天融信软件有限公司
IPC: G06F40/126 , G06F40/284 , G06N3/0455 , G06N3/08
Abstract: 本申请提供一种文字识别方法、装置、电子设备及计算机可读存储介质,其中,所述方法包括:获取图像的二进制数据;使用预设的字符编码格式对所述二进制数据进行解析,获得文字信息,上述方法中通过读取图像的二进制数据,解析二进制数据从而获取其中隐藏的文字,解决了现有技术中不能获取图像中隐藏文字的缺点。
-
公开(公告)号:CN117724760A
公开(公告)日:2024-03-19
申请号:CN202311765550.8
申请日:2023-12-20
Applicant: 湖北天融信网络安全技术有限公司 , 北京天融信网络安全技术有限公司 , 北京天融信科技有限公司 , 北京天融信软件有限公司
IPC: G06F8/73 , G06F40/279 , G06F40/216 , G06F40/242
Abstract: 本申请提供一种编程语言类型识别方法及装置,该方法包括:获取编程语言的代码样本文件和代码样本文件对应的数据文件;通过数据文件对代码样本文件进行学习,得到编程语言词典库;读取待检测代码数据;对待检测代码数据进行分段处理,得到分段代码;基于编程语言词典库和分段代码进行编程语言识别,得到目标编程语言类型;判断待检测代码数据是否通过目标编程语言类型对应的语法规则校验;如果是,则将待检测代码数据的语言类型确定为目标编程语言类型。可见,该方法及装置能够快速准确的确定待检测代码所使用的编程语言类型,适用性好,识别效率高。
-
公开(公告)号:CN115809357A
公开(公告)日:2023-03-17
申请号:CN202211552076.6
申请日:2022-12-05
Applicant: 湖北天融信网络安全技术有限公司 , 北京天融信网络安全技术有限公司 , 北京天融信科技有限公司 , 北京天融信软件有限公司
Inventor: 杨竣
IPC: G06F16/903 , G06F16/9035 , G06F16/901
Abstract: 本申请提供一种身份证号码识别方法、装置、电子设备和存储介质,其中,身份证号码识别方法包括:获取待检测数据流;基于滑动窗口从所述待检测数据流选取窗口字符串,其中,所述窗口字符串的字符长度与身份证号码的字符长度相等;基于身份证号码构成规则,将所述窗口字符串确定为预选身份证号码;校验所述预选身份证号码;当所述预选身份证号码校验通过时,将所述预选身份证号码确定为有效身份证号码。本申请能够基于滑动窗口从待检测数据流中识别出有效身份证号码。另一方面,本申请还具有无需修改代码等优点。
-
公开(公告)号:CN114254591B
公开(公告)日:2025-04-25
申请号:CN202111580581.7
申请日:2021-12-22
Applicant: 湖北天融信网络安全技术有限公司 , 北京天融信网络安全技术有限公司 , 北京天融信科技有限公司 , 北京天融信软件有限公司
Inventor: 杨竣
IPC: G06F40/151
Abstract: 本申请实施例提供一种简繁转换工具的构建方法及装置,涉及数据处理技术领域,该简繁转换工具的构建方法包括:配置简体字库和繁体字库;然后构建简繁转换数组和繁简转换数组;在简体字库和繁体字库中,获取同一个汉字的简体字和繁体字;再将简体字和繁体字不相同的汉字,确定为目标汉字;最后将目标汉字的繁体字存入简繁转换数组中,以及将目标汉字的简体字存入繁简转换数组中,能够提高简繁转换速度,且转换速率不受简繁体字库大小的影响,在保证转换速率的同时保证转换精度,从而有利于提升简繁转换效率。
-
公开(公告)号:CN114239544A
公开(公告)日:2022-03-25
申请号:CN202111629638.8
申请日:2021-12-28
Applicant: 湖北天融信网络安全技术有限公司 , 北京天融信网络安全技术有限公司 , 北京天融信科技有限公司 , 北京天融信软件有限公司
Inventor: 杨竣
IPC: G06F40/205 , G06F40/268 , G06F40/126
Abstract: 本申请实施例提供一种基于文档指纹的文本检测方法及系统,涉及网络安全技术领域。该基于文档指纹的文本检测方法包括:获取待检测文档的文本数据;对所述文本数据进行统一编码格式处理,获得统一化文本数据;通过预设符号分割所述统一化文本数据,获得所述待检测文档的指纹库数据;通过模板指纹库数据检测所述待检测文档的指纹库数据,获得检测结果。该基于文档指纹的文本检测方法可以防止机密文档泄漏,实现提高文档检测能力的技术效果。
-
-
-
-
-
-
-