Invention Publication
- Patent Title: 一种基于OCR的文本相似度计算系统
-
Application No.: CN202311527716.2Application Date: 2023-11-15
-
Publication No.: CN117576705APublication Date: 2024-02-20
- Inventor: 姚娟 , 邓小远 , 胡龙湘韵 , 黄胜 , 张於
- Applicant: 多彩贵州数字科技股份有限公司
- Applicant Address: 贵州省贵阳市乌当区新天办事处新添大道北段123号
- Assignee: 多彩贵州数字科技股份有限公司
- Current Assignee: 多彩贵州数字科技股份有限公司
- Current Assignee Address: 贵州省贵阳市乌当区新天办事处新添大道北段123号
- Main IPC: G06V30/262
- IPC: G06V30/262 ; G06V30/19 ; G06V30/146

Abstract:
本发明公开了一种基于OCR的文本相似度计算系统,涉及人工智能技术领域。本发明包括文件预处理、OCR识别和文本相似度计算,文件预处理的输出端和OCR识别的输入端电性连接,OCR识别的输入端和文本相似度计算的输入端电性连接,文件预处理的输入端电性连接有数据输入,文本相似度计算的输出端和数据输出的输入端电性连接。本发明主要实现用户要求输入的PDF文件相似度计算和相似文本定位,PDF文件内容的智能提取、分析与相似度计算,为用户提供高精度的文本相似度服务,帮助快速定位到相似文本位置。本发明以文件预处理、OCR识别、文本相似度计算三个功能模块作为系统框架,实现从数据预处理到文本相似度计算的一站式服务。
Information query