一种基于OCR的文本相似度计算系统
Abstract:
本发明公开了一种基于OCR的文本相似度计算系统,涉及人工智能技术领域。本发明包括文件预处理、OCR识别和文本相似度计算,文件预处理的输出端和OCR识别的输入端电性连接,OCR识别的输入端和文本相似度计算的输入端电性连接,文件预处理的输入端电性连接有数据输入,文本相似度计算的输出端和数据输出的输入端电性连接。本发明主要实现用户要求输入的PDF文件相似度计算和相似文本定位,PDF文件内容的智能提取、分析与相似度计算,为用户提供高精度的文本相似度服务,帮助快速定位到相似文本位置。本发明以文件预处理、OCR识别、文本相似度计算三个功能模块作为系统框架,实现从数据预处理到文本相似度计算的一站式服务。
Patent Agency Ranking
0/0