SEGMENTIEREN IM RAHMEN EINER OPTISCHEN ZEICHENERKENNUNG

    公开(公告)号:DE102021127419A1

    公开(公告)日:2022-05-25

    申请号:DE102021127419

    申请日:2021-10-21

    Applicant: IBM

    Abstract: Es werden ein Verfahren, ein System und ein Computerprogrammprodukt zum Segmentieren und Verarbeiten von Dokumenten für eine optische Zeichenerkennung bereitgestellt. Das Verfahren umfasst ein Empfangen eines Dokuments und ein Erkennen verschiedener Typen von Textdaten. Das Dokument wird in eine Mehrzahl von Textbereichen unterteilt, die den verschiedenen Typen von Textdaten zugehörig sind. Aus jedem Textbereich wird optisches Rauschen entfernt, und ein unterschiedlicher Software-Code für optische Zeichenerkennung wird zum Anwenden auf jeden Textbereich ausgewählt. Der unterschiedliche Software-Code für optische Zeichenerkennung wird in Bezug auf jeden Textbereich ausgeführt, was zu einem extrahierbaren durch einen Computer lesbaren Text führt, der sich innerhalb jedes Textbereichs befindet.

Patent Agency Ranking