-
1.
公开(公告)号:DE112020002042T5
公开(公告)日:2022-01-27
申请号:DE112020002042
申请日:2020-04-02
Applicant: IBM
Inventor: YUAN ZHONG FANG , YIN KUN YAN , YANG YUAN LIN , LIU TONG , LI HE
Abstract: Auf Grundlage eines Eingabeabsichtsvektors wird ein Satz von Kandidaten-Absichtsvektoren erzeugt. Ein Validieren des Satzes von Kandidaten-Absichtsvektoren wird durchgeführt, bei der alle dem Eingabeabsichtsvektor semantisch ähnlichen Absichtsvektoren aus dem Satz von Kandidaten-Absichtsvektoren als gültige Absichtsvektoren ausgewählt werden.
-
公开(公告)号:DE102021127419A1
公开(公告)日:2022-05-25
申请号:DE102021127419
申请日:2021-10-21
Applicant: IBM
Inventor: YUAN ZHONG FANG , PAN YU , LIU TONG , ZHONG YI CHEN , GAO LI JUAN , WU QIONG , WU DAN DAN
IPC: G06V30/148
Abstract: Es werden ein Verfahren, ein System und ein Computerprogrammprodukt zum Segmentieren und Verarbeiten von Dokumenten für eine optische Zeichenerkennung bereitgestellt. Das Verfahren umfasst ein Empfangen eines Dokuments und ein Erkennen verschiedener Typen von Textdaten. Das Dokument wird in eine Mehrzahl von Textbereichen unterteilt, die den verschiedenen Typen von Textdaten zugehörig sind. Aus jedem Textbereich wird optisches Rauschen entfernt, und ein unterschiedlicher Software-Code für optische Zeichenerkennung wird zum Anwenden auf jeden Textbereich ausgewählt. Der unterschiedliche Software-Code für optische Zeichenerkennung wird in Bezug auf jeden Textbereich ausgeführt, was zu einem extrahierbaren durch einen Computer lesbaren Text führt, der sich innerhalb jedes Textbereichs befindet.
-