-
公开(公告)号:FR2958062A1
公开(公告)日:2011-09-30
申请号:FR1155500
申请日:2011-06-22
Applicant: XEROX CORP
Inventor: RAGNET FRANCOIS , SAUBAT NICOLAS , LEHOUX THIERRY , MOORE JOHN A , CHEMINOT ERIC
Abstract: L'invention concerne un procédé, un appareil et un document papier. Le procédé prévoit la séparation et le classement en catégorie de documents, et il inclut la réception d'un lot numérisé de documents (16). Le lot inclut une pluralité de documents (16) numérisés sur lesquels des tampons séparateurs (12) de documents ont été appliqués avant la numérisation. Chaque tampon séparateur (12) de documents inclut des premier et second motifs pouvant être reconnu par une machine, appliqués sur une même page de document, les premier et second motifs étant espacés par un champ désigné afin de recevoir un code de catégorie appliqué par l'utilisateur. Le lot numérisé de documents est traité afin d'identifier les pages qui contiennent un séparateur de documents, le traitement incluant l'identification d'au moins l'un des premier et second motifs espacés, Pour chacune d'une pluralité de pages de documents pour laquelle un séparateur de documents respectif est identifié, le procédé inclut la localisation du champ désigné correspondant et l'identification du code de catégorie associé au champ désigné. Le document (16) contenant le séparateur identifié est séparé d'autres documents dans le lot numérisé au moins sur la base du séparateur identifié, et une catégorie de document est assignée au document à partir d'un ensemble de catégories de documents, sur la base du code de catégorie identifié.
-
公开(公告)号:FR2963695A1
公开(公告)日:2012-02-10
申请号:FR1157189
申请日:2011-08-05
Applicant: XEROX CORP
Inventor: LEHOUX THIERRY , RAGNET FRANCOIS , PERRONNIN FLORENT
IPC: G06V30/224
Abstract: Un système et un procédé de détection de mots sont décrits. Le procédé comprend la réception d'un mot-clé (S106) et, pour chacune des polices d'un jeu de polices typographiques, la synthèse d'une image de mot basée sur le mot-clé (S108). Un modèle de mot-clé est exercé (S110) à partir des images de mots synthétisés et des poids respectifs de chaque police du jeu de polices typographiques. En utilisant le modèle de mot-clé exercé, des images de mots manuscrits qui correspondent au mot-clé sont identifiées (S114) parmi une collection d'images de mots manuscrits. Les poids permettent de prendre en compte un vaste jeu de polices, la pondération indiquant l'importance relative de chaque police pour la modélisation d'un ensemble d'images de mots manuscrits.
-
3.
公开(公告)号:DE102011079443A1
公开(公告)日:2012-03-15
申请号:DE102011079443
申请日:2011-07-20
Applicant: XEROX CORP
Inventor: PERRONNIN FLORENT , LEHOUX THIERRY , RAGNET FRANCOIS
IPC: G06V30/224
Abstract: Ein Wortauffindungssystem und ein Verfahren sind hierin offenbart. Das Verfahren umfasst das Empfangen eines Schlüsselwortes und das Synthetisieren eines Wortbildes auf der Grundlage des Schlüsselwortes für jede Schriftart aus einer Gruppe typographischer Schriftarten. Ein Schlüsselwortmodell wird auf der Grundlage der synthetisierten Wortbilder und der entsprechenden Gewichtungen für jede aus der Gruppe der typographischen Schriftarten trainiert. Unter Anwendung des trainierten Schlüsselwortmodells werden Handschriftenwortbilder einer Ansammlung aus Handschriftenwortbilder, die mit dem Schlüsselwort übereinstimmen, ermittelt. Die Gewichtungen ermöglichen, dass eine große Menge an Schriftarten betrachtet wird, wobei die Gewichtungen die relative Relevanz jeder Schriftart für das Modellieren einer Gruppe aus Handschriftenwortbildern angeben.
-
公开(公告)号:FR2958062B1
公开(公告)日:2019-04-26
申请号:FR1155500
申请日:2011-06-22
Applicant: XEROX CORP
Inventor: RAGNET FRANCOIS , SAUBAT NICOLAS , LEHOUX THIERRY , MOORE JOHN A , CHEMINOT ERIC
Abstract: L'invention concerne un procédé, un appareil et un document papier. Le procédé prévoit la séparation et le classement en catégorie de documents, et il inclut la réception d'un lot numérisé de documents (16). Le lot inclut une pluralité de documents (16) numérisés sur lesquels des tampons séparateurs (12) de documents ont été appliqués avant la numérisation. Chaque tampon séparateur (12) de documents inclut des premier et second motifs pouvant être reconnu par une machine, appliqués sur une même page de document, les premier et second motifs étant espacés par un champ désigné afin de recevoir un code de catégorie appliqué par l'utilisateur. Le lot numérisé de documents est traité afin d'identifier les pages qui contiennent un séparateur de documents, le traitement incluant l'identification d'au moins l'un des premier et second motifs espacés, Pour chacune d'une pluralité de pages de documents pour laquelle un séparateur de documents respectif est identifié, le procédé inclut la localisation du champ désigné correspondant et l'identification du code de catégorie associé au champ désigné. Le document (16) contenant le séparateur identifié est séparé d'autres documents dans le lot numérisé au moins sur la base du séparateur identifié, et une catégorie de document est assignée au document à partir d'un ensemble de catégories de documents, sur la base du code de catégorie identifié.
-
公开(公告)号:FR2956230B1
公开(公告)日:2014-03-14
申请号:FR1100376
申请日:2011-02-08
Applicant: XEROX CORP
Inventor: RAGNET FRANCOIS , MOORE JOHN A , SAUBAT NICOLAS , CHEMINOT ERIC , LEHOUX THIERRY
IPC: G06F17/30
-
公开(公告)号:FR2956230A1
公开(公告)日:2011-08-12
申请号:FR1100376
申请日:2011-02-08
Applicant: XEROX CORP
Inventor: RAGNET FRANCOIS , MOORE JOHN A , SAUBAT NICOLAS , CHEMINOT ERIC , LEHOUX THIERRY
IPC: G06F17/30
Abstract: L'invention concerne un procédé, un appareil et un document papier. Le procédé prévoit la séparation et le classement en catégorie de documents, et il inclut la réception d'un lot numérisé de documents (16). Le lot inclut une pluralité de documents (16) numérisés sur lesquels des tampons séparateurs (12) de documents ont été appliqués avant la numérisation. Chaque tampon séparateur (12) de documents inclut des premier et second motifs pouvant être reconnu par une machine, appliqués sur une même page de document, les premier et second motifs étant espacés par un champ désigné afin de recevoir un code de catégorie appliqué par l'utilisateur. Le lot numérisé de documents est traité afin d'identifier les pages qui contiennent un séparateur de documents, le traitement incluant l'identification d'au moins l'un des premier et second motifs espacés, P our chacune d'une pluralité de pages de documents pour laquelle un séparateur de documents respectif est identifié, le procédé inclut la localisation du champ désigné correspondant et l'identification du code de catégorie associé au champ désigné. Le document (16) contenant le séparateur identifié est séparé d'autres documents dans le lot numérisé au moins sur la base du séparateur identifié, et une catégorie de document est assignée au document à partir d'un ensemble de catégories de documents, sur la base du code de catégorie identifié.
-
-
-
-
-