Abstract:
PROBLEM TO BE SOLVED: To evaluate validity of a dictionary in which notation words are associated with representative words. SOLUTION: The device for evaluating validity of the dictionary for converting the notation words noted in text includes: a dictionary recording part which associates at least one notation word with a representative word representing the at least one notation word and records them by every category of phrases; a relation recording part which records dependence relation that one category depends on the other category on condition that a representative word of one category can match a notation word of the other category; and an evaluation part which evaluates that the notation word is not valid as the phrase represented by the representative word on condition that a representative word of a first category matches a notation word of a second category in the dictionary recording part and the dependence that the first category depends on the second category is not recorded in the relation recording part. COPYRIGHT: (C)2007,JPO&INPIT
Abstract:
PROBLEM TO BE SOLVED: To provide a translation support method, a translation support device and a computer program for improving translation efficiency by using a translation memory as a shared memory, and effectively maintaining confidentiality of the translation memory. SOLUTION: The translation support device receives input of original sentence information, translation sentence information, and accompanying information including aspect information related to an aspect related to translation, and calculates aspect similarity that is similarity between the aspect information whose input is received and aspect information stored in the translation memory. When the aspect information having the calculated aspect similarity smaller than a prescribed threshold value exists, the translation support device calculates translated sentence similarity that is similarity with the translation sentence information whose input is received only about the translation sentence information corresponding to the aspect information. When the translation sentence information having the calculated translated sentence similarity larger than a prescribed threshold value exists, the translation support device copies the original sentence information, the translation sentence information and the accompanying information whose input is received to the shared memory. COPYRIGHT: (C)2010,JPO&INPIT
Abstract:
PROBLEM TO BE SOLVED: To estimate a location of certain posting in social media such as microblogging.SOLUTION: A method for processing a first message group and a second message group submitted by a user on the basis of the submission date and time of each message includes executing a learning step and an estimating step. The learning step includes: extracting from the first message group first location messages which allow locations to be specified and first expression messages which include predetermined expressions; and associating the locations and the expressions on the basis of the date and time each message is submitted, to generate learning data. The estimating step includes: extracting from the second message group second expression messages which include predetermined expressions; accepting input of a specified date and time which is for estimating a location; associating the expressions with each other on the basis of the specified date and time and the date and time each second expression message is submitted, to generate input data; and estimating a location at the specified date and time on the basis of the learning data and the input data.
Abstract:
PROBLEM TO BE SOLVED: To provide a method for efficient document masking. SOLUTION: As a first mode, this method has steps of: decomposing a character string inside a document into partial character strings; calculating a score including appearance frequency in each the partial character string; presenting the score and the partial character string to a user; deciding the partial character string selected by the user; storing the selected partial character string as a safe character string list; and replacing the partial character string inside the document except the partial character string present in the safe character string list with a prescribed replacement character string. COPYRIGHT: (C)2007,JPO&INPIT
Abstract:
PROBLEM TO BE SOLVED: To provide technology for supporting proper selection of processing contents of a character string in a document. SOLUTION: The support device for supporting processing of the character string in the document includes: a document storage unit storing a plurality of shared documents; and a historical-information storage unit storing historical information of past processing to each character string in each document inside the document storage unit. When the support device receives a designation from a user, the support device acquires the document from the document storage unit based on the designation of the user, reads the historical information related to the acquired document from the historical information storage unit, and generates reference information for supporting selection of the processing of the user to the character string in the acquired document. The support device presents a screen for receiving the designation of the processing to each character string in the acquired document to the user together with the reference information. COPYRIGHT: (C)2011,JPO&INPIT
Abstract:
PROBLEM TO BE SOLVED: To provide a method for making compound contents harmless. SOLUTION: The method of this invention includes: a step for reading a predetermined word and the contents from a recorder; a step for replacing the predetermined word of the transcript data with another word and making the data transcript data of harmless contents and setting the predetermined word as the transcript data of intrinsic information; a step for replacing the predetermined data of the voice data with the other word on the basis of time when the predetermined word appears on the transcript data and making the data voice data of harmless contents and setting the predetermined word as the voice data of intrinsic information; a step for replacing the predetermined word of the presentation data with the other word and making the data the presentation data of harmless contents and setting the predetermined word as a presentation data of intrinsic information; a step for recording the harmless contents; and a step for recording the intrinsic information. COPYRIGHT: (C)2008,JPO&INPIT
Abstract:
Problem: Genaueres Erkennen von Gemeinschaften in einem sozialen Medium. Mittel zur Lösung des Problems: Es wird ein Verfahren zum Bilden von Clustern einer Vielzahl von Benutzern eines sozialen Mediums unter Verwendung eines Computers vorgeschlagen, wobei jeder aus der Vielzahl von Benutzern Nachrichten sendet. Das Verfahren weist die Schritte auf: Entnehmen einer Vielzahl von Teilgemeinschaften aus einer Vielzahl von Benutzern auf der Grundlage der Beziehungen von gleichartigen Nachrichten; Berechnen eines ersten Ähnlichkeitsgrades zum Anzeigen der Ähnlichkeit der gleichartigen Teilgemeinschaften auf der Grundlage der Beziehung zwischen einem Benutzer, der zu einer Teilgemeinschaft aus der Vielzahl von Gemeinschaften gehört, und einem Benutzer, der zu der anderen Teilgemeinschaft aus der Vielzahl von Gemeinschaften gehört; Berechnen eines zweiten Ähnlichkeitsgrades zum Anzeigen der Ähnlichkeit gleichartiger Teilgemeinschaften auf der Grundlage von Wörtern innerhalb der Nachrichten, die durch Benutzer gesendet wurden, die zu beiden Teilgemeinschaften gehören, und unter der Bedingung, dass die erste Ähnlichkeit einen vorgegebenen ersten Schwellenwert überschreitet; und Erzeugen einer vereinten Gemeinschaft durch Zusammenfassen der gleichartigen Teilgemeinschaften unter der Bedingung, dass die zweite Ähnlichkeit einen vorgegebenen zweiten Schwellenwert überschreitet.
Abstract:
Problem: Stoßweise übertragene Daten (Daten, die in einem vom Üblichen abweichenden Umfang verbreitet werden) in einem sozialen Medium sollen schneller und genauer erkannt werden. Mittel zur Lösung: Es wird ein Verfahren zum Auswählen einer erkannten Gruppe von Nachrichten aus der Vielzahl von Nachrichten vorgeschlagen, die durch eine Vielzahl von Benutzern in einem sozialen Medium gesendet wurden. Innerhalb der Nachrichten sind Nachrichten enthalten, die durch Benutzer gesendet wurden, die von dem Benutzer der ursprünglichen Nachricht verschieden sind, und diese Nachrichten zitieren die durch den Benutzer der ursprünglichen Nachricht gesendete Nachricht. Für die Nachrichten, die durch Benutzer gesendet wurden, die von dem Benutzer der ursprünglichen Nachricht verschieden sind, die die durch den Benutzer der ursprünglichen Nachricht gesendete Nachricht zitieren, werden bereitgestellt: ein Schritt zum Durchführen einer Erstbewertung des Potenzials für das erneute Weitersenden; ein Schritt zum Ermitteln eines einzelnen Benutzers, der eine Nachricht gesendet hat, für die das Ergebnis der Erstbewertung einen vorgegebenen ersten Schwellenwert überschritten hat; einen Schritt zum Ermitteln einer Gruppe von Nachrichten, die einer Gruppe weitergesendeter Nachrichten ähnlich ist, auf der Grundlage einer Gruppe weitergesendeter Nachrichten, die die durch den einzelnen Benutzer gesendete Nachricht zitieren; einen Schritt zum Durchführen einer Zweitbewertung des Potenzials, dass die ähnliche Gruppe von Nachrichten erneut weitergesendet wird; und einen Schritt zum Auswählen einer Gruppe von Nachrichten, für die das Ergebnis der Zweitbewertung einen vorgegebenen zweiten Schwellenwert überschritten hat.