Abstract:
Die vorliegende Erfindung verringert Rechenkosten und stellt eine Vorrichtung bereit, aufweisend einen Auswahlabschnitt zum Auswählen einer Vielzahl von Beispieldokumenten aus einer Vielzahl von Dokumenten, einen ersten Parameter-Erzeugungsabschnitt zum Analysieren der Vielzahl von Beispieldokumenten zum Erzeugen einer Anfangsparametermatrix, die eine Wahrscheinlichkeit ausdrückt, dass jedes einer Vielzahl von in der Vielzahl von Beispieldokumenten enthaltenen Wörtern in jedem einer Vielzahl von Themen enthalten ist, und einen zweiten Parameter-Erzeugungsabschnitt zum Analysieren der Vielzahl von Dokumenten durch Verwenden eines jeden in der Anfangsparametermatrix enthaltenen Wertes als einen Anfangswert zum Erzeugen einer Parametermatrix, die eine Wahrscheinlichkeit ausdrückt, dass jedes einer Vielzahl von in der Vielzahl von Dokumenten enthaltenen Wörtern in jedem einer Vielzahl von Themen enthalten ist.
Abstract:
Es werden Verfahren, Vorrichtungen und Produkte zum Erzeugen eines ausführbaren Verfahrens aus einer Textbeschreibung, die in einer natürlichen Sprache geschrieben ist, gemäß der vorliegenden Erfindung beschrieben. Aus einem Textdokument, das in einer natürlichen Sprache geschrieben ist, wird eine Gruppe von Aussagen extrahiert. Auf Grundlage der extrahierten Gruppe von Aussagen wird aus dem Textdokument eine Gruppe von Formeln extrahiert. Anschließend wird ein Zustandsübergangsgraph erzeugt, welcher eine Gruppe von Aussagewert-Bestimmungswegen umfasst, die durch die Gruppe von Formeln beschränkt sind. Der Zustandsübergangsgraph wird in eine Software-Anwendung übersetzt.
Abstract:
The present invention provides a device comprising: a selector for selecting sample documents from a plurality of documents to reduce computational costs; a first parameter generating unit for generating an initial parameter matrix indicating the probability of each of a plurality of topics for each of a plurality of words in the sample documents based on an analysis of the sample documents; and a second parameter generating unit for generating a parameter matrix indicating the probability of each of the plurality of topics for each of the plurality of words in the sample documents based on an analysis of the documents using each value in the initial parameter matrix as an initial value.
Abstract:
Disclosed is a method of searching for document data files based on keywords. The method comprises the steps of calculating a score or probability as a first vector that respective document data files are associated with clusters or classes intended for the clustering or classification of document data files; calculating a score or probability as a second vector in response to keywords entered in searches that either the keywords thus entered or keywords that are related to the keywords thus entered are associated with the clusters or classes; calculating the scalar product of the first vector and the second vector, wherein the scalar product value thus calculated is the score of the document data files with respect to the keywords; and finding the correlation value of document data files containing the respective classification keyword sets and of document data files whose calculated score is either greater than or equal to a prescribed threshold or are included in a higher-order prescribed proportion.
Abstract:
Disclosed is a method of searching for document data files based on keywords. The method comprises the steps of calculating a score or probability as a first vector that respective document data files are associated with clusters or classes intended for the clustering or classification of document data files; calculating a score or probability as a second vector in response to keywords entered in searches that either the keywords thus entered or keywords that are related to the keywords thus entered are associated with the clusters or classes; calculating the scalar product of the first vector and the second vector, wherein the scalar product value thus calculated is the score of the document data files with respect to the keywords; and finding the correlation value of document data files containing the respective classification keyword sets and of document data files whose calculated score is either greater than or equal to a prescribed threshold or are included in a higher-order prescribed proportion.
Abstract:
Die vorliegende Erfindung stellt ein Verfahren bereit, um eine Korrelation in geeigneter Weise in einem breiteren Kontext zu finden, wenn Dokumentdaten unter Verwendung eines Suchbegriffs durchsucht werden. Die vorliegende Erfindung stellt ein Verfahren zum Durchsuchen von Teilen der Dokumentdaten unter Verwendung eines Suchbegriffs bereit. Das Verfahren enthält die Schritte zum Berechnen entsprechender erster Bewertungszahlen oder entsprechender Wahrscheinlichkeiten, mit denen bzw. dass jeder der Teile der Dokumentdaten zu Clustern oder Klassen gehört, als ein erster Vektor zur Clusterbildung oder Klassifizierung von Teilen der Dokumentdaten, bei einem Eintrag eines Suchbegriffs Berechnen entsprechender zweiter Bewertungszahlen oder entsprechender Wahrscheinlichkeiten, mit denen bzw. dass der Suchbegriff oder ein relevanter Begriff, der mit dem Suchbegriff verbunden ist, zu den Clustern oder Klassen gehört, Berechnen eines inneren Produkts aus jedem der ersten Vektoren und dem zweiten Vektor, wobei das berechnete innere Produkt eine dritte Bewertungszahl des entsprechenden Teils der Dokumentdaten in Bezug auf den Suchbegriff darstellt, und Erhalten eines Korrelationswerts aus Dokumentdaten, die jeden Begriff in einer Klassifikationsbegriffmenge enthalten und Dokumentdaten mit der dritten Bewertungszahl, die gleich einem vorgegebenen Schwellenwert oder größer als dieser ist, oder in einer vorgegebenen hohen Verhältniszahl enthalten ist.
Abstract:
PROBLEM TO BE SOLVED: To provide a backup device for properly updating replicated data. SOLUTION: This backup device 300 for recording the replicate of original data stored in a plurality of storage devices 110A-D as replicated data comprises a written data storage part 132 for receiving and storing written data to be written to the original data; and an updating part 134 for updating the replicated data with the written data when receiving update permitting information for permitting the update of the replicated data with the written data from the outside. COPYRIGHT: (C)2004,JPO
Abstract:
PROBLEM TO BE SOLVED: To provide an information recording method and an information recording system realizing elimination of need for extra seek time even when a disk unit is used for a long time. SOLUTION: The system employs at least two magnetic disk units 51, 61 as a primary storage section 42 and a secondary storage section 43, the primary storage section 42, when an information write request is received, disregards write control information included in the received information and performs writing successively to a recording area of a storage track adjacent to an inner circumferential side or an outer circumferential side when using all of recording areas of one storage track, and when the primary storage section 42 performs no processing by a write request and a read request, the received information including the control information is read from the primary storage section 42 and write is performed to the secondary storage section 43 on the basis of the control information. COPYRIGHT: (C)2003,JPO
Abstract:
PROBLEM TO BE SOLVED: To provide a method for efficiently finding the comprehensive trend of keywords. SOLUTION: A processing method for the time-series analysis of the keyword is provided. The method includes: a step of clustering or classifying document data, which is the description of a phenomenon in natural language, on the basis of the appearance frequencies of the keyword in the document data and also clustering or classifying individual keywords by clustering or classifying the document data; and a step of performing the time-series analysis, for the appearance frequencies of document data including the individual keywords within the cluster or classes obtained by clustering or classifying the document data, or for the appearance frequencies of document data including the cluster or classes obtained by clustering or classifying the individual keywords. Frequency distribution, showing variation in the appearance frequencies of the document data, can be obtained by the time-series analysis. COPYRIGHT: (C)2011,JPO&INPIT
Abstract:
PROBLEM TO BE SOLVED: To determine a storage area, among multiple storage areas, which meets a predetermined requirement to be a target for access. SOLUTION: In a controller 20 for controlling a multi-hierarchical storage subsystem, the following components operate under the control of a file write unit 21 and a file read unit 22. First, a list acquiring unit 23 acquires a list of tiers that can meet file access requirements. A requisite energy calculating unit 24 calculates an additional energy amount necessary to satisfy file access requirements for each tier, and an allowable energy calculating unit 25 calculates an additional energy amount allowable for access, and a path acquiring unit 26 acquires a path to a tier to be accessed based on the energy amounts. An identifier acquiring unit 27 acquires a file identifier, and an access point generating unit 28 generates a file access point based on the path and the file identifier. COPYRIGHT: (C)2009,JPO&INPIT