Abstract:
PROBLEM TO BE SOLVED: To provide a method, an apparatus and a computer program for calculating a risk assessment value for an event sequence, which are capable of calculating the risk assessment value of each event sequence by estimating a totally ordered set on the basis of a partially ordered set indicating the event sequence.SOLUTION: The risk assessment value of an event sequence that is a partially ordered set indicating some events in an event group of M kinds of events (M is a finite natural number) in a time series is calculated. The partially ordered set is converted into an approximate totally ordered set, and an M-dimensional feature vector is calculated from the totally ordered set obtained by the conversion. A projection matrix for calculating the risk assessment value is calculated based on the calculated M-dimensional feature vector.
Abstract:
PROBLEM TO BE SOLVED: To provide a technique that makes it possible to list a set of corresponding terms in a different language using a random walk technique with a reasonable calculation amount even when a large number of terms are targeted.SOLUTION: The method comprises the steps of: creating a technical term set of a first language (e.g., Japanese), a general term set of the first language, a technical term set of a second language (e.g., English), and a general term set of the second language; creating a bipartite graph for each of the first and second languages by connecting the technical term set and the general term set of the language with links based on corpus information; creating links between the general terms using a translation dictionary associating general terms between the two languages (e.g., an English-Japanese dictionary) to create a bipartite graph connecting the general term sets of the two languages; creating an association matrix M based on weighted information of links of the bipartite graphs within each language and between the two languages; and calculating a similarity matrix Q defined by Q=(1-c)(I-cM).
Abstract:
Problem: Stoßweise übertragene Daten (Daten, die in einem vom Üblichen abweichenden Umfang verbreitet werden) in einem sozialen Medium sollen schneller und genauer erkannt werden. Mittel zur Lösung: Es wird ein Verfahren zum Auswählen einer erkannten Gruppe von Nachrichten aus der Vielzahl von Nachrichten vorgeschlagen, die durch eine Vielzahl von Benutzern in einem sozialen Medium gesendet wurden. Innerhalb der Nachrichten sind Nachrichten enthalten, die durch Benutzer gesendet wurden, die von dem Benutzer der ursprünglichen Nachricht verschieden sind, und diese Nachrichten zitieren die durch den Benutzer der ursprünglichen Nachricht gesendete Nachricht. Für die Nachrichten, die durch Benutzer gesendet wurden, die von dem Benutzer der ursprünglichen Nachricht verschieden sind, die die durch den Benutzer der ursprünglichen Nachricht gesendete Nachricht zitieren, werden bereitgestellt: ein Schritt zum Durchführen einer Erstbewertung des Potenzials für das erneute Weitersenden; ein Schritt zum Ermitteln eines einzelnen Benutzers, der eine Nachricht gesendet hat, für die das Ergebnis der Erstbewertung einen vorgegebenen ersten Schwellenwert überschritten hat; einen Schritt zum Ermitteln einer Gruppe von Nachrichten, die einer Gruppe weitergesendeter Nachrichten ähnlich ist, auf der Grundlage einer Gruppe weitergesendeter Nachrichten, die die durch den einzelnen Benutzer gesendete Nachricht zitieren; einen Schritt zum Durchführen einer Zweitbewertung des Potenzials, dass die ähnliche Gruppe von Nachrichten erneut weitergesendet wird; und einen Schritt zum Auswählen einer Gruppe von Nachrichten, für die das Ergebnis der Zweitbewertung einen vorgegebenen zweiten Schwellenwert überschritten hat.
Abstract:
Problem Ein Verfahren, eine Einheit und ein Computerprogramm zum Visualisieren von Risikoabschätzwerten für Ereignisfolgen bereitzustellen, bei denen vollständig geordnete Sätze auf der Grundlage teilweise geordneter Sätze, die eine Ereignisfolge angeben, eingeschätzt und die für jede Ereignisfolge berechneten Risikoabschätzwerte visualisiert werden können. Problemlösungsmittel Risikoabschätzwerte werden für Ereignisfolgen berechnet und angezeigt, bei denen die Ereignisfolgen aus Ereignissen einer endlichen Anzahl M von Arten (wobei M eine natürliche Zahl ist) und manche aus der Ereignisgruppe ein teilweise geordneter Satz in einer Zeitreihe sind. Eine M-dimensionale schwach geordnete Matrix wird auf der Grundlage einer Ereignisfolge erzeugt, eine Interpolation wird zwischen den Elementen der erzeugten schwach geordneten Matrix durchgeführt, und eine dicht geordnete Matrix wird berechnet. Eine Abbildungsmatrix wird zum Abbilden der Ähnlichkeitsbeziehungen zwischen Ereignisfolgen in einem zwei- oder dreidimensionalen Raum unter Anwendung eines Einbettungsverfahrens auf der Grundlage der berechneten dicht geordneten Matrix berechnet, die entsprechenden Punkte jeder Ereignisfolge werden in einem zwei- oder dreidimensionalen Raum anhand der berechneten Abbildungsmatrix berechnet, und die berechneten entsprechenden Punkte werden in einem zwei- oder dreidimensionalen Raum zur Anzeige ausgegeben.
Abstract:
[Problem] To more accurately, and at an earlier stage, detect burst information (information that is diffused on a different scale than normally) in a social medium. [Solution] Proposed is a method which, in a social medium, selects a group of specific messages from among a plurality of messages transmitted by a plurality of users. Here, in the messages are included messages for which a message that has been transmitted by one user is quoted and retransmitted by another user. The present method is provided with steps which: for messages in which the message that has been transmitted by the one user has been quoted and retransmitted by another user, perform primary evaluation of possibility of further re-transmission; identify the one user who has transmitted a message for which the result of the primary evaluation is higher than a pre-defined first threshold; on the basis of the group of messages for which messages transmitted by the one user have been quoted and retransmitted, identify a group of messages similar to the group of messages that have been retransmitted; perform secondary evaluation of the possibility that the similar group of messages will be further retransmitted; and select a group of messages for which the result of the secondary evaluation is higher than a pre-defined second threshold.