Prediction by the likelihood set from the emerging pattern

    公开(公告)号:JP2005538437A

    公开(公告)日:2005-12-15

    申请号:JP2004530722

    申请日:2002-08-22

    Abstract: 【課題】新しいデータを分類する時の非常に大きい数のエマージングパターンにより、CAEP(:エマージングパターン集合による分類) とジャンピング・エマージングパターンの両方の利用は、労働集約的である。 非常に大きなデータセットに取り組むときの効率は、今日の応用において最高である。 従って、方法は、それが有効で、新しく、有用で、かつ、わりやすい規則を導き、しかし、安価であることが望まれ、そして、分類に本当に有用である少ない数の規則の確認に対して、効率的アプローチの利用による、方法が望まれる。 そのような方法の実現である。
    【解決手段】nが2又はそれ以上であるn個のクラスのひとつに、試験データTを有する試験サンプルが分類されるかどうかを決定する方法であって、少なくとも、各々のn個のクラスのデータの1個の実例を有する訓練データセットDから、複数のエマージングパターンを抽出すること、と、n個のリストを作成すること、そこでは、n個のリストのi番目のリストが、i番目のクラスのデータ内のゼロでない頻度を有する複数のエマージングパターンから各々のエマージングパターンEP
    i (m)の発生頻度f
    i (m)を含む、ことを特徴とする、と、kは、複数のエマージングパターンでのエマージングパターンの総数よりも本質的に少ない数である、固定数kのエマージングパターンを用いて、n個のスコアの計算すること、そこでは、前記n個のスコアのi番目のスコアを、また前記試験データで発生する前記i番目のスコアのk個のエマージングパターンの頻度から得る、ことを特徴とする、と、そして前記n個のスコアのもっとも高いものを選ぶことにより、試験データが、n個のクラスのデータのどこに分類されるかを推論すること、とから成る、nが2又はそれ以上であるn個のクラスのひとつに、試験データTを有する試験サンプルが分類されるかどうかを決定する方法。

Patent Agency Ranking