ユーザ用ツール

サイト用ツール


サイドバー

bn_kotonohalab

(広告募集)

重要度:tf-idf

TF-IDF

TF-IDFとは

  • term frequency - inverse document frequency
  • 文書中に含まれる単語の重要度を評価するアルゴリズム。文書のベクトル化など様々な用途に使われる。
  • 単語の出現頻度(term frequency, TF)と逆文書頻度(Inverse document frequency, IDF)の積で定義。
  • 古典的でよく使われるが、そんなに精度がいい訳ではない。これだけ簡単な計算で得られる近似としてはすばらしい。
    • 例えば、Okapi BM25などは TF-IDFよりも精度がよいと言われている。
  • 1972年にKaren Spärck JonesがIDFの概念を発表したことがはじまり。

意味付け

派生

  • TF-IDFには様々な派生(改良)がある。例えば、Wikipediaを参照。

記事

(感想・要望・情報提供) 
· 最終更新: 2022/06/10 17:52 by admin

(広告募集)