ユーザ用ツール

サイト用ツール


サイドバー

自然言語処理:歴史

文書の過去の版を表示しています。


自然言語処理の歴史

様々な資料から収集した世界と日本の自然言語処理の歴史年表をまとめました。 もし間違いがありましたらお詫びすると共に、ご指摘いただければ訂正します。

1940年代

  • 1947年3月: ロックフェラー財団の Warren Weaver が知人への手紙の中で機械翻訳の可能性に言及
    • 暗号解読技術を使えば、世界のあらゆる言語の基本的な部分は認識できるのではないかと考えた。
    • これが世界の機械翻訳(及び自然言語処理)の始まりとされる。1946年が最初とする資料(例えばこれや、長尾の下記著書)もあるが、John Hutchins は1946年説については証拠がないので1947年とするのが妥当であろうと結論づけている
  • 1948年: Claude Elwood Shannon が英語の単語連鎖の近似を計算するために n-gram を使用
  • 1949年7月: Weaver が Translation という表題の覚え書き(下記)を執筆し、米国内の主要な研究者に配布される。これをきっかけに世界で初めてワシントン大学、UCLA、MITで機械翻訳の研究が始まる。

1950年代

  • 1952年: 機械翻訳に関する最初の学術会議
  • 1954年: ジョージタウン大学とIBMの共同研究結果が発表
    • ロシア語を英語に機械翻訳。250単語と6個の構文規則を用いる
  • 1955年: イギリス、フランス、イタリア、ソ連で機械翻訳の研究が開始
  • 1957年: 九州大学で機械翻訳(日英独の相互翻訳)の研究が開始
    • システムは Kyusyu Translator-1 (KT-1) と命名され、1960年に完成。
  • 1957年頃: 通産省電気試験所で機械翻訳の研究が開始
  • 1958年: Hans Peter Luhnが単語頻度(Term Frequency; TF)によってテキストを要約(重要文抽出)する論文を発表
    • “the frequency of word occurrence in an article furnishes a useful measurement of word significance”
    • Hans Peter Luhn. The Automatic Creation of Literature Abstracts, IBM Journal of Research and Development, Vol.2, No.2, pp.159. 1958.
  • 1959年2月: 電気試験所が作成した日本最初の英日翻訳システム「やまと」が完成
    • 翻訳例1:This is the book which is mine. →コレガ ホン(ソレガ ワレノモノ ダ)ダ.
    • 翻訳例2: The computer does not forget whatever he learned. →computerガ (カレガ マナビ タ モノハナンデモ)ヲ ワスレナイ.

1960年代

1970年代

  • 1972年: Karen Spärck Jonesが逆文書頻度(Inverse Document Frequency; IDF) の考え方を提案
  • 1973年: Salton and Yang が下記論文で Luhn の TF と Spärck Jones の IDF を組み合わせた TF-IDF を提唱
  • 1975年: van Rijsbergen, C. J が再現率と適合率を一つにした尺度 F-measure を提案
    • van Rijsbergen, C. J. 1975. Information Retrieval. Butterworths.
    • 正確に言えば F ではなく 1-F に相当する値である E (effectiveness) を提案。このあたりの議論はこの論文を参照。
  • 1975年: 情報処理学会 計算言語学研究会が設立
  • 1977年: シャープが仮名漢字変換方式の日本語ワードプロセッサ試作機をビジネスショウに参考出品
  • 1979年: 東芝が仮名漢字変換方式の日本語ワードプロセッサ JW-10 を発売。630万円。

1980年代

1990年代

  • 1993年: 日本語形態素解析システム JUMAN Version 1.0 が発表
    • 最初のバージョンは Version 0.6で 1992年2月17日付け
  • 1994年4月1日: 言語処理学会が設立
  • 1996年: Google が検索サービスを開始
    • 開始当初は BackRub という名称で、1997 年に google.com がドメイン登録

2000年代

  • 2006年: Google が Google Translate (Google翻訳) サービスを開始
  • 2006年3月26日: MeCab 最初のバージョンである MeCab 0.90 を発表

2010年代

2020年代

主な参考資料

(感想・要望・情報提供) 
.gz · 最終更新: 2022/06/10 14:10 by admin

(広告募集)