山本 和英‎ > ‎

用語集

かぼちゃ
pumpkin

ウリ科カボチャ属の野菜で、煮物やグラタン、コロッケにして食べるとおいしい。日本語係り受け解析器南瓜(Cabocha)と混同されることがあるが、両者は別物である。

機会学習
opportunity learning

男女の出会いや結婚、中高齢者の再就職など、日常生活における様々な機会について学習すること。少しでも可能性を高めるため、統計的なアプローチが取られる場合が多い。近年になってその重要性が認識されるようになってきており、セミナーや勉強会などが数多く開かれている。なお、機械学習(machine learning)とは同音意義語であるが、両者は全く関係ない。

自然言語処理学会
natural language processing society

然言語処理に関する謎の学会。言語処理学会(The Association for Natural Language Processing)とは無関係である。学術文献の参考文献欄に「自然言語処理学会 年次大会 予稿集」が引用されることが何度もあるため存在して活動していることは間違いないが、詳細については誰も話さない(この話をすると誰もが口を閉ざす)ため不明である。もしかすると、秘密結社的な何かなのかもしれない。

自然文
sentence on nature

文字通り、自然について書かれた文のこと。時々自然言語文(natural language sentence)の意味で使われることがあるが、自然文などと言う専門用語は存在しないため、自然について述べられている文を指すものと推察される。
例:インドネシアの自然には圧倒されるなあ。

自由文
sentence on freedom and liberty

文字通り、自由について記述された文のこと。時々、自由入力(natural language input)の意味で使われることがあるが、自由文などと言う専門用語は存在しないため、自由について述べられている文を指すものと推察される。
例:人生は自分らしく自由に生きていこうではないか。

人口知能
population intelligence

増え続ける世界の人口問題や少子化に伴う日本の人口減少による社会への影響など、様々な人口問題を知能によって解決しようとしている学問分野の総称。よく人工知能(artificial intelligence)と間違われるが、無関係。

ビッグデータ
big data

大きなデータのこと。データ量が多いのでなく、データが大きいことに注意。

不自然言語
non natural language

自然言語ではないこと。次項目の議論を参照のこと。

不自然言語処理
non natural language processing

自然言語処理ではないこと。Baiduが開催したコンテストの名称、及び言語処理学会が実施した論文誌「自然言語処理」特集号のテーマでもある。

「自然言語処理」が専門分野を示す1単語であるため「不自然」「言語処理」という解釈は本来不可能である。これは意味のまとまりである形態素をさらに分割して意味を考えることができないためであり、自然言語処理の入門書に書かれている通りである。例えば、東京都を「東」「京都」と分割できないのと同じであり、また「ローマの休日」を「ローマ」「の」「休日」に分割して意味を考えると映画表題であるという意味が失われるため、同様に分割できない(映画表題としての「ローマの休日」は1形態素である)。
一方、「言語処理」という専門用語があるので「不自然(な)」「言語処理」という解釈も可能ではないかと考える人もいるが、この場合は「自然(な)」「言語処理」なるものが存在するのが前提のはずである。ところが、言語処理の何が自然で何が自然ではないか、といった議論はこれまで聞いたことがなく、結果おそらくであるが「自然(な)」「言語処理」なるものは存在しない。
以上より、不自然言語処理は「不」「自然言語処理」と解釈するのが自然で、このことより不自然言語処理は自然言語処理ではないことを示すものと推察される。

なお、Baidu も言語処理学会も、「不自然言語処理」が何であるかは明確に説明・定義していない。つまり、この意味では定義なく独り歩きしている表現とも言える。


Comments