ユーザ用ツール

サイト用ツール


形態素解析:品詞付与

差分

このページの2つのバージョン間の差分を表示します。

この比較画面へのリンク

両方とも前のリビジョン前のリビジョン
次のリビジョン
前のリビジョン
形態素解析:品詞付与 [2021/02/07 15:21] – ↷ 移動操作に合わせてリンクを書き換えました。 admin形態素解析:品詞付与 [2022/06/10 17:48] (現在) – ↷ 移動操作に合わせてリンクを書き換えました。 admin
行 1: 行 1:
 ===== 品詞付与 ===== ===== 品詞付与 =====
 ==== 品詞付与とは ==== ==== 品詞付与とは ====
-与えられた単語列に対して、各単語の品詞を同定する処理のこと。[[形態素解析:top]]の一部。英語では part-of-speech taggingと言う。+与えられた単語列に対して、各単語の品詞を同定する処理のこと。[[形態素解析:]]の一部。英語では part-of-speech taggingと言う。
  
 仮に各単語に一つの品詞しか可能性がなければ(単語ー品詞の対応関係を予め辞書化しておくことで)ただの辞書引きするだけでよく、何も問題はない。問題なのは品詞の多義性がある場合で、[[:曖昧性]]を解消する必要がある。 仮に各単語に一つの品詞しか可能性がなければ(単語ー品詞の対応関係を予め辞書化しておくことで)ただの辞書引きするだけでよく、何も問題はない。問題なのは品詞の多義性がある場合で、[[:曖昧性]]を解消する必要がある。
行 19: 行 19:
 みたい文があったとして、我々は全く意味が分からなくても「罟悳しい」は形容詞、「襍枳」は名詞、「閔薨した」は動詞であることが容易に分かる。 みたい文があったとして、我々は全く意味が分からなくても「罟悳しい」は形容詞、「襍枳」は名詞、「閔薨した」は動詞であることが容易に分かる。
  
-さらに、日本語の[[形態素解析:top]]辞書の一部は品詞の多義性を辞書で吸収してしまっている。例えば、「明日は晴れだ」の「明日」は名詞、「市役所は明日行く」の「明日」は本来副詞となるはずだが、どちらの文も[[形態素解析:juman]]辞書は名詞(時相名詞)、[[:ipadic]]も名詞(副詞可能)と解析される。これによって見かけ上品詞付与の精度は向上するが、これら単語に対して名詞か副詞かの判断を放棄していることを意味する。言い換えれば、この品詞付与の仕事を[[:構文解析]]に後回しして、構文解析を難しくさせている気がする。+さらに、日本語の[[:形態素解析]]辞書の一部は品詞の多義性を辞書で吸収してしまっている。例えば、「明日は晴れだ」の「明日」は名詞、「市役所は明日行く」の「明日」は本来副詞となるはずだが、どちらの文も[[形態素解析:juman]]辞書は名詞(時相名詞)、[[:形態素解析:IPAdic]]も名詞(副詞可能)と解析される。これによって見かけ上品詞付与の精度は向上するが、これら単語に対して名詞か副詞かの判断を放棄していることを意味する。言い換えれば、この品詞付与の仕事を[[構文解析:]]に後回しして、構文解析を難しくさせている気がする。
  
 ==== 参考 ==== ==== 参考 ====
   * [[http://www.unixuser.org/~euske/doc/postag/|形態素解析ツールの品詞体系]]   * [[http://www.unixuser.org/~euske/doc/postag/|形態素解析ツールの品詞体系]]
 +
 +==== 記事 ====
 +  * 2021-05-30 | (動画) [[https://www.youtube.com/watch?v=873ThcYY6QA|日本語の文章をPythonで品詞分解してみた【自然言語処理】【初心者向け】]]
 +
  
(感想・要望・情報提供) 
.gz · 最終更新: 2021/02/07 15:21 by admin

(広告募集)