PACLIC32 学会報告

全体の総括
言語学寄り、特に中国語に関する多くの発表がありました。音声とテキストを並行して使用する傾向があることが見受けられた。
______________________________________
【発表の総括】
発表論文:VietSentiLex: a sentiment dictionary by considering the polarity of ambiguous sentiment words 
研究の概要: ベトナム語で評判解析ための辞書を作成した。この辞書で、評判の単語だけで考えなくて、文脈語も同時に考えていた。この辞書は、ハイブリッド学習のために使用されるか、または学習者のためのトレーニングデータとして使用される。
辞書が混乱しているので、辞書の理解と使いやすくするためのいくつかの勧告を受けた。
ほとんどの質問は、この辞書がホテル関連ドメインでよりよく機能することを考慮して、これをより速く行う方法に関するものである。
______________________________________
【聴講メモ】
    Improving Japanese semantic-role-labeling performance with transfer learning as case for limited resources of tagged corpora on aggregated language 
    Takuya Okamura, Koichi Takeuchi, Yasuhiro Ishihara, Masahiro Taguchi, Yoshihiko
    小データでの転移習得による術後の構造解析のパフォーマンスを向上させる。 出力層だけが転送学習を行います。
    
    Classifying and Extracting Data from Facebook Posts for Online Persona Identification
    Hazel Brosas, Eugene Lim, Danica Sevilla, Denise Silva and Ethel Ong 
    情報をパーソナライズするために人々をいくつかのカテゴリに分類する動機付け。データは5人のラベルを与えて各人に与えられます。
    モデルは、N-gram・TF-IDFを特徴量として、いくつかの分類器(勾配ブースティング分類器、ロジスティック回 帰)を比較する。

    Syllables for Sentence Classification in Morphologically Rich Languages
    Madhuri Tummalapalli and Radhika Mamidi 
    各言語がそれぞれのタスクに合わせて、特徴量やシステムを作っている。どのタスク、言語にも共通した特徴量を作りたい。
    character-ngramを意味のある単位(Syllables)に変更する。
    CNN, multi-CNN(characterとsyllablesを入力)を利用し、sentiment analysis, Question classificationでsyllablesの効果を検証。
    結果としてrich languagesにおいて、syllablesを利用することで性能を改善。

    Chinese Spelling Check based on Neural Machine Translation
    Chiao-Wen Li, Jhih-Jie Chen and Jason Chang 
    似ている形・発音のものを間違う傾向にある。
    confusion set(正しいものと間違っているもののペアが含まれている辞書: 33,551pairs)を使ってデータを自動生成し、
   トレーニングセットに追加することでNMTによるspelling checkerの性能を改善。
   トレーニングデータに現れない間違いに対しても、対応できる。confusion setはedit logから収集。

 Automatic Error Correction on Japanese Functional Expressions Using Character-based Neural Machine Translation
    Jun Liu, Fei Cheng, Yiran Wang and Yuji Matsumoto 
    次の2つのステップで、Functional Expressionのerror correctionを行う。
    1. Functional expression detection (BILSTM-CRF model)
    2. Error detection and correction (Seq2seq)

Suspicious News Detection Using Micro Blog Text
    Tsubasa Tagami, Hiroki Ouchi, Hiroki Asano, Kazuaki Hanawa, Kaori Uchiyama, Kaito Suzuki, Kentaro Inui, Atsushi Komiya, Atsuo Fujimura,
    Ryo Yamashita, Hitofumi Yanai and Akinori Machino 
    Fake news detectionの研究。ここでは、Suspicion casting post (SCP) detectionとsuspicious article (SA) detectionの2つのタスクを定義。
    ユーザー側の「疑わしい」という発言を利用して、ある記事がfakeかどうかを検出する。

   
Comments