研究室‎ > ‎卒業生のみなさまへ‎ > ‎真嘉比 愛‎ > ‎文献紹介‎ > ‎NLP2012‎ > ‎

教師なしマッピングによる言語横断テキスト分類

ドメインをまたいで類似度を計算できない場合について,オブジェクトの対応付けを行う
 → ドメイン内部でのデータの分布に着目
 → e.g. 対訳辞書獲得の例など
2つのドメイン間の独立性を測る指標「HSIC」を最大化する手法がとられている

オブジェクト間のマッチングではなく,ドメインからドメインへのマッピングを学習する
 → ドメイン間のデータ数の違いに対応する

K次元空間どうしの相関が最大となるように片方の空間を回転 → 基底が1対1対応

教師なしマッピングによる言語横断テキスト分類
 → NMFはクラスを考慮しないために,複数のクラスの側面を持つものだとうまく働かない.


分類結果自体は見たのか?
 → 見ていない
何かこれを追加したらうまくいきそう・・・というものはある?
 → パフォーマンスを上げるためには,Semi-supervisedがいいだろうが,それには注目していない
マッピングできないものは逃がし口を作るといいと思うが,今回はどうしたのか
 → アルゴリズムをそのまま
今回は単に数が少ないからうまくいかなかった?
 → 結構計算が重かったのでこのような感じになっている
相関がとれてもマッチングはとれないのでは?
 → 相関を最大にするように回転すればきっとマッチングはいい
違うドメイン間で似たような類似度のものはあるのか
 → むりやり仮定している
Comments