相田 太一‎ > ‎文献紹介‎ > ‎

2019/05/08

論文:Context-Aware Cross-Lingual Mapping
担当:多田さん

直交性の制約:ペアワイズ距離が保持。特異値分解で解を求める。
Mappingするには、対訳データが必要。
fasttextは安定していた。
ELMoのすごさをアピール。文脈を反映しているから良い。



論文:Simple Unsupervised Keyphrase Extraction using Sentence Embeddings
担当:丸山さん

全体として(取り出したn個のキーフレーズの集合を)見て、いいかどうか。似ているものが重なっていないと"全体として"よく見える。
positional bias:位置を0〜1にして掛け算
precisionは下がるのはわかるが、recallが下がるのは?:離れたところから取りすぎ?
何をもって"良い"?:文書を見せて、キーフレーズに色がついている状態。キーフレーズだけを見て、どれだけ意味がわかるか?という評価らしい。
筆者らはF値だけではキーフレーズの集合を評価できないのでは?という疑問で終わった。
なぜ学習時にキーフレーズの情報を用いないのに、キーフレーズをもってこれるのか?:文書のベクトルに近いものをもってこれるようにしたからかも。
全部の単語上からキーフレーズを出せるようにすれば、キーフレーズのない文書に対応できるのでは?

Comments