相田 太一‎ > ‎文献紹介‎ > ‎

2019/02/19

論文:Effectively Crowdsourcing Radiology Report Annotations
担当:多田さん

ワーカーのレベル付けとして、事前に正解データを解かせて精度を測る。今回もそれなのかも?
ドメイン知識は必要なのか?ドメイン知識に依存せず、常識的に解ける?:調査が必要。問題によってはクラウドソーシングに投げても良さそう。
ワーカーの中に専門家がいる可能性?:ワーカーのスキルは問わなかった。専門家が多かったか問題が簡単だった。
今回は側頭部だから簡単だった。内臓が絡むと難しくなる?
確信度で足きりしても結果が変わらない、むしろ悪くなってる。:データが多い方がいいから。サイズを揃えてやるべき。
5-fold cross validation:交差検定
2日で600ドル。75%一致するまで収集を続けることが結果につながった。



論文:Named Entity Recognition With Parallel Recurrent Neural Networks
担当:勝田さん

LSTMを並列に並べる?:同じ入力を複数のLSTMに入れる。各LSTMのパラメータに制約(パラメータが直行)を加える。
CPUの高速化、全ての機能を1つにまとめるよりも何かいい理由がありそう。
optimizer Adam:早く収束させるような工夫。
外部リソースは使用可能。使えばもっと性能が上がる。
Table5:1つずつパラメータを欠けさせて機能を落としてどれだけ結果が下がるかを調べた。結果的になにが一番効いているのかを知りたい。
固有名詞推測以外に品詞付与、翻訳に使えそう。

Comments