===== 強化学習 ===== * 2023-03-06 | [[https://www.ai-shift.co.jp/techblog/3261|trlxを用いた文書生成モデルの学習②~PPO編~]] * 2021-12-06 | [[https://snowman-88888.hatenablog.com/entry/2021/12/06/080000|最近の言語生成の強化学習]] * 2021-03-10 | [[https://www.youtube.com/watch?v=1szlF4N_vkk|LAPRAS AI Tech Talk #4 (自然言語処理×強化学習の最前線!!強化学習と自然言語処理の最新研究は何を解いている?)]] * 2019-10-15 | [[https://ai-scholar.tech/articles/treatise/nlppl-ai-230|自然言語処理×強化学習の最前線!!強化学習と自然言語処理の最新研究は何を解いている?]]