===== 文字 ===== === 文字コード === * [[文字コード]] === データ構造 === * 2021-09-29 | [[https://kampersanda.hatenablog.jp/entry/2021/09/29/123644|シンプルで強いFrontCoding文字列辞書を紹介したい]] === 言語モデル === * 2018-08-31 | [[https://hironsan.hatenablog.com/entry/how-to-develop-character-based-neural-language-model|文字ベース言語モデルの作り方]] === 漢字 === ^kanjivg-radical|https://github.com/yagays/kanjivg-radical|漢字と「パーツ」の相互変換| * 2020-04-13 | [[https://www.benricho.org/kanji/kyoikukanji/check-syogaku-kanji.html|【小学校で習う漢字を調べる】]] === ひらがな === * 2021-04-05 | [[https://qiita.com/shimajiroxyz/items/3c6f8341373b7ea5d081|【ルビ振り】形態素解析で取得した読みがなが原文のどの文字と対応するか調べる【javascript】]] - [[:環境:Javascript]] * 2015-11-03 | [[https://labs.goo.ne.jp/api/jp/hiragana-translation/|ひらがな化API]] === 全角・半角 === * 2015-03-23 | [[https://qiita.com/ikuyamada/items/fea6c8f81e7cac7cf318|Pythonで半角・全角の変換を高速に行う]] === 文字列照合 === * 2020-09-28 | [[https://www.m3tech.blog/entry/2020/09/28/120000|シンプルかつ高速な文字列照合アルゴリズムを紹介します]] === 文字列変換 === ^ jaconv | https://pypi.org/project/jaconv/| * 2021-03-29 | [[https://qiita.com/yukinoi/items/db1aa33c46ff363fab0a|Python用日本語文字列変換ライブラリjaconv 0.3の説明]]