言語商会

Sudachi辞書 メモ

システム辞書

$ sudachipy build -m matrix.def 辞書ファイル名

ユーザー辞書

ID 説明 備考
0見出し (TRIE 用)
1左連接ID
2右連接ID
3コスト-32767 ~ 32767、-32768とすると自動推定
4見出し (解析結果表示用)
5品詞1
6品詞2
7品詞3
8品詞4
9品詞 (活用型)
10品詞 (活用形)
11読み
12正規化表記
13辞書形ID
14分割タイプ
15A単位分割情報
16B単位分割情報
17※未使用

設定

  • /usr/local/lib/python3.8/dist-packages/sudachipy/resources/ みたいな場所に sudachi.json があるので次を追加する。
"userDict" : [ "user1.dic", "user2.dic" ],
  • ユーザー辞書のビルド
$ sudachipy ubuild 辞書ファイル名
 (感想・要望・情報提供)