言語商会
Search
Edit
検索
ページ用ツール
文書の表示
以前のリビジョン
バックリンク
ページの名称変更
サイト用ツール
最近の変更
メディアマネージャー
サイトマップ
ユーザ用ツール
管理
ログイン
文書の先頭へ
この文書は読取専用です。文書のソースを閲覧することは可能ですが、変更はできません。もし変更したい場合は管理者に連絡してください。
[[:eng:|Top]]>[[:lab:|Lab]]>[[:SNOW:|SNOW]] ~~NOTOC~~ ===== DongDu ===== === Introduction === * DongDu là phần mềm tách từ dành cho tiếng Việt. * Được viết trên ngôn ngữ C++, bởi Lưu Tuấn Anh và [[:eng:|Kazuhide Yamamoto]]. * DongDu đạt được độ chính xác rất cao (>98%), nhanh và sử dụng ít RAM hơn so với những phần mềm khác. * DongDu bao gồm cả chương trình tách từ (predictor) và chương trình học máy (learner). Người dùng có thể tự tạo ra dữ liệu cho cá nhân một cách đơn giản. * Bài viết về thuật toán và phương pháp cụ thể có thể [[https://www.jnlp.org/cgi-priv/download.cgi?id=SNOW/Poinwise_for_Vietnamese_Word_Segmentaion.pdf|download ở đây]] (bản tiếng Việt). * Mọi liên hệ, góp ý hay báo lỗi của chương trình, xin gửi về địa chỉ : anh(a)jnlp.org === Download === DongDu 1.0 (release 03/10/2012) * Binary : [[https://www.jnlp.org/cgi-priv/download.cgi?id=SNOW/DongDu-bin.zip|Linux]] (bin.zip 1.6Mb), Windows * [[https://www.jnlp.org/cgi-priv/download.cgi?id=SNOW/DongDu-src.zip|Source]] (src.zip 180Kb) * Documents * [[https://www.jnlp.org/cgi-priv/download.cgi?id=SNOW/DongDu-code.pdf|API, code description]] * [[https://www.jnlp.org/cgi-priv/download.cgi?id=SNOW/Poinwise_for_Vietnamese_Word_Segmentaion.pdf|approach description]] === Related resources === *[[https://www.jnlp.org/cgi-priv/download.cgi?id=SNOW/VNESEcorpus.txt|VNESEcopus.txt]] (65MB, 650 thousand sentences) *[[https://www.jnlp.org/cgi-priv/download.cgi?id=SNOW/VNTQcorpus-big.txt|VNTQcorpus(big).txt]] (239MB, 1.75 million sentences) *[[https://www.jnlp.org/cgi-priv/download.cgi?id=SNOW/VNTQcorpus-small.txt|VNTQcorpus(small).txt]] (34MB, 300 thousand sentences) === For more information === Please contact [[:eng:|Kazuhide Yamamoto]] for more information about this page.
(感想・要望・情報提供)