言語商会

言語商会GH自然言語処理

GH表記ゆれ解析

下記にテキストを入力してボタンを押すと、表記ゆれのチェックを行い、表記ゆれを起こしている可能性がある部分を出力します。

<html> <form name=“firstcgi”

    method="post"
    action="/cgi-priv/表記ゆれ/表記ゆれ解析.cgi"
    accept-charset="UTF-8">

<textarea name=text rows=“20” cols=“100”> </textarea> <br><br> <input name=“firstsubmit” type=“submit” value=“表記ゆれ解析”> </form> </html>

(例文をお持ちでない方は…Yahoo!ニュース

検出対象

  • 同一テキスト中で表記がゆれている場合のみ、表記ゆれとして出力します。
    • ×(検出せず):りんごはおいしい。だからりんごばかり食べている。
    • 〇(検出対象):林檎はおいしい。だからリンゴばかり食べている。
  • ここで言う表記ゆれとは、基本的に「同じ発音」となる異なった表記です。
    • 〇:りんご/リンゴ/林檎
    • 〇:玉葱、玉ねぎ、玉ネギ、タマネギ
  • いわゆる同義語、類義語はここでの対象とはしていません。
    • X:りんご/アップル、ジッパー/ファスナー
  • 音変化と考えられる似た発音の単語も一部対象に含めています。
    • 〇:感じる/感ずる、本当/ホント
  • 新旧字体の表記ゆれも検出します。
    • 〇:學ぶ/学ぶ、桜井/櫻井、斎藤/齋藤(※斉藤は対象外)
  • 同じ音であっても意味の異なる語(誤用)、及び意味の曖昧な語(多義語)の検出は行っていません。
    • X:早い/速い、会う/合う、置ける/於ける/おける、切れる/着れる/きれる
  • 人名、地名、その他固有名詞は原則として対象外です。ただし、旧字体(前出)や一部著名なものは含まれています。
    • 〇:ベートーベン/ベートーヴェン
    • X:マイケル/ミッシェル/ミハエル/ミカエル、VMware/ヴイエムウェア/ブイエムウェア
  • 誤検出等により表記ゆれでないものも含まれている可能性があります。
  • 表記ゆれを統一すべきかどうかは状況や方針により異なります。出力結果の表記ゆれを解消すべきかは各個人でご判断ください。

表記ゆれ以外の校正支援はGH校正支援をご利用ください。

使用上の注意

  • 本サイトは免責事項に同意いただける場合に限り、無償でご利用いただけます。
  • 入力テキストの解析対象の上限は10,000文字です。入力の制限はありませんが、解析制限超過分は無視されますのでご注意ください。
  • 入力テキストの内容は一切保存していません。
  • 検出漏れや誤検出がありましたら1語でもぜひご連絡ください。できる限り対応します。

有償利用について

以下の条件での利用を希望する場合は有償で承ります。詳しくはご相談ください

  • 前述の解析制限を超える規模で解析を希望する場合
    • 継続利用する場合は月額固定料金での利用も可能です。
  • 入力テキストが外部流出しないことの保証を希望する場合
    • この場合は秘密保持契約(NDA)を締結します。
  • 表記ゆれ解析のカスタマイズを希望する場合
    • 例えば、現在検出対象外となっている単語対(〇〇と●●)も検出してほしいといった場合。この場合は検出単語のリストを提出いただきます。
    • 技術的に対応できない場合はお引き受けできない可能性もあります。

有償利用の場合は、何らかの手段でテキストをお預かりして、その解析結果をお渡しする形になります(Webサイトは使いません)。

更新履歴

  • 2021-10-01 | 外部公開

お願い

改善のため、このシステムで検出できなかった表記ゆれをぜひ教えてください。 下記コメント欄に(例)「りんごと林檎」と一言書くだけで結構です。 ご協力よろしくお願いいたします。

 (感想・要望・情報提供)