monthly gimite

試験運用中。

月刊COMPUTERWORLDにロイディとデボラが

COMPUTERWORLD (コンピュータワールド) 2007年 05月号 [雑誌]

COMPUTERWORLD (コンピュータワールド) 2007年 05月号 [雑誌]

の江島さんのコラムで、Webチャット Lingrの江島(kenn)さんのルームに置かせてもらっている人工無能 ロイディ(Bot Reudy)と翻訳・伝言ボット デボラ(Bot Deborah)を紹介していただきました。

デボラは

  • 中国語・韓国語の発言を自動認識して、Excite翻訳で和訳したものを貼り付けてくれる。
  • 発言の最後に「>英日」とか「>日中」とか書いておくと、英日翻訳や日中翻訳の結果を貼り付けてくれる。
  • 「Gimiteに伝言: ほげほげ」という形式で伝言を残せる(その人が帰ってきたときに伝言を伝えてくれる)。

という機能を持ったボットです。

言語の自動判別には最初Lingua::LanguageGuesserという、統計的な方法で言語判別をするPerlモジュールを使ってたんですが、チャットの発言みたいなすごく短い文だとうまく判別できないことがあったので、文中に「仮名」と「JISに含まれない漢字」と「ハングル」のうちどれが一番多いかで、日中韓を判別するようにしました。

あとExcite翻訳は中国語の繁体字/簡体字をちゃんと指定しないとうまく翻訳できないので、unihan.txtダウンロード)のkSimplifiedVariant、kTraditionalVariantあたりの情報を使って、繁体字(にしかない字)と簡体字(にしかない字)のどっちが多いかで判別してます。この方法はid:atsushienoさんに教わりました。