monthly gimite

試験運用中。

Rubyで文字のUnicode pointの取得とかその逆とか

NKFUTF-16に変換してunpackして〜とかやってもできるんですが、めんどくさいのでUnicodeライブラリを使ってみました。

"".to_u[0]
#=> U+307B HIRAGANA LETTER HO
"".to_u[0].to_i
#=> 12411
0x307b.uchr.to_s
#=> "ほ"

$KCODE=="EUC"だとちゃんとEUCのStringを処理してくれます。

2007/6/19追記: なんかダウンロード先がリンク切れしてますね。ちょっと探した範囲だとここにあるのが同じものだと思います(未確認)。まとめてダウンロードするには

wget -np -r 'http://portal.iri.columbia.edu/Production/ruby/fileupload/lib/'

とか。