Rubyで文字のUnicode pointの取得とかその逆とか

NKFでUTF-16に変換してunpackして〜とかやってもできるんですが、めんどくさいのでUnicodeライブラリを使ってみました。

"ほ".to_u[0]
#=> U+307B HIRAGANA LETTER HO
"ほ".to_u[0].to_i
#=> 12411
0x307b.uchr.to_s
#=> "ほ"

$KCODE=="EUC"だとちゃんとEUCのStringを処理してくれます。

2007/6/19追記: なんかダウンロード先がリンク切れしてますね。ちょっと探した範囲だとここにあるのが同じものだと思います（未確認）。まとめてダウンロードするには

wget -np -r 'http://portal.iri.columbia.edu/Production/ruby/fileupload/lib/'

とか。

monthly gimite