Rubyで文字のUnicode pointの取得とかその逆とか
NKFでUTF-16に変換してunpackして〜とかやってもできるんですが、めんどくさいのでUnicodeライブラリを使ってみました。
"ほ".to_u[0] #=> U+307B HIRAGANA LETTER HO "ほ".to_u[0].to_i #=> 12411 0x307b.uchr.to_s #=> "ほ"
$KCODE=="EUC"だとちゃんとEUCのStringを処理してくれます。
2007/6/19追記: なんかダウンロード先がリンク切れしてますね。ちょっと探した範囲だとここにあるのが同じものだと思います(未確認)。まとめてダウンロードするには
wget -np -r 'http://portal.iri.columbia.edu/Production/ruby/fileupload/lib/'
とか。