プログラマのための文字コード技術入門
最初にハマったのは、新人のころのSolarisを使ってたときのテキストの扱いかな。
Windowsで作成されたShift_JISのファイルをバイナリモードで転送して、
化け化けにしてしまったりね。懐かしい。このころはまったく分かってなかった。
次は、EUC、Shift_JIS、Unicode(UTF-8、UTF-16、UTF-32、UCS-2、UCS-4)・・・・
なんでこんなにあるんだーって発狂しそうになったころ。
後はトラブルで、多々ハマった。
ブラウザ→Webアプリ→DBでコード系が違って、コード変換ではまったり。
よく使ってしまうけど、「〜」なんて大っきらいだ!と叫んだり。
IE8 のJISエンコーディングの自動検出を無効にする修正プログラム
で、古いHTML、マニュアルが文字化けして読めなくなったなんてのもあるし。
身近なところでも、Twitterでもクライアントによっては、表示できなくて四角になってる文字もあるね。
あとは、Vistaから取り込まれたJIS2004(JIS X 0213:2004)対応とか、まだ対応必要なのと。。。
その度に一度は、体系的なものをを頭に叩き込みたいなと思ってた。
以下のリンクを読んだことがある人は、同じように思ってる人も多いんじゃなかろうか。
文字コード規格の基礎
いいから聞け! 俺が文字コードについて教えてやるよ その1(前提知識編)
この本は、そんな人にオススメです。
もう一度、手を動かして確認しながら、読みなおしてみようっと。