RSS | ATOM | SUCHE
ケータイでドイツ語 2004
ケータイのブラウザは、文字コードの扱いでも進化していた。

前項でもちらっと書いたように、EUC-JP のページが読めるようになっているのだ。手元にあった D503i や Paldio 642S (ともに中身は2001年型)で試してみたら、シフト JIS 以外は文字化けした。2003年の端末である、N505i, J-SH010, AH-J3002V とも、EUC-JP のページは問題なく読めた。UTF-8 は壊滅的に読めないが。

ここに MT をインストールするとき、UTF-8 でなく EUC-JP を選んだのもそのためだ。各国語学習ブログを復習するのに、ケータイで読めた方がいいから。

日本のケータイのブラウザでは、文字実態参照は ü のように表示され、数値参照は N の i-mode 端末のみウムラウトなどが表示される。ただし、パケッ得3などのiアプリでは N であってもほかのケータイと同じ条件になるようだ。

ヨーロッパのケータイは文字実態参照でちゃんとウムラウトが出るらしく、Der Standard(CE版)のように数値参照で書いてくれるところは、あまり多くはなさそうだ。tagesschau (i-mode 版)も、文字実態参照だ。

だから一時期は文字実態参照がナマで出てきてもいいや、と思っていた。ブログは概要などが入るのでファイルが大きくなるけど、それでもいいや、と。でもやっぱり、パケ代は怖いし、ウムラウトも表示したいし、ウムラウトがだめでも u: などで代用して表示してみたい。少なくとも、自分のブログくらいは。

そこで、Naochan のアイデアを借りて、まず MT のテンプレートを作り、ケータイ用の個別&インデックスファイルを出力するようにした。RJ Watch がいちばんわかりやすいかな。

これだけでも十分だったのだけど、同じく Naochan のページにあった conv.cgi を改造して、シフトJIS に変換した上、文字実態参照を「N 端末用の、数値参照」と「ほかの端末用の、u: などで代用したもの」に変換するものを作ってみた。こちらは、CGI を動かさないと更新されないから、もしかしたら古いものが残っているかもしれないけど。
検索は、msearch を利用することにした。これまたインデックスを genindex.cgi で作らないといけないので、MT についている検索よりは、データが古いかもしれない。EUC-JP / 数値参照 / その他 の検索プログラムの表紙は、ケータイ用のページの目次も兼ねている。(ヒソカに、accesskey もつけてある。)

ちなみに conv.cgi の改造場所は、[extra] の部分で、

$line =~ s/&Auml¥;/Ä¥;/g; # A-Umlaut

みたいに書いて並べていけばよい。さらにわたしのシュミで、スタイルシートをそれぞれ入れ替えてみた。x-sjis になるようにメタなんとかタグを書き換えるのも忘れずに。
あともしできたら、外のドイツ語のファイルを数値参照や u: に変換して表示する CGI なんてのが作れるといいんだけど、まだわたしには Perl がよくわからないので、ちょっとお預けかな。何を勉強すればいいのか、調べてみようっと。
にほんブログ村 外国語ブログ 多言語学習者(学習中)へ
にほんブログ村
応援してくださる方は、Amazon からお買い物の時に次のリンクから買っていただけますと幸いです。→Amazon

Autorin: Joe , Kategorie «ケータイ» , 05.03.2004 14:06 JST