ケータイ絵文字にみる日本の3大キャリアの失敗

東京女子大学のトップページ   情報処理センターのページ   東京女子大学の Gmail のページ   東京女子大学の図書館のページ   浅川のホームページ   授業のホームページへ戻る

ご存知のとおりケータイには絵文字機能が実装されています。 ですが,ケータイを使ってインターネットにアクセスする場合,絵文字を使ってはいけません。 文字化けしたりして情報が伝わらない可能性があるからです。 今回の雑学では,この理由をお話ししましょう。

絵文字のことを英語ではピクトグラム pictgram と言います。 これは本来,貧困などの問題で教育が十分受けられず, 文字を読めない人がいる国や地域で, そのような人たちに分かってもらえるように便宜はかる目的だったり, そもそもその国の文字表記がわからない外国人旅行者のためだったりしました。

このように絵文字,ピクトグラムは本来決して悪者ではないのですが, 情報交換を主たる目的とするケータイでは互換性の問題が立ちはだかります。 これは,ケータイで利用できる資源が限られていた時代に, キャリア各社が勝手に 文字コードの規格を拡張してしまったという経緯があるからです。

文字化けの例を示します。 たとえば,ドコモのケータイでどこかの掲示板に, fig1 と書き込んだとしましょう。すると PC のブラウザからは, fig2 とか fig3 のように見えてしまいます。これでは情報交換の意味がありませんね。

これは,ケータイメールの初期には,キャリア各社が, 日本語の情報交換をする際の国際的な規格である ISO-2022-JP という規格に準拠せず, SHIFT-JIS という規格を採用してしまったためなのです。 SHIFT-JIS という規格は,漢字やひらがなについては,ほぼ ISO-2022-JP と同じなので, 問題は生じにくいのですが, 絵文字に関しては各社バラバラ という状況になってしまいました。

ケータイ大手 3 社の対応

ですから,以前から,異なるキャリアのケータイへ絵文字の入ったメールを送ると文字化けする, という問題が知られていました。各社独自規格ですから文字化けするのは当然なのですが, 自社ユーザを取り込んで逃がさないようにするための企業側の論理ばかりまかり通って, 困るのはユーザだったわけです。

2005 年に, ソフトバンク(ただし当時はボーダフォン)が, 他社携帯電話宛の絵文字を含むメールの絵文字部分の自動変換サービスを開始しました。 Docomo, au もこのサービスに追随し, ケータイ大手 3 社間では絵文字を使ってメールを送信しても, 文字化けはおこらないようになりました。 しかし,この方法にも問題が残ります。 問題は本質的に解決されたわけではないからです。

まず,ケータイから PC へのメールについては何も考慮されていません。 ですから,PC との情報交換には依然として問題が残ったままです。 さらに,この方法では,新しくキャリアが参入するなり,新しい端末 (ウィルコムの PHS や アップルの iPhone や各社アンドロイド端末など) が開発されたときには,その数だけ対応表が必要になってしまいます。

本来なら,このような変換を行う際には, ひとつの中心となる情報交換のための規格体系を定めて, その体系に準拠するように自社のケータイ端末を設計するという選択をすべきでした。 そうすれば,インターネットとの互換性の問題も容易に解決できたはずです。 ところが,上述の 3 社は,そういう互換性の問題を本質的に解決する道を選ばず, その場限りの対応をする道を選んでしまいました。 最悪の選択をしたといってもよいでしょう。

ユニコードへの絵文字収録の提案

本来なら,上記のような問題は, 日本企業が音頭をとって世界規格を標準化すべく努力すべきであったのでしょう。 絵文字とは日本のケータイにだけ存在する独特な文化なのです。 もし,万人が納得する共通の規格を作りだすのだすれば, 当然オリジナルの発信国である日本が音頭をとって推進していくべきでした。 なにせ,自国の文化なのですから。 ところが,日本企業はそういった努力をする事無く, 勝手に大手 3 社だけの互換サービスを開始することでお茶を濁してきたのです。

このような日本市場に黒船が来襲します。 2008 年になって,アメリカ合衆国のグーグル Google 社とアップル Apple 社が共同で, ユニコード Unicode と呼ばれる文字コード体系の中に, 絵文字を挿入するという方法で標準化規格を作成しようという提案がなされました。 絵文字のユニコード符号化:符号化提案用のオープンソースデータ も見てください。 それにともない,グーグル社の運営する Gmail (本学でも標準メールとして採用しています) で絵文字が使えるようになりました。 今のところ,グーグル社とアップル社の独自提案であり, マイクロソフト,IBM, Sun, Oracle といった企業は参画していません。 グーグル社によれば,順調に作業が進んだとして実装されるのは 2010 年, 従って,すべてのケータイ,PC で共通の絵文字が使えるようになるには, まだ時間がかかると思っていた方が無難なのです。 また,ユニコードに絵文字を取り入れる際に無理をしているということも事実です (ここでは詳し過ぎるのでとりあげません。興味のある方は, 絵文字が開いてしまった「パンドラの箱」第3回--Unicode提案の限界とメリット なども参照してください)。

ユニコード Unicode とは世界中の文字を一つの文字コードで表現しようというプロジェクトです。 実際に,マイクロソフトのワードなどでもユニコードが使われています。 ですが, 東アジアの漢字文化圏では多数の文字が存在します。 ユニコードにも問題があって,登録されている文字が重複するとか, 似通った複数の異なる文字が存在するなどの問題点があるのです。

さらに,統一規格であるはずのユニコードでありながら, Windows で採用されているユニコードと Macintosh で採用されているユニコードとでは, 互換性がありません。 どちらも UTF-8 というユニコードの方言を用いていますが, この方言に違いがあるのです。

そのため,情報処理センターの Macintosh で作ったファイルを, 日本語のファイル名で保存し,自宅にもって帰った時,そのファイルが文字化けしていたり, 読めなかったりするということが起こります。 このような混乱を避けるため, ファイル名は半角英数文字を使うという習慣をつけた方が良いでしょう。

具体的には, Mac OS X は UTF-8 のファイル名に, Normalization Form D という方法を採用しています。 これは,濁点のついた文字は 2 つのコードポイントに分解される方法です。 例えば,「バ」は「ハ」+「濁点コード」となります。 一方,Windows は Mac OS X のような変換を行わず, そのまま 1 文字が 1 コードポイントに対応するような方式でファイル名を保存しているのです (「バ」は「バ」のまま保存される)。 この結果として, Windows では Mac OS X で作成されたファイル名 (Normalization Form D で分解された文字列) は正しくデコードできないのです。 このため,Windows で書いたファイル名は Mac でそのまま見ることができますが, Mac OS X で書いたファイル名は濁点が落ちたり,アクセスできなかったりします。

ミクシィでの絵文字の互換性

日本におけるソーシャルネットワーキングサービスの最大大手である ミクシィ でも,絵文字,顔文字が使えるのはご存知の方も多いと思います。

ミクシィは,自社のサービスという閉じた世界での情報交換ですから, 自社の努力によって,すべての PC やケータイ端末から絵文字が見えるようにしておけば, 問題はないのかも知れません(ミクシィの定めた絵文字入力方法に従えばの話です。 上で書いたようなケータイ独自の絵文字を使えば当然文字化けします)。 しかし,現状では,すべての端末,すべてのブラウザから, 問題なく絵文字が表示できるわけではありません。 将来,新しい端末がでてきたら,その都度対応を行う必要があるのですから, ミクシィの対応も標準規格を念頭に置いた戦略とはとても言えないと思います。

たとえば「今 sakuranbo が食べたい」 と日記に書いてあっても,文字化けしたら「今〓が食べたい」となってしまい, 一体何が食べたかったのかサッパリ分からなくなってしまいます。 せめて「今サクランボ sakuranbo が食べたい」 と書けば,文字化けしたピクトグラムがサクランボであることが類推でます。 そのような書き方をするように心がけるのがよいでしょう。

ミクシィでは Javascript と呼ばれる技術を使って絵文字を実現しています。 Windows でミクシィの絵文字が表示されないというトラブルを良く聞きます。 これに対処するには,インターネットエクスプローラを使用している場合, 次の操作をすれば絵文字は表示されるようになるようです。

絵文字は使うべきなのか

絵文字を使うメリットとしては,

私はこう反論します。 絵文字でしか,雰囲気を和らげることができないのであれば,文章力の欠如です。 インターネットは情報交換の場なのですから, だれでもに伝わるような表現方法を工夫すべきです。 また,視覚障害者の方はインターネットやメールを読むために, 「読み上げソフト」という文字を音声に変換してくれるツールを使っています。 絵文字を使った文書ではこの読み上げソフトが対応していなければお手上げです。

メールが華やかになるとか,かわいいとかどうかは,主観の問題ですから立ち入りません。 彼氏とのメールでお互いに互換性があることが確認できれば使っても良いでしょう。 ただし,絵文字と言ってもドコモで野球のボールの絵文字が, ソフトバンクでは野球選手の絵文字になっていたり微妙に異なる場合があります。 これで,正確な情報が伝わるのでしょうか? ケータイの絵文字はどこまでズレるのか というブログの中には,こんな絵がありました。

pictgram-fig4

絵文字入りのメールを各社ケータイに引用して送信し, それをさらに引用して送信することを繰り返した結果, 「熱」だった絵文字が「ほっとした顔」となってしまい,意味が違ってきます。

それでもまだあなたは絵文字を使い続けますか?