日本語・マルチバイト特有の問題

出典: WordPress Codex 日本語版

WordPress の開発者およびユーザーの多くはマルチバイト文字以外の言語圏の人であるため、日本語の取り扱いが考慮されていなかったり、不十分な箇所がまだあります。

目次

プラグインで修正済みでの問題点

現在の WordPress 日本語版パッケージでは、同梱の WP Multibyte Patch プラグイン最新ソースコード)で修正を行っています。以下は、WordPress コアに存在する問題点ですが、同プラグインを使用すればすべて解決します。

文字コードに関する問題

UTF-8 以外の文字コードからのトラックバックの文字化け

現在の WordPress 英語版・日本語版は UTF-8 を標準にしていますが、その他(例: EUC-JP や Shift_JIS)の文字コードを使っている他のレンタルブログサービスやブログツールなどからトラックバックを受けると文字化けが発生します。

UTF-8 以外の文字コードからのピンバックの不具合

UTF-8 以外の文字コードを使っている他のブログからピンバックを受けると本文の抜粋が空になります。

メールの文字化け

デフォルトでは UTF-8(8ビット)でメールを送信するため、ISO-2022-JP の携帯メールやメールクライアントでの文字化けが発生します。

文字数カウントに関する問題

抜粋の不具合

単語間のスペース区切りで文字数をカウントしているため、本文が日本語の場合、抜粋としてうまく短縮されません。

投稿画面の不正な文字カウント表示

日本語で本文を書いた場合、投稿画面の下部にリアルタイムで表示される文字カウントが正しく計算されません。

日本語特有の文字に関する問題

検索での全角スペース無視

検索キーワードとして入力した日本語の全角スペースがスペース区切りとして認識されません。

参考資料

このページは以下の資料を参考にして書かれました。

WordCamp Tokyo 2009 プレゼン「日本語環境に必要なもの」