日本語ドメインURLの電子メール中での記述

日本語ドメイン名をFQDNに持つURLを電子メール本文に持つ場合の記述方式についてのガイドラインがJPRSから出されていた。

今日のメールクライアント(MUA: Mail User Agent)ではURLが含まれていた場合、自動的にそれをクリック可能なリンクとして表示させることが多い。テキストメールであれば、メール本文の表示時に自動でURLを判別し、それをクリック可能なリンクとするし、HTMLメールであれば、メール本文の作成時にユーザーが明示的にリンクを作成することもできるが、多くのメールクライアントでは自動で判別しリンク化する。

このような場合に、メールクライアントが日本語ドメイン名を持つURLをきちんと判別するように、さらにはメールクライアントにきちんと判別させるようなメールを作成することができるように、という目的でこのガイドラインが公開された。

メールクライアント開発者や利用者のために、テストデータが日本語ドメイン名URLクリック対応アプリケーションテスト仕様という形でも公開されている。必須と任意項目に分かれている仕様書の形をとっているのだが、これをそのままメールの本文に貼り付け確認できるので、これは便利だ。

必須項目としてサポートが要求されているのは、日本語ドメイン名を含むURLを山括弧(<>)またはダブルクォーテーション("")で囲まれている場合、すなわち


"http://日本語.jp"

もしくは



という形式でクォーティングする形式だ。

最近はもっぱらGmailしか使っていないので、Gmailで早速試してみた。メールを表示する際には、Webメールの宿命なので、主にブラウザの仕様に依存することになるが、Firefox 2.0.0.1で確認してみたところ、必須項目についてはきちんと表示されているようだ。

一方、メール作成時だが、プレーンテキストメールの場合は、そのまま送るので、特にGmail側での作業は行われない。HTMLメールでは、次のように、必須項目は入力されたそのままの形で、アンカーが記述される*1ので、結局表示は受信した側のブラウザやメールクライアントに依存することになる。

次は&lt;<a href="http://日本語.jp">http://日本語.jp</a>&gt;をクリックしてください<br>
次は&quot;<a href="http://日本語.jp">http://日本語.jp</a>&quot;をクリックしてください<br>
次は&lt;<a href="http://日本語.jp">http://日本語.jp</a>&gt;をクリックしてください<br>
次は&quot;<a href="http://日本語.jp">http://日本語.jp</a>&quot;をクリックしてください<br>
次は&lt;<a href="http://日本語。jp">http://日本語。jp</a>&gt;をクリックしてください<br>
次は&quot;<a href="http://日本語。jp">http://日本語。jp</a>&quot;をクリックしてください<br>
次は&lt;<a href="http://日本語。jp">http://日本語。jp</a>&gt;をクリックしてください<br>
次は&quot;<a href="http://日本語。jp">http://日本語。jp</a>&quot;をクリックしてください<br>
次は&lt;<a href="http://日本語.jp">http://日本語.jp</a>&gt;をクリックしてください<br>
次は&quot;<a href="http://日本語.JP">http://日本語.JP</a>&quot;をクリックしてください<br>
次は&lt;<a href="http://日本語.JP">http://日本語.JP</a>&gt;をクリックしてください<br>
次は&quot;<a href="http://日本語.jp">http://日本語.jp</a>&quot;をクリックしてください<br>
次は&lt;<a href="http://日本語。jp">http://日本語。jp</a>&gt;をクリックしてください<br>
次は&quot;<a href="http://日本語。JP">http://日本語。JP</a>&quot;をクリックしてください<br>
次は&lt;<a href="http://日本語。JP">http://日本語。JP</a>&gt;をクリックしてください<br>
次は&quot;<a href="http://日本語。jp">http://日本語。jp</a>&quot;をクリックしてください<br>

任意項目の妥当性

一方、日本語ドメイン名URLクリック対応アプリケーションテスト仕様にある必須項目については若干の疑問がある。

「3.4 日本語ドメイン名URLと文章の区切りが明確でない場合」には次のように書かれている。

次はhttp://日本語.jpをクリックしてください。JPドメイン名では、日本語の文字列もホームページのアドレスにできるのです。

次はhttp://日本語.jpをクリックしてください。JP
ドメイン名では、日本語の文字列もホームページの
アドレスにできるのです。

次はhttp://日本語.jp/をクリックしてください。JPドメイン名では、日本語の文字列もホームページのアドレスにできるのです。

次はhttp://日本語.jp/をクリックしてください。JP
ドメイン名では、日本語の文字列もホームページの
アドレスにできるのです。

次は、日本語.jpをクリックしてください。JPドメイン名では、日本語の文字列もホームページのアドレスにできるのです。

次は、日本語.jpをクリックしてください。JP
ドメイン名では、日本語の文字列もホームペー
ジのアドレスにできるのです。

次は、日本語.jp/をクリックしてください。JPドメイン名では、日本語の文字列もホームページのアドレスにできるのです。

次は、日本語.jp/をクリックしてください。JP
ドメイン名では、日本語の文字列もホームペー
ジのアドレスにできるのです。

インターネット上のTLDが現在ではNon ASCIIになることは無い(将来的に、Non ASCIIのTLDはサポートされる)ため、".jp"以降はURLではないと判断することを期待しているのかもしれないが、将来のことを考えると、果たしてそのような現状をベースとした実装をするのが正しいかどうか疑問が残る。すべての登録されているTLD*2かどうかでURLの終わりを判断するのも、可能な方法ではあろうが、あまり好ましいとは思えない。

また、"/"で終了しているURLであるが、これもURLがそこで終了しているかどうかの判断がつきにくい。たとえば、「日本語.jp/をクリックしてください。JP」と書かれていても、「をクリックしてください。JP」というのがURLのパスやファイル名に相当しないとは言い切れない。日本語のパスやファイル名の記述というのは文字のエンコーディングとも関係するので、本来は使うべきではないのかもしれないが、特にイントラネットなどでは使われていることも多い。それを考えると、"/"以降にNon ASCII文字があるからという理由だけで、そこをURLのターミネータとするのは少し乱暴のようにも思う。

思うに、この「任意」というのは、"Nice to have" という意味ではなく、"may"、すなわち、「このように実装してもかまわない」という意味なのであろう。

そもそもメール本文におけるURLの自動判別のあるべき姿とは

上で指摘した、この2つの課題−FQDNの判別とURLの判別−というのは、日本語ドメイン名だけに関係するものではない。通常のASCII文字のみで構成されたドメイン名のURLにおいても同じことは問題となる。不勉強のため、詳しくないのだが、URLかどうかを自動判別するためのガイドラインというものはどこかに存在するのだろうか。英語圏ではスペースやカンマなどがあると、URLのターミネータと判別することが一般的のようだが、本来はこれにも例外がある。スペースなどもURLのパス名になりうるからだ。そう考えると、今回のガイドラインに書かれている「日本語ドメイン名を含むURLを山括弧(<>)またはダブルクォーテーション("")で囲まれている場合」はURLと判別するというのは、日本語ドメイン名を含む場合ではなく一般において普遍化されるべきガイドラインのようにも思う。繰り返すが、不勉強なため、すでにガイドラインもしくは仕様として存在しているようでしたら、ごめんなさい。どなたかご存知の方がいたら、教えて欲しい。

参考日記

参考までに以前書いた日本語ドメイン名(IDN)関連の日記のリンクを挙げておく。

*1:これはこれで正しいように思う。

*2:ccTLDも当然含む。