プロジェクト

全般

プロフィール

Backport(バックポート) #4393

未完了

Bug(バグ) #3289: 自動リンク機能で末尾のスラッシュを省略すると後続の日本語テキストもURLとしてリンクされてしまう

自動リンク機能で末尾のスラッシュを省略すると後続の日本語テキストもURLとしてリンクされてしまう

isao sano さんが4年以上前に追加. 4年以上前に更新.

ステータス:
New(新規)
優先度:
Normal(通常)
担当者:
対象バージョン:
開始日:
2012-12-27
期日:
進捗率:

0%

予定工数:

説明

現象

op_auto_link_text (source:lib/helper/opUtilHelper.php) を使用する箇所(アクティビティ、日記の本文・コメントなど)で、次のような現象が起こる。

http://example.com/テキスト と入力して投稿すると <a href="http://example.com/">http://example.com/</a>テキスト のように日本語の部分を除いて自動リンク機能が働くが、
http://example.comテキスト と入力して投稿すると <a href="http://example.comテキスト">http://example.comテキスト</a> のようなリンクが生成されてしまう。

原因

op_auto_link_text による自動リンクで使用される正規表現は次のように定義されている。

  define('SF_AUTO_LINK_RE', '~
    (                       # leading text
      <\w+.*?>|             #   leading HTML tag, or
      [^=!:\'"/]|           #   leading punctuation, or
      ^|                    #   beginning of line, or
      \s?                   #   leading whitespaces
    )
    (
      (?:https?://)|        # protocol spec, or
      (?:www\.)             # www.*
    )
    (
      [-\w]+                   # subdomain or domain
      (?:\.[-\w]+)*            # remaining subdomains or domain
      (?::\d+)?                # port
      \/?
      [a-zA-Z0-9_\-\/.,:;\~\?@&=+$%#!()]*
    )
    ([^a-zA-Z0-9_\-\/.,:;\~\?@&=+$%#!()]|\s|<|$)    # trailing text
   ~xu');

この正規表現はUTF-8モードが有効となっており(末尾の u オプションによる)、このモードではpreg_match内部でPCREに対して PCRE_UCF オプションが使用される。このオプションでは \d, \D, \s, \S, \w, \W などの 重要な 文字クラスの挙動が変わり、例えば \d は全角数字にもマッチし、 \w は漢字や平仮名にもマッチするようになる。これによって、ドメイン部分の [-\w]+ に日本語のテキストがマッチしてしまうため前述のような現象が起こる。

参考

修正内容

SF_AUTO_LINK_RE で使用されている \w, \s, \d[0-9A-Za-z], \ , [0-9] にそれぞれ置き換える。

kaoru n さんが4年以上前に更新

  • トラッカーBug(バグ) から Backport(バックポート) に変更
  • 対象バージョンOpenPNE 3.8.36 から OpenPNE 3.8.x に変更

他の形式にエクスポート: Atom PDF