Project

General

Profile

Bug(バグ) #3289

自動リンク機能で末尾のスラッシュを省略すると後続の日本語テキストもURLとしてリンクされてしまう

Added by Youichi Kimura over 6 years ago. Updated about 2 years ago.

Status:
Rejected(差し戻し)
Priority:
Normal(通常)
Target version:
Start date:
2012-12-27
Due date:
% Done:

50%

3.6 で発生するか:
Unknown (未調査)
3.8 で発生するか:
Unknown (未調査)

Description

現象

op_auto_link_text (source:lib/helper/opUtilHelper.php) を使用する箇所(アクティビティ、日記の本文・コメントなど)で、次のような現象が起こる。

http://example.com/テキスト と入力して投稿すると <a href="http://example.com/">http://example.com/</a>テキスト のように日本語の部分を除いて自動リンク機能が働くが、
http://example.comテキスト と入力して投稿すると <a href="http://example.comテキスト">http://example.comテキスト</a> のようなリンクが生成されてしまう。

原因

op_auto_link_text による自動リンクで使用される正規表現は次のように定義されている。

  define('SF_AUTO_LINK_RE', '~
    (                       # leading text
      <\w+.*?>|             #   leading HTML tag, or
      [^=!:\'"/]|           #   leading punctuation, or
      ^|                    #   beginning of line, or
      \s?                   #   leading whitespaces
    )
    (
      (?:https?://)|        # protocol spec, or
      (?:www\.)             # www.*
    )
    (
      [-\w]+                   # subdomain or domain
      (?:\.[-\w]+)*            # remaining subdomains or domain
      (?::\d+)?                # port
      \/?
      [a-zA-Z0-9_\-\/.,:;\~\?@&=+$%#!()]*
    )
    ([^a-zA-Z0-9_\-\/.,:;\~\?@&=+$%#!()]|\s|<|$)    # trailing text
   ~xu');

この正規表現はUTF-8モードが有効となっており(末尾の u オプションによる)、このモードではpreg_match内部でPCREに対して PCRE_UCF オプションが使用される。このオプションでは \d, \D, \s, \S, \w, \W などの 重要な 文字クラスの挙動が変わり、例えば \d は全角数字にもマッチし、 \w は漢字や平仮名にもマッチするようになる。これによって、ドメイン部分の [-\w]+ に日本語のテキストがマッチしてしまうため前述のような現象が起こる。

参考

修正内容

SF_AUTO_LINK_RE で使用されている \w, \s, \d[0-9A-Za-z], \ , [0-9] にそれぞれ置き換える。


Related issues

Copied to OpenPNE 3 - Backport(バックポート) #3707: 自動リンク機能で末尾のスラッシュを省略すると後続の日本語テキストもURLとしてリンクされてしまう Rejected(差し戻し) 2012-12-27
Copied to OpenPNE 3 - Backport(バックポート) #3708: 自動リンク機能で末尾のスラッシュを省略すると後続の日本語テキストもURLとしてリンクされてしまう Rejected(差し戻し) 2012-12-27

Associated revisions

Revision 6be8a693 (diff)
Added by Youichi Kimura over 6 years ago

add testcases for op_auto_link_text (refs #3289)

Revision faa18559 (diff)
Added by Youichi Kimura over 6 years ago

fix SF_AUTO_LINK_RE matches unexpected characters (fixes #3289)

History

#1 Updated by Youichi Kimura over 6 years ago

  • Assignee set to Youichi Kimura

6be8a693fdc59a3d4cc530fd47bfea507a9d6ca8 にてテストケースを追加しました。

#2 Updated by Youichi Kimura over 6 years ago

  • Description updated (diff)

詳しい原因が判明したためチケットの説明を修正しました。

#3 Updated by Youichi Kimura over 6 years ago

  • Description updated (diff)

#4 Updated by Youichi Kimura over 6 years ago

  • Status changed from New(新規) to Pending Review(レビュー待ち)
  • % Done changed from 0 to 50

更新履歴 faa18559888e21e6ddfbffd155ece828b815e9d6 で適用されました。

#5 Updated by Youichi Kimura over 6 years ago

  • Description updated (diff)

#6 Updated by isao sano over 4 years ago

  • Copied to Backport(バックポート) #3707: 自動リンク機能で末尾のスラッシュを省略すると後続の日本語テキストもURLとしてリンクされてしまう added

#7 Updated by isao sano over 4 years ago

  • Copied to Backport(バックポート) #3708: 自動リンク機能で末尾のスラッシュを省略すると後続の日本語テキストもURLとしてリンクされてしまう added

#8 Updated by Shinichi Urabe over 4 years ago

  • Status changed from Pending Review(レビュー待ち) to Rejected(差し戻し)

日本語ドメインがリンクされなくなりますが、問題無いでしょうか

#9 Updated by isao sano about 2 years ago

対象バージョン変更のため、修正内容の確認を行います。

#10 Updated by isao sano about 2 years ago

  • Target version changed from OpenPNE 3.9.0-old to OpenPNE 3.9.0

Also available in: Atom PDF