HTMLソースを取り出す(閉じタグが無い場合の処理)preg_match_all




タグが閉じていないHTMLソースを取り出す方法。

HTMLソースを部分的に取り出したい時に下記のように

タグが閉じていない場合がありました。(終わりの

が存在しません)

元のソースの確認

ソースをテキストエディタなどで置換

<p>を
——————
<p>

<p>
—————–
と改行を入れたものに置換します。
最初と最後だけ、<p>を1つにします。

preg_match_allで繰り返し取り出す

preg_match_all( ‘/(<p>.+?)<p>/su’, $source, $match );
foreach ( $match[1] as $var )
{
echo $var."<br />";
}

こんな感じで取り出すことができます。
そんなに多くは遭遇しないですが、タマに出くわすと忘れているのでメモでした。




人気記事一覧


関連記事一覧

This entry was posted in PHPのプログラム and tagged , , , , , , , . Bookmark the permalink.

コメントは受け付けていません。