HTMLソースを取り出す(閉じタグが無い場合の処理)preg_match_all




タグが閉じていないHTMLソースを取り出す方法。

HTMLソースを部分的に取り出したい時に下記のように

タグが閉じていない場合がありました。(終わりの

が存在しません)

元のソースの確認

ソースをテキストエディタなどで置換

<p>を
——————
<p>

<p>
—————–
と改行を入れたものに置換します。
最初と最後だけ、<p>を1つにします。

preg_match_allで繰り返し取り出す

preg_match_all( ‘/(<p>.+?)<p>/su’, $source, $match );
foreach ( $match[1] as $var )
{
echo $var."<br />";
}

こんな感じで取り出すことができます。
そんなに多くは遭遇しないですが、タマに出くわすと忘れているのでメモでした。




人気記事一覧


関連記事一覧

This entry was posted in PHPのプログラム and tagged , , , , , , , . Bookmark the permalink.

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です

次のHTML タグと属性が使えます: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code class="" title="" data-url=""> <del datetime=""> <em> <i> <q cite=""> <strike> <strong> <pre class="" title="" data-url=""> <span class="" title="" data-url="">