2007年07月28日(土) [長年日記]
[English!]
[한국어]
[今日は何の日]
§1 正規表現を修正
暫く前に無駄な改行を排除するための正規表現を書いたが、これでもなお排除できない問題が発生。なんと、<br>と<br>の間にスペースを入れている人があるのですね。こんな事は想像もしませんでしたが、何とか正規表現で排除できそうなので前回のを少し変更して試したらバッチリ上手く言ったのでしばらくこれで様子見です。
$Value =~s/<br>[ ]*(<br>)+/<\/p><p>/g;
これで、<br>と<br>の連続か、間に半角または全角のスペースが入っている場合に段落に変更してくれる。このスクリプトはタグをそのまま保存したりしているのでデータ量が増える傾向ですね。出来るだけ要らないものは保存しないで表示の時に整形する方がいいような気がしますが。そこまで直すのは僕には無理なので、この辺の小手先のワザでしのいでいるというあんばいです。