2003年08月10日(日) [長年日記]
§1 児童虐待の多様性
子どもが病気で手術が必要なときに、医者が同意を求めても同意しないため、子どもの身が危機にさらされるというケースも児童虐待として有るらしい。もちろん宗教的な理由は入らないと思うけど、いろんな虐待の形があるのですね。今回の場合児童相談所が介入して無事子どもは手術を終え今は小学校に通っているらしい。親権停止か…。なんだかなぁ!
§2 データコンバート
おみさんの以前の日記をtDiaryに入れようと四苦八苦している。前のスクリプトはPerlでKAIさんという人の作品だ。ずいぶん苦労してXHTML1.0にしたものだが、長い間世話になった。
データ自体は素直なCSV形式なので、データベースなどで簡単に読みとることが出来る。tDiaryのデータは改行がセパレータになったデータなのでこれも比較的扱いやすいが、ヘッダ部分の日付、タイトル、形式などが項目名と項目値の対になっていて、少し変則的だ。
面倒だったのは日付の扱いで、以前の日記は年・月・日がバラバラに記録されていて、しかも月と日は桁数が揃えてなかった。これをtDiaryでは、8桁の数字にしなくてはならない。
データベースに一旦読み込んで、一桁の月日には前にゼロを挿入後、年月日を連結。画像のファイル名を日付+枝番号.jpgに全て変更して、月ごとにタブ区切りのテキストファイルで書きだし。
テキストファイルをエディタに読み込んで、タブ\tを改行\nに変換、文中のパラグラフ記号</p><p>を改行\nに変換、文中の<br />を削除てなぐあいで作業を進めた。
エディタが悪かったのか、時々文字が化けたり消えたり。ヘンなところで改行したりと大変だった。気付いたのが遅かったが気を取り直してエディタをバージョンアップしたらあっさり解決。スピードも格段に上がっていた。
と言うわけで徐々に修正しますので、現時点でのお見苦しさはご勘弁下さい。ってここで言っても仕方がないか(^^;
誠にご苦労様です(笑)かなりの量ありましたよね?
2000年12月以前の日記はHTMLで、おみさんも思い入れがあるのであのままにしておきます。なかなか時間がかかります。(^^;