サイトの移行作業で、エクスポートできないサイトの記事から、MTに移行した。
ざっと方法を。作業環境はMac。
サイトのソースを取得
SiteSucker でソースをダウンロード。
移行したいブログの詳細記事を作業用ディレクトリにまとめる。
ソースの書き換え
Movable Typeの記事インポートフォーマットに合わせてソースを書き換える。
Jedit Ω を使って、複数ファイルのソースを置換していく。正規表現によって書き換えていく。試行錯誤しながら、記述を整えたら、3回くらいの変換で複数ファイルを変換できた。
本文欄はHTMLそのままにし、インポート用ファイルをフォーマットなしに指定する。
CONVERT BREAKS: 0
ファイルの結合
ターミナルでの作業。作業ディレクトリに移動し、
cat *.html > import.txt
で1つのファイルに結合する。
インポート
MTにて記事をインポート。
最初、記述は問題なさそうなのにうまくインポートできずに悩んだが、ファイルの改行コードが「Windows(CR+LF)」になっていたのが問題だったらしい。「macOS/Unix(LF)」に変更したらうまく読み込めた。
これだとどんなサイトでもMTの記事に移行できそうなので、覚えておきたい。