【Gooブログからワードプレスへの引っ越し方法】画像ファイルのダウンロードとリンク書き換えを自動で

ブログ

Gooブログからワードプレスへ、ブログ記事を一括で引っ越しする方法を、解説します。

本記事に沿って作業すれば、引っ越しが一通り完了するように書いてあります。

これまで、とくに大変だったのが、以下の2つの作業です。

  • Gooブログから画像をすべてダウンロードする。
  • 記事内のリンクを全て、新しいワードプレス内の画像URLへ書き換える。

この2つが自動でできるPerlスクリプトをプログラムしましたので、公開します。

これを使えば、Gooブログからワードプレスへの移転が非常に簡単に完了します。

スポンサーリンク

はじめに

本記事では、今回開発したPerlスクリプト convertBlog.pl の使い方を含め、Gooブログからワードプレスへ引っ越しをするやり方の全体を解説します。

この記事に従って作業すれば、引っ越しが完了できるように書いていますので、参考にしていただければ幸いです。

ただ、必ず以下の利用規約をご一読いただき、了解の上で使用してください。

動作環境と環境の構築について

Unix環境が必要です。

すでにUnix環境をお持ちで使い慣れている方は、【Unix初心者向け】と明記した節はスキップして読み進めてください。

Unix環境がない方は、Windowsで作業する場合に限り、WindowsのアプリとしてUnixをインストール・使用するやり方も解説します。Unixの知識がない方でも、読み進めて作業できるように書きました。

また、convertBlog.pl では、Gooブログのバックアップデータを入力ファイルとします。このファイルの入手方法も解説します。

Perlスクリプト convertBlog.pl の利用規約

本サイトで開発したPerlスクリプト convertBlog.pl を利用する方(ユーザー)は、本節にまとめる規約に同意したものとみなします。

convertBlog.pl は、個人的な使用に限り、自由にダウンロードし、また改造していただいて構いません。

convertBlog.pl は、転載、再配布を禁止します。

本記事へのリンクは歓迎です。紹介したい場合には、本記事へリンクすることで紹介してください。

convertBlog.pl を使用することで、なんらかの損害や不利益が生じた場合、当方は責任を負いません。ユーザーの責任で使用してください。

使用に関して不具合が生じた場合、お問い合わせいただければ、可能な限りで対応はしたいと考えております。ただし、素人が余暇に書いたプログラムであり、対応も同様です。ご希望に添える対応が必ず取れるとは限りません。ご了承ください。

使用してうまくいった、役に立ったと思った場合には、コメントを頂けると励みになります。よろしくお願いします。

前準備1―Gooブログのバックアップデータをダウンロードする

Gooブログのバックアップデータを取得するには、有料会員(goo blog フォト)になる必要があります。

初回は初月が無料になるので、月初めに有料契約し月末までに作業を完了して無料会員に戻せば、料金は発生しません。

有料会員の契約をしたあとで、以下を実行してバックアップデータをダウンロードします。

  1. Gooブログの編集画面、左側のメニューで「バックアップ・書籍化」を選択。
  2. バックアップデータの作成の「作成する」ボタンを押す。
  3. (データ作成には、私も実際に30分くらいかかりました)。
  4. 「ダウンロード」ボタンを押して、バックアップデータをダウンロードする。

ダウンロードしたデータはコピーを取り、gooBlog.txt とリネーム(名前を変更)してください。

前準備2―Unix環境を準備する 【Unix初心者向け】

Unix環境は、perlとshスクリプトが使用できればなんでも構いません。

Windows上で作業する場合に限りますが、Unix環境を構築するやり方を本節では紹介します。

ここでは、Windows上でアプリとしてUnixが動作するUbuntuアプリをインストールします。

  1. Windowsメニュー(画面左下のWindowsマークを押すと出る)で、「Windows Store」と入力してWindows Storeアプリを起動する。
  2. 「Ubuntu」を検索し、「Ubuntu 20.04 LTS」をダウンロード、インストールする。

Ubuntuのパッケージはかなり大きい(2.7GB)です。

ダウンロードに時間がかかるものの、インストールやアンインストールの扱いが簡単なので、おすすめします。

インストールが済んだら、Windows上でのUnixが実行できるように設定する。

  1. Windowsメニューで「control panel」と入力し、コントロールパネルを起動する。
  2. 「プログラム」→「Windowsの機能の有効化または無効化」。
  3. 「Linux用Windowsサブシステム」にチェックを入れる。

以上ができたら、「Windowsメニュー」から「Ubuntu 20.04 LTS」と探して、アプリを起動してください。

convertBlog.pl の動作概要

Gooブログのバックアップデータは、テキストファイルです。

さきほど、ダウンロード後に、gooBlog.txt という名前にリネームしてもらいました。

convertBlog.pl は、この gooBlog.txt ファイルを解析し、以下を行います。

  1. Gooブログ内の画像ファイルのURLへのリンク記述を探す。
  2. 見つけた画像ファイルURLをもとに、全画像ファイルをダウンロードする download.sh シェルスクリプトを生成する。
  3. ファイル内で画像ファイルへのリンクを、Gooブログ内のURLから新しいワードプレス内のURLに変更する編集を行い、 gooBlog_converted.txt という新しいファイルを作成する。

以下、それぞれの動作の要点を簡単にまとめます。

探す画像ファイルのURL

通常、Gooブログの画像ファイルは、

  • https://blogimg.goo.ne.jp/user_image/??/??/*.jpg

というURLになっています。

“*”は何文字でも普通の文字(アルファベットか数字または”_”)のパターン、”??”は任意の2文字のパターンです。

たとえば、以下のような感じです。

https://blogimg.goo.ne.jp/user_image/7f/d3/a1116b2c340f6f1e43a63d8eceed07c3.jpg

画像ファイルを探すときは、以下のパターンを探しています。

  • http(s)://blogimg.goo.ne.jp/*/??/??/*.jpg
  • http(s)://blogimg.goo.ne.jp/*/??/??/*.png
  • http(s)://blogimg.goo.ne.jp/*/??/??/*.gif

画像ファイルのダウンロード先の指定

たとえば、

https://blogimg.goo.ne.jp/user_image/7f/d3/a1116b2c340f6f1e43a63d8eceed07c3.jpg

をダウンロードする場合、作業ディレクトリ(フォルダ)内に、user_imageというディレクトリを作成し、

user_image/a1116b2c340f6f1e43a63d8eceed07c3.jpg

として画像ファイルは保存されます。(Unixでのディレクトリの区切りは、URLと同じく”/”です。Windowsでのフォルダの区切りは”\”で表すので、Windowsでは、user_image\a1116b2c340f6f1e43a63d8eceed07c3.jpg に見えます)

通常の場合、user_image と thumbnail という2つのディレクトリが生成されると思います。

画像ファイルの新しいURLの決め方

convertBlog.pl の33行目くらいにある次の行は、 $newdomain という変数に新しいワードプレスのドメインを入力します。(編集の仕方は、後ほどもう一度お話しします。)

my $newdomain= "https:\/\/travel-log.net";

この変数をもとにして、新しい画像ファイルの置き場を指定します。

先ほどと同じ例ですが、

https://blogimg.goo.ne.jp/user_image/7f/d3/a1116b2c340f6f1e43a63d8eceed07c3.jpg

このファイルの新しい置き場は、${newdomain}を、編集して置き換えたドメインとして、

 ${newdomain}/wp-content/uploads/gooblog/user_image/a1116b2c340f6f1e43a63d8eceed07c3.jpg

になります。

Perlスクリプト conertBlog.pl の使用方法

convertBlog.pl をダウンロード

以下から、convertBlog.plをダウンロードしてください。

https://travel-log.net/wp-content/uploads/gooblog/perl/convertBlog.pl

作業ディレクトリに必要ファイルを用意する

UNIXで、作業用に新規のディレクトリを作成し、そこに移動する。

Gooブログのバックアップデータを gooBlog.txt とリネーム(名前を変更)する。

convertBlog.pl と gooBlog.txt を作業ディレクトリに置く。

作業ディレクトリの用意の仕方【Unix初心者向け】

ディレクトリという言葉は、Windowsでいうフォルダとほぼ同義です。

作業ディレクトリという意味は、ファイルに保存したりする場合に、このディレクトリに保存するという意味だと思ってください。

そして、Windowsでもいま見ているフォルダ内にあるファイルをダブルクリックするとファイルが開いたりしますね。UNIXでも作業ディレクトリに移動しておいてから、ファイルを編集したりそのディレクトリ内に新しくファイルを作ったりするのが基本的な作業の仕方です。

Windowsユーザーで本記事に習ってUbuntuをインストールした方は、Windowsで作業ディレクトリを準備しておくことができます。

WindowsのDesktopに “BlogConvert” という名前で新しいフォルダを作製しましょう。

Windowsでのパスは、”C:\Users\[ユーザー名]\Desktop\ConvertBlog\”です。

このフォルダ内に、Gooブログのバックアップデータをリネームした gooBlog.txt と、本サイトからダウンロードした convertBlog.pl を置きます。

convertBlog.pl をエディットする

テキストエディタ(Windowsなら、メモ帳で結構です)で、convertBlog.pl を開きます。

33行目くらいにある、以下の行で、””内の部分を、引っ越し先のドメインに変更します。

ただし、”/”(スラッシュ)は、前に”\”(円サイン)を付けて”\/”のように表します。”\”でなく以下のようにバックスラッシュで表示される場合もあります。

新しいドメインが、”https://travel-log.net” の場合の記述は、以下のようになります。

my $newdomain= "https:\/\/travel-log.net";

作業ディレクトリに移動する【Unix初心者向け】

本記事に従ってWindows上で作業用フォルダを作製した皆さんは、Ubuntuを起動してください。

Windowsのコマンドプロンプトみたいな、黒くてコマンドを入力して実行するUnixのプロンプト画面が表示されると思います。

ひとつだけ注意してほしいのは、コマンドは基本的に半角英数字で全角で入力してはいけないことと、大文字と小文字は区別するので不用意に大小を変えると処理が正しく行われないことです。Windowsで日本語で付けてしまったファイル名やディレクトリ名は、Ubuntuではそのまま使用できると思います。

Windowsで”C:\Users\[ユーザー名]\Desktop\ConvertBlog\”だったパスは、UNIXからは、”/mnt/c/Users/[ユーザー名]/Desktop/ConvertBlog”です。

まず、以下のコマンドを入力して、作業ディレクトリに移動しましょう。もちろん、[ユーザー名]は、ご自身のWindowsでのユーザー名に読み替えてください。

cd /mnt/c/Users/[ユーザー名]/Desktop/ConvertBlog

Unixでは、現在のディレクトリの内容を表示するコマンドは、

ls

です。実行すると以下のように、用意したファイルが作業ディレクトリ内にあることが確認できると思います。

convertBlog.plを実行する

以下のコマンドを打ち込みます。

perl convertBlog.pl

実行すると、Gooブログにあった記事のタイトルと、その記事内で参照していた画像ファイルのURLが画面に書き出され、全記事の処理が終わるまでスクロールします。

処理の完了後で、lsコマンドを実行すると、

ls

以下のように、download.sh と gooBlog_converted.txt が新たに生成されています。

  • download.sh 画像ファイルをGooから全部ダウンロードするシェルスクリプト。次節で実行する。
  • gooBlog_converted.txt 画像URLをワードプレスサイト内に変更したGooブログのバックアップファイル。後ほど、ワードプレスにインポートする。

gooBlog_converted.txt はこのまま、ワードプレスにインポートできます。

インポートする前に中身を確認したい場合や、手動で直し足したい場合は、テキストエディタで編集しましょう。

Gooブログから画像ファイルをダウンロードする

画像ファイルのダウンロードは、download.sh を実行するだけです。

以下のコマンドを実行しましょう。

sh download.sh

すると、ファイルを1個1個ダウンロードするので、以下のようなメッセージが表示されながら、画面がスクロールし続けると思います。

画像ファイルのダウンロードなので、たくさん画像があれば時間がかかります。

処理が終了したら、再び ls コマンドを実行してみてください。画像の入っているディレクトリが生成されているのが確認できると思います。

できたディレクトリの内容を確認したい場合は、もちろんWindowsからでも確認できます。

以上で、convertBlog.pl とそれに派生する download.sh による変換とダウンロード作業は完了です。

あとは、できたファイルやディレクトリをワードプレスにインポートする作業です。次節で解説します。

ワードプレスへインポートする作業

画像ファイルのアップロードと、gooBlog_converted.txt のインポートをすれば、一通り引っ越しは完了です。

画像ファイルのアップロード

[ワードプレスサイトのドメイン]/wp-content/uploads/gooblog/

というディレクトリを作成し、ダウンロードされた user_image や thumbnail をアップロードします。

私の場合ドメインが https://travel-log.net なので、以下がアップロード先です。

https://travel-log.net/wp-content/uploads/gooblog/

アップロードの仕方は、契約サーバーによりますので、サーバーの仕様に従ってください。

gooBlog_converted.txt をワードプレスにインポートする

プラグイン「Movable Type・TypePad インポートツール」を使用してインポートする。

  1. WPメニュー→「プラグイン」→「新規追加」 から、「Movable Type・TypePad インポートツール」をワードプレスにインストールする。
  2. WPメニュー→「ツール」→「インポート」 で、「Movable Type と TypePad」の「インポーターの実行」 をクリック。
  3. 「ファイルを選択」で、gooBlog_converted.txt を選択すると、記事がすべてインポートされる。

これで一応、ひと通りの引っ越しは、完了します。

ご自分のワードプレスを見ると、すでにGooから持ってきた記事が公開できています。

残りの作業

本記事では以下の作業を、やり残しており、これらは手動で実施してください。

  • アイキャッチ画像の設定 (自動設定できるプラグインもあるようです)。
  • ブログ記事内の内部リンクの張り直し。

まとめ

Gooブログで書き溜めてきた記事を、ワードプレスに全部引っ越したいときの、引っ越し方を解説しました。

とくに面倒な、画像ファイルの引っ越しと、記事内の画像ファイルへのリンクの張替えを、自動化するPerlスクリプト convertBlog.pl を開発し、公開しました。使い方も詳しく解説しました。

これによって、引っ越しの手間がだいぶ楽になると思います。

convertBlog.pl を使用する際には、本記事内の利用規約を必ずご一読、了解の上で使用してください。

本記事を利用して引っ越しがうまくいった、役に立った場合には、コメントをいただけると、大変励みになります。

コメント

タイトルとURLをコピーしました