WordPressのXML Sitemap作成プラグインについて

map-of-the-world-1715049_710px
XMLサイトマップ作成プラグインはとりあえずインストールしておきたい。しかし何でもいい訳ではなくて、サイトマップを複数に分割して出力できるものがよい。「Google XML Sitemaps」「XML Sitemap & Google News feeds」など有名なプラグインはたいてい対応しているようだ。

処理が軽い?重い?

まず仕組みとして記事が更新されるとサイトマップの内容も更新される。しかし、最近のプラグインでサーバー上にxmlファイルを生成するものはほとんどない。その代わりにクローラーなどがサイトマップを閲覧する時に動的に仮想ファイルが生成される(自分でrobots.txtを設置しない場合と同じ)。
クローラー来訪の度に仮想ファイルを生成するぐらいなら実ファイルのほうがいいんじゃないかと思うのだが、とあるプラグイン作者によると実ファイルより仮想ファイル生成のほうが堅牢かつ高速なんだとか。

しかし、そうはいってもクローラーがくる度にいちいち作り直してる訳です。あれこれ凝った事をしているプラグインは生成の負荷が増えるぶん重くなるらしい。

らしいとかあやふやな表現なのはP3がまともに使えなくなったので比較できんのです…。Search Consoleの「クロールの統計情報」→「ページのダウンロード時間 (ミリ秒)」も自分の場合は他の要因が混ざりすぎてて正確な比較にならんし。

なぜ分割できるプラグインがいいのか?

サイトマップに記載されているurlが増えると処理が重くなるのだ。

サイトマップ ファイルで指定する URL は 50,000 個以下、ファイルサイズは圧縮されていない状態で 10 MB 以下にする必要があります。

とGoogle様はいっておられるが、これはあくまで上限の話だ。例えばGoogle XML Sitemapsが仕様変更して月毎に分割するようになったのは処理を軽くするためである。記事の数が膨大になると1つのrobots.txtファイルに全て列挙するよりも期間を区切って複数のファイルに小分けしたほうが処理が速く終わる。

一応書いておくと、小分けなしプラグイン使用時で「ページのダウンロード時間 (ミリ秒)」が平均600ミリ秒前後だったのが小分けありプラグイン(Google XML Sitemaps使用)だと300ミリ秒台にはなっている。重いといわれてるGoogle XML Sitemapsのほうがむしろ速いっぽい。(Search Consoleに記録される90日間内にテーマを変えたり他のプラグインのON/OFFがあったりするのであくまで参考レベル)

Google側の処理時間

以前Google XML Sitemapsが重いという情報を見かけて気になったので、より小型軽量なプラグインに変更した事がある。1つのサイトマップに全てのurlを出力する作者もシンプル軽量を謳ってるやつだ。
記事数の少ないこちらのゲーム館で使うぶんには問題なかったので本館にもインストールしてみた。そしたら全然ダメ。

Fetch as GoogleをしてGoogleのbotがきてからインデックスが完了するまでの時間がとんでもなく長くなってしまった。どうやらGoogle側での処理時間もサイトマップのurlが増えるとそれに比例して伸びるらしい。100記事を超えたぐらいのサイトマップで3~4日ぐらいはかかったかな?

Google XML Sitemapsに戻したらまた1日もあればインデックス完了するようになった。どうやら小分けにしたサイトマップのほうが圧倒的に速いようだ。Fetch as Googleで無理やりインデックスさせても実際に処理が完了して「インデックスに登録済み」となる前に気がついたら検索結果から消えている事もあるので処理は速いほうがありがたい。

XML Sitemap & Google News feeds

一番人気はGoogle XML Sitemapsだが、こちらもなかなか悪くない。
XML Sitemap & Google News feedsはインストール直後の状態では1つのサイトマップに全て記述だが設定をいじれば年か月毎に分けられる。
さらに画像もサイトマップに含められる。デフォルトで画像込みになっているが、画像が多くなるとそのぶんGoogleでの処理時間が伸びるようだ。
記事の優先度を自動計算するようにできたりと設定で迷う要素が少ないのでものぐさにはこちらがいいかも。処理そのものはGoogle XML Sitemapsのほうが速いような感じ。


PAGE TOP