ガラパゴスタ

楽する。楽しむ。生み出す。

はてなブログのサイトマップが sitemap.xml だけだと Google が巡回してくれない件

Google Search Console に当はてなブログのサイトマップ sitemap.xml を登録しているのですが、一度登録しただけでは不十分だとわかりました。表示上は「成功」と出ているのに、Google が巡回していないという状態です。

何が起きているのでしょうか。調べて対策してみました。

結論

最初に結論をまとめておきます。

  • サイトマップは 3 ファイルあるので、全部登録すること
  • ブログデザイン変更など、大きな修正を入れた後は、手動で再登録しておくこと
  • サイトマップが巡回されるタイミングは不明だが、何日も巡回されていないことがあるので、たまにはチェックする

現状

スクショを載せます。

f:id:stakiran:20190106093835p:plain

よくよく確認してみると……最終読み込みが 18/11/19(画面確認時の日付は 19/01/02)で、記事数が 37(画面確認時の記事数は69)となっています。

11/19 以降、巡回されていない です。

なぜ巡回されていないのか

18/11/19 以降、サイトマップが巡回されていないのはなぜでしょうか。

はてなブログのサイトマップ構造

まず、はてなブログのサイトマップ構造を調べてみました。

以下のように 3 ファイルあります。

  • sitemap.xml(サイトマップのトップページ)
    • sitemap.xml?page=1(各記事のサイトマップ)
    • sitemap_page.xml(各固定ページのサイトマップ)

現状の結果を読み解く

このサイトマップ構造を踏まえて現状を読み解くと、

sitemap.xml?page=1(各記事のサイトマップ)が、18/11/19 以降、巡回されていない

と言えます。当ブログの開設は 10/27 で、11/19 までに 37 記事投稿しています。 11/19 にサイトマップ登録した時は、ちゃんと反映されている ということです。この時は sitemap.xml のみ送信していました。

実際、sitemap.xml については、一日おきに読み込みが行われています。だからこそ僕は「ああ、ちゃんと巡回されているな」と判断していました。ところが、前述のとおり、sitemap.xml?page=1(各記事のサイトマップ) は巡回されておらず、検出 URL 数も 37 のままです。

考えられる原因

ここまでを踏まえて、11/19 以降、巡回されていない原因について考えてみます。

  • 原因1. sitemap.xml を 手動で登録した時のみ sitemap.xml?page=1(各記事のサイトマップ) も辿られる仕様になっているため
  • 原因2. 11/19 にブログデザインを大きく変更したせいで、Google が巡回時に辿らなくなったため

僕が思い浮かぶのはこれだけでしょうか。

対策

というわけで、対策としては、考えられる原因すべてに対処することにしました。

対策: サイトマップのファイルを 3 ファイルとも全て手動で登録(送信)する

早速 3 ファイルとも登録してみました。

f:id:stakiran:20190106094019p:plain

sitemap_page.xml だけ取得できてないのが気になりますが、ひとまずこれで様子を見ます。

経過報告

経過1. ちゃんと巡回されました!

f:id:stakiran:20190106094104p:plain

対策を実行したのが 19/01/03 8:20 頃でした。そして、同日 10:20 頃確認してみたら、上記画像のとおり巡回されていました。検出 URL 数が 18/11/17 時点の 37 から 19/01/03 時点の 92 になっています。

経過2. しかし一日一回レベルでの自動巡回はされない模様……

僕としては「一日に一回くらい、サイトマップが巡回されて更新されればいいなぁ」と思い、実際どうなるかをしばらくモニタリングしていたのですが、甘くないようです。

f:id:stakiran:20190106094239j:plain

理想は最終読み込み時間が 2019/01/05、検出 URL 数が 94 ですが、実際は 92 や 93 です。部分的にしか巡回されていません。「一日一回くらい巡回される」ほど単純ではないみたいですね。しかし、取得できてなかった sitemap_page.xml が反映されていたり、といまいち挙動がよくわかりません。

ここまでを踏まえて、行動方針を決める

ここまでの結果を踏まえると、

定期的にサイトマップページをチェックし、もし検出されていないようなら、手動で改めてサイトマップを(できれば 3 ファイルとも)送信してみる

これくらいの行動がベターなのかなぁと思いました。

少なくとも「18/11/17 から巡回されていない!一月以上も更新されてないじゃないか!」という事態は避けたいところです。巡回されてなければ検索結果にも出ません。検索流入も増えないですから。……まあ実際は、サイトマップだけが検索結果のすべてではないみたいですが、ちゃんと巡回されるに越したことはないはずです(定量的なデータはそのうちレポートします)。

おわりに

以上、はてなブログの sitemap.xml 登録ネタでした。

どうも検索結果が芳しくない、という方はサイトマップ設定をチェックしてみてください。もし巡回されていないようなら、手動で送信することで対処できます。

ではまた。

関連記事

(2019/02/06 更新)続編書きました!