【SEO用】ライブドアブログのsitemap.xmlの中身が怪しいので修正して実際にウェブマスターツールへ登録してみた(修正済)


  • 公開:
  • 更新:
  • 編集:
概要 ▶ 3月6日にリリースされたライブドアブログのsitemap.xml書き出し機能ですが、中身が怪しくGoogleのウェブマスターツールでうまく動作していないようなので、修正するポイントをまとめてみました。
みなさん、ライブドアブログ使っていますか?
私は8年くらい使っています。エッヘン(笑)。


さて先日ライブドアブログにサイトマップ出力機能が付きました。よく「sitemap.xml」などでCMSから出力してGoogleのウェブマスターツールに登録するアレです。

いままでは外部のサービスでsitemap.xmlを作成していました。そのサービスはページをクローリング(巡回)して1000件分までのsitemap.xmlを作成してくれるサービスですが、1000件以上ブログ記事を書いている当ブログだと機能不足で困っていました。


そんなところで、公式のsitemap.xmlの機能が搭載と言うことで大変嬉しく思いました。
20130309-ライブドアブログ-sitemap-xmlを修正-01
出典:sitemap.xml 自動生成機能をリリースしました|Blogger Alliance お知らせブログ


ですが、このsitemap.xml、間違っているのでうまくGoogleのウェブマスターツールで登録されないようです。

これではSEOには適しておらず、検索エンジンからの流入が増加しないのでは…と思ったので修正してみました。


※2013年3月12日現在修正されているようです。(なんか検証用のスキーマー付きっぱなしですけど…)

サイトマップについて

まず、サイトマップとサイトマップインデックスというものがあることを覚えておいてください。


サイトマップはサイトのページのリストを記載したものです。
サイトマップの構造は以下の様になっています。
<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
    <url>
        <loc>http://www.example.com/page-1.html</loc>
    </url>
    <url>
nbsp;       <loc>http://www.example.com/page-2.html</loc>
    </url>
</urlset>

サイトマップインデックスはサイトマップのリストを記載したもので大量のページや複数のサイトを管理・運営している場合に便利な機能です。

サイトマップインデックスの構造は以下の様になっています。
<?xml version="1.0" encoding="UTF-8"?>
<sitemapindex xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
<sitemap>
    <loc>http://www.example.com/sitemap-1.xml</loc>
</sitemap>
<sitemap>
    <loc>http://www.example.com/sitemap-2.xml</loc>
</sitemap>
</sitemapindex>


ライブドアブログのsitemap.xmlの修正のポイント

今回、ライブドアブログのsitemap.xmlは中身の実態はサイトマップインデックスですが、記述がサイトマップの記述の仕方をしています
20130309-ライブドアブログ-sitemap-xmlを修正-02
出典:http://dtp.jdash.info/sitemap.xml


なのでこのままGoogleのウェブマスターツールへ登録してもインデックス(検索エンジンに登録)されたページが表示されません。
20130309-ライブドアブログ-sitemap-xmlを修正-03


普通は以下の様に何ページがインデックスされたかが表示されます。
(以下の画像はウェブマスターツールへサイトマップとしてRSSを登録した様子です)
20130309-ライブドアブログ-sitemap-xmlを修正-04


このような現象を修正するため、sitemap.xmlの中身をサイトマップインデックスの記述へと変更します。


sitemap.xmlをダウンロードしてテキストエディタで開きます。

あとは「置換」機能で以下の置換を行います。
20130309-ライブドアブログ-sitemap-xmlを修正-05
  • <urlset<sitemapindex
  • </urlset></sitemapindex>
  • <url><sitemap>
  • </url></stitemap>

置換が終わったら「sitemap-fix.xml」などファイル名を変更して保存し、FTPでライブドアブログにアップします。ファイル名を変更するのはsitemap.xmlだと本家の書き出し機能で無効になってしまうからです。(FTPは有料版じゃないとできないですね…)


あとはそのsitemap-fix.xmlをGoogleのウェブマスターツールへサイトマップとして登録すれば完了です。

以下の画像はウェブマスターツールの画面ですが、修正したsitemap-fix.xmlはキチンとサイトマップインデックスファイルとして認識されています。
Googleへインデックスされ始めると、sitemap-fix.xmlの「インデックスに登録済み」という値が増えていきます。意外と早くインデックスされますよ。
20130309-ライブドアブログ-sitemap-xmlを修正-06


お疲れ様でした。これで検索エンジン対策もひとつ終わりました。
ライブドアブログのsitemap.xmlの記述間違いですが、早く改善すると良いですね。


それでは、よいライブドアブログライフを。


参考


カテゴリー:

このページをぜひシェアしてください