概要 ▶ 3月6日にリリースされたライブドアブログのsitemap.xml書き出し機能ですが、中身が怪しくGoogleのウェブマスターツールでうまく動作していないようなので、修正するポイントをまとめてみました。
本ページはプロモーションが含まれている場合があります
本ページはプロモーションが含まれている場合があります
私は8年くらい使っています。エッヘン(笑)。
さて先日ライブドアブログにサイトマップ出力機能が付きました。よく「sitemap.xml」などでCMSから出力してGoogleのウェブマスターツールに登録するアレです。
いままでは外部のサービスでsitemap.xmlを作成していました。そのサービスはページをクローリング(巡回)して1000件分までのsitemap.xmlを作成してくれるサービスですが、1000件以上ブログ記事を書いている当ブログだと機能不足で困っていました。
そんなところで、公式のsitemap.xmlの機能が搭載と言うことで大変嬉しく思いました。
出典:sitemap.xml 自動生成機能をリリースしました|Blogger Alliance お知らせブログ
ですが、このsitemap.xml、間違っているのでうまくGoogleのウェブマスターツールで登録されないようです。
これではSEOには適しておらず、検索エンジンからの流入が増加しないのでは…と思ったので修正してみました。
※2013年3月12日現在修正されているようです。(なんか検証用のスキーマー付きっぱなしですけど…)
サイトマップについて
まず、サイトマップとサイトマップインデックスというものがあることを覚えておいてください。サイトマップはサイトのページのリストを記載したものです。
サイトマップの構造は以下の様になっています。
<?xml version="1.0" encoding="UTF-8"?> <urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"> <url> <loc>http://www.example.com/page-1.html</loc> </url> <url> nbsp; <loc>http://www.example.com/page-2.html</loc> </url> </urlset>
サイトマップインデックスはサイトマップのリストを記載したもので大量のページや複数のサイトを管理・運営している場合に便利な機能です。
サイトマップインデックスの構造は以下の様になっています。
<?xml version="1.0" encoding="UTF-8"?> <sitemapindex xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"> <sitemap> <loc>http://www.example.com/sitemap-1.xml</loc> </sitemap> <sitemap> <loc>http://www.example.com/sitemap-2.xml</loc> </sitemap> </sitemapindex>
ライブドアブログのsitemap.xmlの修正のポイント
今回、ライブドアブログのsitemap.xmlは中身の実態はサイトマップインデックスですが、記述がサイトマップの記述の仕方をしています。出典:http://dtp.jdash.info/sitemap.xml
なのでこのままGoogleのウェブマスターツールへ登録してもインデックス(検索エンジンに登録)されたページが表示されません。
普通は以下の様に何ページがインデックスされたかが表示されます。
(以下の画像はウェブマスターツールへサイトマップとしてRSSを登録した様子です)
このような現象を修正するため、sitemap.xmlの中身をサイトマップインデックスの記述へと変更します。
sitemap.xmlをダウンロードしてテキストエディタで開きます。
あとは「置換」機能で以下の置換を行います。
- <urlset → <sitemapindex
- </urlset> → </sitemapindex>
- <url> → <sitemap>
- </url> → </stitemap>
置換が終わったら「sitemap-fix.xml」などファイル名を変更して保存し、FTPでライブドアブログにアップします。ファイル名を変更するのはsitemap.xmlだと本家の書き出し機能で無効になってしまうからです。(FTPは有料版じゃないとできないですね…)
あとはそのsitemap-fix.xmlをGoogleのウェブマスターツールへサイトマップとして登録すれば完了です。
以下の画像はウェブマスターツールの画面ですが、修正したsitemap-fix.xmlはキチンとサイトマップインデックスファイルとして認識されています。
Googleへインデックスされ始めると、sitemap-fix.xmlの「インデックスに登録済み」という値が増えていきます。意外と早くインデックスされますよ。
お疲れ様でした。これで検索エンジン対策もひとつ終わりました。
ライブドアブログのsitemap.xmlの記述間違いですが、早く改善すると良いですね。
それでは、よいライブドアブログライフを。