Google ウェブマスター ツール用 サイトマップ(1)

INFORMATION
SEARCH

サイトマップの作成方法(1) by GSite Crawler



Web上で作成する方法はGoogle ウェブマスター ツール用 サイトマップの作成方法(2)をご覧下さい。

以前は、Google サイトマップ Beta 版(だったと思います)が、Google ウェブマスター ツール として正規版になりました。
本サイトは Beta 版の時からサイトマップを作成して登録していましたが、その頃から使用していたソフト、 GSite Crawler (Nicht registrierte Version) SOFTplus Entwicklungen GmbH の使用方法、すなわち、自分用に作成した説明書がありますので、v1.20 rev.273 / 11/11/2006 を使って再度作りながらGoogle用のサイトマップの作成方法を整理してみました。
Google用のサイトマップサイトの作成方法は、Googleにも説明がありますし、他にもソフトがあります。
いろいろと試してみましたが、 GSite Crawler が使い易かったので、これを使い続けています。
Google ウェブマスター ツールへ自分のホームページを登録するために、サイトマップを作ってみようかなと思われる方は参考にして下さい。
ドイツのソフトですが英語表示なので、日本語以外苦手な、いや、日本語すら苦手な私でも、なんとか解って使っています。(英語版だけでなく、他の言語もありますよ。)
なお、以下の説明は私流の使い方で、説明が不足していたり、間違っているかも知れません。その点はお許しの上、試してみて下さい。(パソコンが壊れることはありませんので、ご心配なく。)

GSite CrawlerによるGoogle用サイトマップの作成方法

画面
画像は拡大可能
操作
01
GSite Crawlerを立ち上げて下さい。
02
一瞬ですが初期画面が表示されます。
03
メインの画面が表示されますので、新たに作成したいサイトマップのプロジェクト(projects)を登録するためにボタンをクリックしてください。
(もし、必要のないプロジェクト(projects)があればボタンで削除することも可能ですが、残しておいても差し支えありません。)
04
ウイザード(Wizard)を使用するか、否かの問合せ画面が表示されますので、ボタンをクリックして下さい。(このボタンは何故か日本語です。)
05
ウイザード(Wizard)初期画面が表示されますのでボタンをクリックして下さい。
06
この画面が表示されますので、Main address of your website欄へ、サイトマップを作成したいURLを入力して下さい。
入力要領は、入力欄の下の方にExamplesとして書かれています。
下側のName for this project欄は、上のURLを入力することにより自動的に表示されます。変更の必要がなければ、そのままでOKです。
ボタンをクリックして次へ進んで下さい。
07
チェック対象のファイル形式を選択しますが、殆どの場合はデフォルト(default)のままでOKです。
但し、私の場合ですが、あるサーバーは2007/01/15現在、260MB使用しており、総ファイル数は約15500。このうち写真が15000ファイルくらいありますので、左の図の印のimagesのチェックを外して、リストから除外しています。(全て含めてサイトマップを作ったのですが、サイトマップのファイルサイズが肥大化し過ぎて、Googleで扱ってもらえないサイズではないかと思って除外することにしました。)
ボタンをクリックして次へ進んで下さい。
08
出来上がったサイトマップのアップロードの予約ではないかと思いますが、チェックを入れて使用したことがないので機能は判りません
私の場合2007/01/15現在、HTMLファイルが4つのサーバーで861あり、追加や変更が激しいため、内部リンク切れを起こしたりして、サイトマップ作成中にエラーが検出される(後述)ことが殆どです。
また、サーバーへのアップロードはFFFTPを常用していますので、ここは何もしないでボタンで次へ進んでいます。
09
この画面は通常の場合は何もすることはありません。この画面で
ウイザード(Wizard)は終わりですからをクリックして、指定したサイトをスキャンさせます。
下の表の 順No.10 へ続きます



画面
画像は拡大可能
操作
10
スキャンが開始されると、ほんの一瞬ですが、図のような画面が現れます。
下の方にボタンがありますが、確認できる時間はなく次へ進みますので、気にせずに放っておきましょう。
11
Crawlers-Watch画面が現れ、これと同時にThe crawler is now runningの小さな画面が現れてカウントダウンを開始します。
これも無視して、スキャンを待ちましょう。
12
スキャン(クロール)中の画面です。
グラフが右端まで伸びるまで待って下さい。
ここからの続きは、スキャン(クロール)中、
スキャン(クロール)完了後の状況により異なります。
内部リンクのエラーの有無により異なりますので、
スキャン(クロール)中、スキャン(クロール)完了後に
Aborted URLs の欄への表示の有無を確認して下さい。

何か表示が有る場合は
順No.21へお進み下さい。
(エラーが有ります)
何も表示が無い場合は
順No.41へお進み下さい。
(エラーは有りません)

画面
画像は拡大可能
操作
21

スキャン(クロール)中に内部リンクのエラーがあると、Aborted URLs欄にエラーに該当するURL(ファイル名を含んでいる)が、発見され次第追加表示されます。
後で詳細を見ることが出来るので、慌てずに処理が終わるまで待って下さい。
22
処理が終わると、図のような画面が開いて、カウントダウンします。
放っておくと、この画面は消えますので、そのまま待って下さい。
23
処理が完了した画面です。
ボタンをクリックして下さい。
24
内部リンクのエラーの詳細が表示されます。
この例では3つエラーが表示されています。
これらのエラーを修正します。
-----------
例えば、

1つ目の場合は、germany-kiguminoie.htmlファイルに書かれた(指定された)内部リンクファイルのkoumuten1.htmlがみつからなかったのです。(本サイトはサーバーが手狭のため何ケ所かのサーバを使用していますが、koumuten1.htmlは別のサーバーにあり、http://isaonaka2.web.infoseek.co.jp/model/koumuten1.htmlと書いて外部リンクにすべきところでしたが、http://isaonaka2.web.infoseek.co.jp/model/を書き忘れていました。・・・お粗末)

2つ目の場合は、gara3sitemap.htmlファイルに書かれた(指定された)内部リンクファイルのsample-hemepage-2.htmlがみつからなかったのです。(これは、この説明書を作る前に、sample-hemepage-2.htmlファイルが要らなくなったのでサーバーから削除しましたためです。gara3sitemap.htmlはホームページビルダーのサイトマップで、これも不要なため削除していたのですが、この説明書を作るにあたり、エラーを発生させようと思って故意に追加していました。)

3つ目はホームページビルダーでの文字列の置換ミス。恥ずかしいので詳細は省略。
-----------
私のサイトはページ数、ファイル数の多さから、ホームページビルダーでツリーのトップから開こうとすると10分待っても開きません。従って、ホームページビルダーによる内部リンク切れのチェックはやっていません。このような場合のチェックにも活用していますよ。
25  
エラーを修正したら、修正済ファイルをサーバーへアップロードして下さい。
26
修正済ファイルのアップロードが終わったら、もう一度スキャン(クロール)の実施です。
画面の右下にある「Update」の使い方が解らないため、ここからは私流、すなわち我流です。(どなたか正統派的な使用方法をお教え下さい。)

順No.03から作成したプロジェクト(projects)を削除するため、ボタンをクリックして下さい。
27
確認画面が表示されますのでボタンをクリックして下さい。
28
続けて確認画面が表示されますのでボタンをクリックして下さい。
29
しつこいようですが、もう一度確認画面が表示されますのでボタンをクリックして下さい。
30
これで、削除したいプロジェクト(projects)は無くなりました。
順No.03に戻って、順No.12まで実施して、エラーの有無を確認して下さい。



画面
画像は拡大可能
操作
41
処理が終わると、図のような画面が開いて、カウントダウンします。
放っておくと、この画面は消えますので、そのまま待って下さい。
42
エラーがなく正常に完了すれば、図のようにAborted URLs欄には何も表示されません。
心配であればボタンを押して確認して下さい。
但し、
この図のように、Aborted URLs欄に「Linked from [GOOGLE]」と書かれた表示が現れることがあります。これは多分、Googleのサイトマップに既に登録済の場合に出ると思います(?)ので私は無視しています。
これで第1段階は終了です。引き続いて第2段階のファイル作りです。
順No.51へ進みましょう。

画面
画像は拡大可能
操作
51
順No.42の画面を閉じて、左の図の画面に移動して下さい。
プロジェクト(projects)が先ほど作成したProject nameになっているか(反転しているか)確認して下さい。なっていなければ、反転させて下さい。
52
メニューのGenerateをプルダウンして、Google Sitemap-Fileを選択してクリックして下さい。
53
Google用のサイトマップサイトの保存場所を選択して下さい。
ファイル名は変更する必要はありません。
54
ボタンをクリックして下さい。
ファイルが作成されたホルダが開きますので、
gss.xsl
sitemap.xml
sitemap.xml.gz
の、3つのファイルが作成されていることを確認して下さい。
55
gss.xsl
sitemap.xml
sitemap.xml.gz
の、3つのファイルが作成されました。
これで、Google ウェブマスター ツールに登録可能なファイルは完成しました。
このファイルの中で、登録時に指定するファイルはsitemap.xmlですが、念のため、3つのファイルは全て、サーバーの最上位(index.htmlかindex.htmのある場所)へアップロードして下さい。
最後に・・・
参考までに、sitemap.xmlのファイルの様子をお目にかけましょう。
encoding="UTF-8"」となっていますが、UTF-8でエンコードすることが大切です。
これでファイルの作成、ファイルのアップロードは完了しましたが、これだけでは終われません。
GoogleのGoogle ウェブマスター ツール
への登録が残っています。
登録の方法については、必要とあれば説明書を作成しますが、なにはともあれ、Google ウェブマスター ツールを覗いてみて挑戦してみて下さい。

【参考】 ホームページビルダーで作成されるサイトマップとは異なります

ホームページを作成、運用されている方で、ホームページビルダーをお使いの方は沢山いらっしゃることと思います。
ホームページビルダーにもサイトマップの作成機能がメニューにありますが、Google ウェブマスター ツール用のサイトマップとは全く内容が異なります。
ホームページビルダーで作成したサイトマップを、Google ウェブマスター ツールへ登録しても、Googleのコンピュータは受け付けませんので、お間違いのないように。
なお、Google ウェブマスター ツールの使用方法(サイトマップの登録方法)については、必要であれば別途作成しますが、一応割愛しますのでご了承願います。

【参考】 テキストエディタでも作成可能です

Google ウェブマスター ツールは上記のような正規のサイトマップファイルでなくても、自分のサイトのトップページ index.html 以下にツリーでぶら下がっている全ての html ファイルのURLを羅列したテキストファイルでも登録が可能です。
いくつかのサイトのお手伝いで、テキストファイルを作成しましたが、URLを羅列するだけ と テキストファイルはUTF-8でエンコードする必要があります。
これなら、ホームページビルダーなどで作成したサイトマップファイルを、テキストエディタで開いて修正すればよいので、簡単に出来ます。
但し、テキストエディタは、EmEditorなど、UTF-8形式での保存が可能なものが必要です。

Sorry. This site is Japanese. --> English(by Google)
 Copyright © GARAKUTA Village(Inakamura). All Rights Reserved.
本ホームページに掲載されている全ての内容は、日本の著作権法及び国際条約で保護されています。
当サイトの写真、コンテンツ等、一切の無断複製、転用、流用を禁止します。
写真・コンテンツ等の利用 / 著作権侵害 / 著作権軽視 / リンク / 個人情報