« ジャンプスクエア | メイン | お役所仕事 »

SEO概論 ビギナーズ vol.02

seo0001.jpg

vol.02は各検索エンジンの仕組みについて簡単に説明します。

seo0002.jpg

YSTの仕組み(概略)】
日本において一番使用されている検索エンジン” YST ”。この仕組みについて説明します。
YSTでは以下の3つの作業を行っています。

1. クローリング
YSTでは世界中のウェブページをYSTのシステムに取り込む”クローリング(crawling)”という機能があります。まずこのクローリングでデータの収集を行います。
しかし、ウェブページの数は膨大なうえ,更新の頻度や情報の質などがまちまちなので限られた時間で質の良い検索ができるようにするための工夫をしています。
クローリングを繰り返すうちに頻繁に更新されることがわかったページは短いサイクルでチェックし,ほとんど更新のないページはチェックの頻度を落とす。
更新の頻度が高いだけではなく、重要性が高いと考えられるウェブサイト,そういった重要なサイトからのリンクが多いサイト、検索結果として表示したときにユーザーがよくアクセスしてくれるサイトなどからクローリングの際の優先度を高くします。

2. 分析・インデックス化
次に分析とインデックス分類を行います。
クローリングによって集めるのはWebサイトに公開されているままの情報なので,それを検索しやすいように、クローリングをして集めたデータを、分析してインデックス(索引)を付けて分類します。
一番わかりやすい例は、そのウェブページに使われている言語のインデックスすること。
日本のユーザーは通常は日本語の情報を求めていますので、使用言語を調べてインデックスを付けておけば,ほかの言語のページを検索する必要がなくなり,検索の効率も向上します。

3. リンク構造の分析
そして、3つめにウェブページ間のリンク構造を分析する作業をしています。分析結果はクローリングの処理にフィードバックされて、外部からのリンクが多いウェブページなどの優先度を上げる仕組みになっています。

 このようにYSTではクローリングしたデータを分析してインデックスを付け,リンク構造をフィードバックするというサイクルを絶えず繰り返すことで検索エンジンのコンテンツが作られていきます。そして,インデックスを付けたデータが検索サービスに提供されることにっています。
さらに、リクエストを解析して、キーワードに重みを付けるなどの細かな調整もしています。実際にユーザーが送ってきた検索リクエストと検索結果がどれくらいユーザーの意図に適合していたかを評価する作業を何度も繰り返しています。これは何らかのアルゴリズムで定式化できるようなものではないので,スタッフの手作業でやっているようです。
こうしてこの評価に基づいて、より適切な結果が表示されるように調整を加えています。

このようにYahoo Japanの検索システムは、このロボット検索だけではなく、人為的に作成板カテゴリー(ディレクトリ)に沿って検索するディレクトリ型検索とあわせたハイブリッド型検索といえるでしょう。そしてYSTはページ内要因をページ外要因よりも重要視していることがみてとれます。

Googleの仕組み(概略)】
世界でみると、一番シェアの高い、また日本ではシェア2位の検索エンジンです。
Gooleではロボット型検索エンジンを採用しています。
大枠で見た時基本的には上述のYSTのロボット検索とだいたい同じなのですが、ポイントを説明します。
ページランク
GoogleではYSTと違い、PagRankを非常に評価するという点があります。
簡単に説明するとより多くの質の高いウェブページからリンクされているページは、質の高いページであるという考え方をもってPageRankの算出がされているということです。
ページの被リンク数と被リンクしているページのPageRankで、そのサイトを評価するという方法です。

このPageRankは、パソコンにGoogleツールバーをインストールすることによって、簡単に見ることが出来ますので導入されていない場合は是非ツールバーをインストールして下さい。
PagRankは最大10ですが、8、9といった高い数値はYahooやgooといったかなり有力なサイトについています。6くらいでsonyやTOYOTA、BMW(International)などといった大手企業などですので、個人サイトなどはせいぜい1、2といったところですので3、4あたりを目標にSEOを実践していくことになると思います。(例えば、個人日記で有名な「きっこの日記」は4。しょこたんブログは5。)
このPageRankをあげることでgoogleの検索でヒットしやすくなります。

このPageRankについてGoogle自身では以下の通りの記述があります。(http://www.google.co.jp/intl/ja/why_use.html

「PageRankTM は、Webの膨大なリンク構造を用いて、その特性を生かします。
ページAからページBへのリンクをページAによるページBへの支持投票とみなし、Googleはこの投票数によりそのページの重要性を判断します。
しかしGoogleは単に票数、つまりリンク数を見るだけではなく、票を投じたページについても分析します。
「重要度」 の高いページによって投じられた票はより高く評価されて、それを受け取ったページ を「重要なもの」にしていくのです。
こうした分析によって高評価を得た重要なページには高いPageRank(ページ順位)が与えられ、検索結果内の順位も高くなります。PageRankは Googleにおけるページの重要度を示す総合的な指標であり、各検索に影響されるものではありません。むしろ、PageRankは複雑なアルゴリズムにしたがったリンク構造の分析にもとづく、各ウェブページそのものの特性です。
もちろん、重要度が高いページでも検索語句に関連がなければ意味がありません。 そのためにGoogleは洗練されたテキストマッチ技術を使って、検索に対し重要でなおかつ、的確なページを探し出します。」

簡単な例で説明すると、PageRankの高いYahoo、gooといったサイトの被リンクは高く評価する。やたらにリンクの貼ってあるブックマーク的なあまり意味のないサイトの被リンクは価値が低いものと見なしまったくリンクがないよりはいいけれども軽視する、といった判断をPageRankがしていることになります。
本気でこのPageRankのアルゴリズムを突き詰めようとすると確率や統計解析の分野までどうやら見て行かなければ行けないということで今回はここまでで説明をおわりにします。
突き詰めたい方はまずは" Google の秘密 PageRank 徹底解説 "を閲覧するといいかと思います。

そしてリンクに対する評価を重視するGoogleはページ内要因を重要視するYSTと違いページ外要因に重きを置いていると考えられます。

最後に補足事項があります。ここまでPageRankの説明をしておいてなんだよ!といわれてしまうかもしれませんが、現在ではこのPageRankがどこまでGooleとして重要視しているかは正直わかりかねます。僕もSEOについてはおそらくこれを閲覧されている方と同じくらい初心者ですので(言い訳デス、すいません)今もって研究しているところです。また、他のサイトで調べても様々な意見があります。それでも上述のリンクの通り(http://www.google.co.jp/intl/ja/why_use.html)Googleサイト内に説明がまだありますので、僕としては気にすべきと考えています。

MSN Searchの仕組み(概略)】
MSNにて採用されている検索エンジンが" MSN Search "です。
近年目覚ましい進化を遂げています。
これもロボット型検索となります。YSTよりGoogleに近いといわれています。

以上3つが基本となる3大検索エンジンです。

○検索エンジンのアルゴリズム
検索エンジンのアルゴリズムは上述したように、日々開発が進められ変化しています。例えば少し前までは重要度が高いといわれていたHTMLタグが、ほんの数ヶ月後には重用しされなくなったりとめまぐるしく変わります。

次回はSEOにおいて重要項目のひとつである【リンク】についてです。

トラックバック

このエントリーのトラックバックURL:
http://www.spiral-records.com/mt/mt-tb.cgi/928

コメントを投稿

(いままで、ここでコメントしたことがないときは、コメントを表示する前にこのブログのオーナーの承認が必要になることがあります。承認されるまではコメントは表示されません。そのときはしばらく待ってください。)