ブロギングライフ

ブログサイト運営関連、AdSenseについての情報などを発信しています。

Google 検索の仕組みと3つの基本プロセス

Google 検索の仕組みと3つの基本プロセス

Googleがどのようにしてページを発見し、クロールし、検索結果に表示するかについて説明しているヘルプページの内容を元に付記、紹介します。

コンピュータの前に座って、Googleの検索を行うと、ウェッブ上にある全てのコンテンツの中から選ばれた結果のリストが直ちに表示されます。どのようにしてGoogleがあなたのクエリ(検索ワード)に合致したウェッブページを見つけ、検索の順位を決めるのでしょうか?

以下はヘルプページに記載されているGoogleの検索についての説明です。Googleの検索の仕組み、流れをとても上手に表現していると思います。

ウェブ検索は、あらゆる情報の場所を正確に記述した優れた索引を備えた大型書籍を参照するようなものです。ユーザーが Google 検索を実行すると、Google のプログラムが Google のインデックスを確認し、最も関連性の高い検索結果を特定して表示(提供)します。

検索の主要な3つのプロセス

検索の結果が表示される仕組みは、以下の3つの主要なプロセスから構成されています。

  • クロール:Googleがサイトを検知、認識し、サイトのコンテンツの情報を収集する。
  • インデックス:サイト上にあるページと含まれる情報をインデックスする。
  • 提供(検索結果の表示):サイトは良質で役立つコンテンツがあり、ユーザーの検索に合致した結果を提供する。

クロール

クロールはGoogleのボットが新しいページや更新されたページを検知して、Googleのインデックスに加えるプロセスです。

Googleは、巨大なコンピュータシステムを使用して、ウェッブ上の数十億のページをフェッチ(または「クロール」)します。フェッチを行うプログラムは、Google ボット(または、ロボット、ボット、スパイダー)と呼ばれています。Google ボットは、アルゴリズムのプロセス、コンピュータ プログラムでどのサイトをどの程度の頻度でどれだけの数のページをフェッチするかを決定して、動作しています。

Googleのクロールプロセスは、過去のクロールプロセスとウェブマスターが提供したサイトマップデータを加えて生成されたウェッブページのリストから始まります。Google ボットは、それぞれのサイトを訪問して、各ページ上にあるリンクを検知しクロールするためのページのリストに加えます。新しいサイト、既存のサイトの更新情報、デッドリンクの情報を記録し、Google インデックスを更新することに使用されます。

Googleは、収益を生むAdWords のサービスと検索の事業を分離しています。(検索のシステムに利得などを絡ませないようにしています。)
備考:
Google ボットが適切にサイトをクロールすることを手助けるために、XMLサイトマップを作成して、Search Consoleに設定することをお勧め致します。

インデックス

Google ボットは、ページごとにクロールを行って各ページの全ての言葉の位置を認知して巨大なインデックスを取りまとめています。さらに、タイトルタグやアルト属性(alt)などの重要なコンテントのタグや属性を含めた情報を処理しています。Google ボットは、一部のコンテントを除いて、非常に多くのコンテントをプロセスすることができます。例えば、Googleはリッチメディアファイルや動的なページのコンテントは処理することができません。

インデックスのステータスは、Search Consoleで確認することができます。サイトマップで提出したページに対してインデックスされたページ数の表示も確認することができます。サイトマップで提出したページとインデックスされた数に大きな差がないことが好ましいです。大きな差が生じている場合は、原因を調べて対処することをお勧め致します。

Search Consoleのサイトマップのインデックスステータス

関連記事:

検索インデックスされやすい記事とされにくい記事についての考察

検索結果の表示

ユーザーがクエリ(検索ワードの組み合わせ)を入力すると、Googleのマシーン(機械)は合致したページをインデックスから捜し、最もユーザーと関連すると思われる結果を表示します。関連性は、200以上の要素を元に決定されます。ランキングシグナルの一つは、そのページに付与されたページランクです。

備考 / 注意事項:
Googleの検索ランキングのアルゴリズムは極めて高度で複雑です。Googleは、上記の通り200以上のシグナルを使用して検索順位を決定しています。200以上のシグナルの中で最も重要度の高いシグナルは、コンテント、バックリンク、そしてランクブレインであると言われています。これらに加えて、ユーザーエクスペリエンス(UX)も近年、重要度が高まってきています。しかし、上位のシグナルだけで検索のランキングが決められるわけではありません。

ページランクは、他のページからの流入リンクを元にページの重要度を測定したものです。簡単に言うと、他のサイトからサイトへのページのリンクがサイトのページランクとして付与されます。全てのリンクは同じには扱われません。Googleは、ユーザーのエクスペリエンスを向上させるためにスパムリンクを検知したり、検索結果に悪影響をおよぼすような手法を検知しています。最も良好なリンクの種類は、サイトのコンテントの品質に基いて与えられたものです。

備考:

バックリンクは検索ランキングの重要なシグナルの一つで、SEO関連の話題では特に注目されたり、重要視されることが多いです。しかし、バックリンクが全くないページやバックリンクが殆ど無いページでも、検索の上位に表示されることは少なくありません。ブロギングライフのページもほとんどバックリンクはないですが、検索の上位に登場するページもあります。

Twitterで、「バックリンクが1つもないサイトでも検索結果のトップにランキングされることはありますか?」と言う質問に、John Mueller さんは「はい。ほとんどがそうです。」と答えています。

ネット上には非常に多くのページがあります。バックリンクがないページも少なくありません。(バックリンクがある方が少ない)検索ワードは様々なものがあります。検索のトップにバックリンクのないページが表示されることは普通にあるというのは妥当な話だと思います。

サイトが検索結果のページの上位にランキングされるためには、Googleがサイトを適切にクロールしてインデックス出来る状態にしておくことが重要です。ウェブマスターガイドラインには、避けるべき問題やサイトのランキングを改善する手助けとなるベストプラクティスが記載されています。

ウェブマスター向け品質ガイドラインに準拠することはサイト運営において必須といえることです。ウェブマスターガイドラインでサイト運営において特に重要と思われる事柄について、別途記事を投稿しております。是非、ご覧下さい。

Search Consoleの検索アナリティクスのレポートで、検索結果での表示回数と運営するサイトのページへのクリック数、CTR、検索順位など、様々な検索におけるパフォーマンスの指標データを見て、分析することができます。検索アナリティクスのレポートの見方などについても別途、記事を投稿する予定です。

コメントを残す(承認後表示されます)

*
*
* (will not be published.)

Return Top