サイトやブログのアクセスアップ方法のメモ・雑記

Flash とその他のリッチメディア ファイル


Google は、ほとんどの形式のページやファイルをインデックスに登録できます(詳細なリストはこちらをご覧ください)。

ただし、一般的に検索エンジンはテキストをベースに処理します。そのため、コンテンツがクロールされ、インデックスに登録されるようにするには、テキスト形式で作成する必要があります。(Google では Flash ファイルに含まれるテキスト コンテンツをインデックスに登録できるようになりましたが、他の検索エンジンでは登録されない可能性があります)。


これは、Flash、Silverlight、動画などのリッチメディア コンテンツをサイトに含めることができないということではなく、検索エンジンがアクセスできるよう、これらのファイルのコンテンツをテキスト形式でも提供する必要があるということです。次の例では、テキスト以外の最も一般的な形式のコンテンツを取り上げていますが、他の形式の場合も同様で、テキスト以外のあらゆるファイルについて、同じ内容のテキストを提供する必要があります。

これにより、Googlebot がコンテンツをクロールしてインデックスに登録できるようになるだけでなく、コンテンツのアクセシビリティも高まります。視覚障害がある、スクリーン リーダーを使用する、接続の帯域幅が小さいなどなどの理由で、ウェブページの画像を見ることができないユーザーも多いことから、同じ内容のテキストを提供することで、より多くのユーザーが利用できるようになります。

Flash

Googlebot は、ユーザーがサイト上にある Flash SWF ファイルを操作して表示できるほとんどすべてのテキストをインデックスに登録することができ、そのテキストを Google 検索でのスニペットの生成やクエリとの照合に使用することができます。さらに Googlebot は、SWF ファイル内の URL(サイト内の他のページへのリンクなど)を見つけてそのリンクをたどることができます。

こうしたコンテンツは、サイトの他のコンテンツと同様にクロールされインデックスに登録されるため、特別な対応をする必要はありません。ただし、これは Flash やその他すべてのコンテンツのクロールやインデックス登録を保証するものではありません。

SWF ファイルが他のファイルからコンテンツを読み込む際、テキスト、HTML、XML、別の SWF といった形式に関係なく、Google ではそういった外部コンテンツもインデックスに登録して、親の SWF ファイルやその埋め込み先ドキュメントと関連付けることができます。

Google では、Flash ファイルのインデックス登録の改善に努めていますが、次の制限があります。たとえば、現時点では Flash ファイルに含まれる双方向言語コンテンツ(ヘブライ語やアラビア語など)をインデックスに登録することはできません。

Google では Flash ファイルのコンテンツをインデックスに登録できますが、他の検索エンジンでは登録できない可能性があります。そのため、Flash のようなリッチメディアは主に装飾を目的として使用し、コンテンツやナビゲーションには HTML を使用することをおすすめします。HTML を使用すると、クローラと相性の良いサイトとなり、また、スクリーン リーダーを必要とする視覚障害者、旧式のブラウザや非標準ブラウザを使用するユーザー、携帯電話や携帯端末など接続の帯域幅が小さいユーザーなど、幅広いユーザーがアクセスできるようになります。その他のメリットとしては、ナビゲーションに HTML を使用することで、ユーザーはコンテンツをブックマークに登録したり、ダイレクト リンクをメールで送信したりできます。

sIFR(Scalable Inman Flash Replacement)の利用もご検討ください。ウェブマスターは、オープン ソース プロジェクトの sIFR を使用して、テキスト要素を Flash 要素に置き換えることができます。この技術を使用するとコンテンツやナビゲーションは埋め込み Flash オブジェクトによって表示されますが、コンテンツが HTML ソースに含まれているため、Flash を使用しないユーザーや検索エンジンでも読むことができます。

さらに、Google の AJAX クロール スキーム?を適用すると、Flash やリッチ メディア アプリケーションのインデックス登録の精度を高めることができます。このスキームは JavaScript だけでなく、Flash やその他のブラウザ側の技術でも機能します。

Silverlight とその他のリッチメディア形式

Google では Flash ファイルのテキスト コンテンツをクロールしてインデックスに登録できますが、Silverlight など他のリッチメディア形式のコンテンツへのアクセスにはまだ問題があります。こうしたリッチメディア形式はもともと視覚メディアであるため、Googlebot にとって問題となる場合があります。一部のインターネット スパイダーとは異なり、Googlebot ではリッチメディア ファイルを読み込んでテキストやリンクを抽出できますが、それらの構造や文脈は失われます。また、リッチメディアではコンテンツを画像で表現することが多いため、Google で画像内の単語を検出できず、重要なキーワードを取得できない可能性があります。つまり、コンテンツをクロールしてインデックスに登録できた場合でも、一部のテキスト、コンテンツ、リンクを取得できていない可能性があります。

動画

Googlebot は動画ファイルのコンテンツをクロールできないため、動画の情報を提供することが重要です。動画のインデックス登録を希望する場合は、スクリプトの作成を検討するか、HTML 内で動画に関する詳細な説明を提供してください。動画コンテンツをお持ちの場合は、Google ビデオ、YouTube、その他多くの動画ホスティング プロバイダでホストできます。検索ユーザーは、Google 検索結果ページから直接 Google Video や YouTube の動画を見ることができます。

iFrame

iFrame を使用してウェブページにコンテンツを表示する場合がありますが、iFrame で表示されるコンテンツは、インデックスに登録されず、Google の検索結果に表示されない場合があります。コンテンツの表示には iFrame を使用しないことをおすすめします。iFrame を使用する場合は、表示するコンテンツへのテキスト ベースのリンクを設定して、Googlebot でコンテンツをクロールしてインデックスに登録できるようにします。

ベスト プラクティス

サイトでリッチメディアを使用する場合は、次の推奨事項を参考にしてください。

  • 必要な場所でのみリッチメディアを使用する。コンテンツやナビゲーションには、HTML を使用することをおすすめします。
  • テキスト バージョンのページを提供する。 Silverlight を使用してホームページにスプラッシュ画面を表示し、ウェブサイトのルート URL にあるリッチメディア導入部からサイトの深部にある HTML コンテンツにリンクすることがよくあります。ウェブサイトでこのような手法を使用している場合、テキストをベースとしたページへの通常の HTML リンクをトップ ページに設置し、ユーザーや Googlebot がリッチメディアを使用しないでサイト内を移動できるようにします。

フリーエリア












メンバーのみ編集できます