サイトテーマ

サイトテーマ検索の登場

2001年がGoogleの普及とページランク、リンクポピュラリティに沸いた年だとすると2002年はサイトテーマが注目される1年になるかもしれません。

サイトテーマとはその名の通り、ウェブサイトが取り扱うカテゴリやジャンルを意味します。最近注目されている検索エンジン技術がサイトテーマの自動認識とサイトテーマに基づく検索結果の提供です。つまり検索エンジンがデータベースに登録されたウェブサイトをどのようなテーマの内容を取り扱っているかと言うことを自動的に判断し、ユーザーがキーワード検索を行った時にキーワードに関連する内容(テーマ)をより多く扱っているサイトを優先的に表示する、と言う仕組みです。

Googleはすでにサイトテーマ検索技術をある程度導入していると言われており、また米国ではAOLやMSNを初め、Inktomi、AltaVista、FastやLookSmartなどの主要検索エンジンもサイトテーマ検索技術を導入しています。実際、正確には同様の仕組みとは言えませんが、検索エンジンによる自動カテゴリ選別を日本でも逸早くgooが2001年夏に導入しました。最も現段階ではGoogleのページランク程、ユーザーにとって利便性の高い技術としては成熟していませんが、Googleも本格的な導入を検討していると言われており、サイトテーマ検索が今後注目を集めることは間違いありません。

サイトテーマ検索が現在注目されている理由には、リンクポピュラリティを最重要視したGoogleなどのページランク検索が、前述のリンクファームを含め不正に利用され出したケースがあることと、決してページランクによる検索結果が常に100%ユーザーを満足させる内容ではないことが挙げられます。最もユーザーを100%満足させられる検索技術は、当然ユーザーは夫々趣味嗜好もあるわけで当面は開発されないでしょうから、ページランク、サイトテーマに限らず今後様々な新技術が開発されていくことでしょう。

サイトテーマ検索技術

サイトテーマ検索がページランクやその他の検索技術と根本的に違うのは、サイトテーマ検索では、検索エンジンのデータベースに登録されているウェブサイト情報を各ウェブページ単位で考えるのではなく、登録されている無数のウェブページをウェブサイト単位でグループ化し、ウェブサイト全体を1つの単位として考えると言うことです。

これ以上の詳細情報は、現在研究中と言うこともあり徐々に紹介していく予定です。