ツイッターのクエリ数が1日10億件を突破

今年の2月頃にツイッターのつぶやき数が月10億件を超えたというニュースが少し話題になりました。今回は、なんとツイッターにおける1日のクエリ数が10億件を超えたというニュースです。それに合わせて新しい検索技術も導入したそうです。 — SEO Japan

ツイッターが昔のマクドナルドと同じ戦略を用いていたなら、今日、屋外の掲示板には「10億クエリを突破」と言うメッセージが描かれていたはずだ。さらに、ユーザーとマシンにクエリを提供していくため、ツイッターは新たな独自の検索テクノロジーを利用していくことが発表された。

このニュースはツイッターのエンジニアリング部門のブログで本日発表された。まずはテクノロジーの変更に焦点を絞り、次に楽しいスタッツについて取り上げよう。

新しい検索エンジンの中身

現在、ツイッターは新しい検索エンジンを利用している。しかし、実際には過去数週間にわたって利用されてきたようだ。しかし、既に公開されているこの検索エンジンの“ルック & フィール”自体は得に新しいわけではない。新しいのはあくまでもその“中身”である。

ユーザーが検索を行う実際の“エンジン”、つまりクエリを手に入れ、無数に存在するツイートの中から探し、そして、- 大抵の場合1秒以内で – 答えを返してくるソフトウェアに変更が加えられたのだ。

ツイッターによると、新しいテクノロジーは今後数年間にわたって用いられ、ツイートを介して現在流れるデータの50倍の量を処理するだけの馬力を持っているらしい。テクノロジーに興味がある人は、ツイッターのエントリを参考にしてもらいたい。

最大の変化の一つとして「転置インデックス」への移行が挙げられる。転置インデックスおよび現代の検索エンジンを詳しく知りたいなら、以下のリソースに目を通しておこう:

  • Googleが情報を集め、結果を格付けする仕組み : 元々は司書のためにグーグルが投稿した。“分かりやすい言葉”で説明されている
  • 検索について、ザ・シリーズ: ティム・ブレイ氏は初期の検索エンジンであり、有数の人気を誇った“オープン・テキスト”を共同で設立した人物である。現在、同氏はグーグルに勤めている。このシリーズで、ブレイ氏は検索エンジンを構築する際の基礎を詳しく説明している。

さらに時間を遡ることが可能

ツイッターの検索エンジンの弱点の一つが、時間が経過すると、数日前の検索を行うのが困難になる点である。今年の1月、私は「過去のツイートはどこへ消えた?」を投稿し、正月に投稿したツイートが1月の半ばには見つけることが出来ない件を伝えた。当時、検索に対する過去のツイートを保存するキャパシティがないとツイッターは私に説明していた。

9月半ばには、ツイッター検索では、4日前のツイートを検索することが出来ない状態になっていた。本日投稿されたエントリでは、ツイッターは新しいシステムは、「2倍の長さ」の検索を行うことが出来るようになったと主張しているが、これが期間のことを言っているのかどうかは分からない。それでも、1週間前までは遡って検索することが出来るようになっている。

1週間以上前のツイートを探すなら、別を当たれ

1週間以上前のツイートを検索したいだろうか?残念ながら、ツイッター検索はその願いを叶えてくれるわけではなく、また、ツイッター自身がこの期間を大幅に延長するつもりはない。ツイッターは6月(そして確認のため8月にも)私にグーグルやトプシーのような企業がアーカイブの検索に焦点を絞っているため、ツイッターは他の方法でサイトの検索を改善する点に狙いを定めていると言っていた。

この件に関しては、8月に投稿した「Topsy: 2008年5月のツイートを検索」のなかで詳しく説明している。このエントリには、ツイッター、トプシー、そして、グーグルがどこまで過去に遡るのかを表すチャートを掲載し、そして、「昔」のツイートを探す際のアドバイスを紹介している。一週間以上前のツイートはツイッターの感覚では昔と言わざるを得ないのではないだろうか。

新しいツイッター検索のルック & フィール

ツイッターが、アーカイブ検索以外で、検索エクスペリエンスを改善する約束の下、既に実現していることがある。それは、9月半ばより展開されている、新しいツイッターのルック & フィールの一部とも言える優れた機能である。

新しいツイッターの検索を見ていないなら、 — または詳しく調査していないなら、「新しいツイッター & 検索、イラストで説明」を読めば新しい機能を理解することが出来るだろう。

私はこの変更点に衝撃を受けた。ツイッターは、専用のツイッター検索のサイト、そして、Twitter.comの検索ボックスの2箇所で検索サービスを提供しているのだ。私はツイッター検索が好きだったが、新しくデザインが変わったツイッター自体で検索を行うようになった。新しい機能により、検索に応じて見つけるツイートに関する前後関係を遥かに容易に得ることが出来るようになったのだ。その結果、最近はほとんどツイッター検索に戻ることはなくなった。

数字に注目!

ツイッターのエントリには最新のスタッツの一部も掲載されている:

  • ツイートが1000本/秒を突破
  • 1万2,000クエリ/秒を突破
  • クエリが10億以上/日に達する(10億3680万/日)

さらに数字を詳しく見ていく:

  • 一ヶ月に310億個のクエリを処理

クエリ 対 検索

ツイッターが「クエリ/日」を挙げた点に注目してもらいたい。恐らく「検索」ではなく「クエリ」と言う言葉を意図的に使っていたのではないかと思う。なぜなら、グーグル、ヤフー!、ビングのような通常の検索エンジンとは異なり、ツイッターは人間の手によるものではない「検索」を多く扱っているからだ。「クエリ」と言う単語を使うことで、この違いを巧みに明確に示しているのだ。

当然ながら、人々はツイッターでツイートを検索している。しかし、多くの“検索”はまたツイッターのクライアントによって発せられる継続クエリでもある。例えば、自動的に誰かのアカウントへの全てのリプライを返すツイッターのツールは、マッチングに対して「検索」を行っている。

私はこの点は認めている。人間またはマシンからのリクエストをクエリとし、検索を人間が生成したクエリに限定する。ツイッターにクエリ全体の検索の数のみを伝えてもらうことが出来るなら、主要な検索エンジンとより正確に比較することが出来るのだ。

ツイッターが処理する自動のクエリを理解してもらうため、今年の前半に投稿したエントリ、「Twitter、1ヵ月に190億回検索を処理 Yahoo & Bingに勝つ(ある意味)」に目を通してもらいたい。この件をもう少し深く掘り下げている。

クエリの増加

人間が発しているにせよ、あるいは機械が発しているにせよ、クエリの数が増加していることに違いはない。以下に幾つかベンチマークを挙げていく:

約半年間で63%も増加したことになる!私の計算が正しければの話だが。計算は難しい(出来れば計算は映画「天才アカデミー」のファンに任せたい。ツイッターのインベスターの一人、クリス・サッカ氏もその一人だ。この情報をトリビアクイズにまとめてもらいたいものだ)。

クエリ 対 Googleの検索

ツイッターが月間190億クエリのデータを今年の前半に初めてリリースした際、私は2009年12月の世界全体の検索クエリに関するcomScoreのデータを手に入れ、このスタッツとその他の検索エンジンとを比較してみた。結果は2位だったが、1位のグーグルとは大きく差をつけられていた。

最近確認した限りでは世界の検索のデータは更新されていない。そのため、2009年のデータと比較せざるを得ない。そのため、その他のサービスの数字は実際にはもう少し高い可能性がある。しかし、いずれにせよ興味深いデータであることに間違いはない。ツイッターは2番目につけ、現在、グーグルの人間による検索の約3分の1の量を処理している:

  • Google: 880億/月
  • Twitter: 310億/月
  • Yahoo!: 94億/月
  • Bing: 41億/月

ただし、グーグル、ヤフー!、そして、ビングのデータは過去のものであり、また、人間が行った検索である点を忘れないでもらいたい。グーグルは、“リクエスト”をツイッターと同様の方法で処理するAPI(マシンやソフトウェアプログラムが自動的に答えを得るための手段)を多く持っている。グーグルがこの点もデータに含めれば、ツイッターは足元にも及ばないだろう。

かと言って、ツイッターの改善と成長を低く評価するつもりはない。ただ単にグーグルが、広告主とパブリッシャーがデータを入手する巨大なエコシステムを抱えているだけの話だ(その典型がアドセンスの広告だ。ページを読み込む際にすべてがリクエスを発しているのだ)。

ツイート 対 Facebookのアップデート

最後に、ツイッターは同サービスが1秒間に1000本のツイートを処理していると主張している(ツイッターではTPSと呼んでいる)。これは1秒間に600本とレポートしていた2月と比べると、67%も増加したことになる。

このようなデータがリリースされると、私たちはフェイスブックのステータスアップデートと必ず比較してしまう。この類のデータを比較する際には数多くの注意点がある。それでは、この件に関して私たちが以前投稿したエントリを参考にしてもらいたい: 数字で見る: Twitter Vs. Facebook Vs. Google Buzz

比較は難しいと警告したばかりだが、一体どのように比較すればよいのだろうか?私には検討もつかない。

以前、フェイスブックのスタッツページには、1秒間のステータスアップデートが700回に達したと記載されていた。このレポートは現在は行われていない。そのため、現時点でフェイスブックのステータスアップデートよりも、ツイートの方が多いかどうかは私には断定出来ない(恐らく少ないのではないだろうか。フェイスブックも大きく成長している)。

フェイスブックからもっと正確なスタッツを得ることが出来るなら、今後この件を更新していきたいと思う。

ところで、一応チェックはしてみたが、万が一タイプミスを見つけたなら、謝罪したい。私は、サーチ・マーケティング・エキスポ・イースト・カンファレンスからの帰りに、寝不足の状態でこのエントリを機内(ユナイテッド航空)でwifi(Gogo Inflightはとても役に立つ)を使って綴っている(ちなみにカンファレンスは大いに盛り上がった)。記事の内容が若干揺れている点もこれで説明がつく。いずれにせよ全て正確なので心配しないでほしい。その自信はある。

写真はw. marshオリジナルの作品をクリエイティブ・コモンズの下利用し、少し編集を加えた(完璧ではないことは十分承知している)。


この記事は、Search Engine Landに掲載された「Twitter Hits 1 Billion Queries Per Day, Announces New Search Tech」を翻訳した内容です。

This article first appeared on Search Engine Land.
c Copyright Third Door Media, Inc. Republished with Permission.

1日10億クエリ、つまり月に310億クエリとは驚異的な数字ですね。記事にもあるようにクエリ数は実際にユーザーが検索する回数とは違い、様々なロボットやアプリによる機械的な検索クエリも含んでいるわけですが。とはいえ、ツイッターの人気と普及を裏付ける数字なのは間違いないでしょう。グーグルが2009年で880億クエリ/月なわけですから、現在の成長率を見ても今後もっとグーグルをこの数字は近づいていくのでしょうね。しかしネットの世界も常に変化・進化していきますね! — SEO Japan
Page Top

投稿ナビゲーション