色々と事情を考えてみる

昨日分のエントリでも書いたように、非常に不可解な現象がGoogle周りで発生しています。
自分は完全に部外者なのですが、発生している現象からできるだけ客観的に「なにがどうなっているか」を考えてみようと思います。

※以下はあくまで現時点の状況からの推測です。

エクサの結論

結論から言いますと、エクサとしては
初音ミクの関連画像が、ブラックリスト入りしている」
説を、そしてそれに至った原因っとしては

クリプトン・フューチャー・メディア、KEI氏以外の何者かが、初音ミク著作権所有者を騙り、著作権違反を口実に画像検索結果から”初音ミク画像”をリジェクトするように要請した」

という説を推して見たいと思います。
端的な例えをすれば「消せ消せ詐欺」の被害に遭ってるという感じでしょうか。

「何が起こっているか」

客観的に現状を大雑把に分析してまとめると以下の状況になっています。

  • 初音ミク」関連のイメージ検索が全滅状態(googleとYahoo Japan)
    • googleと、yahooの検索結果が全滅、MSNは正常
    • googleでは無関係な画像がサムネイル表示される。
    • yahooでは「キーワードが見つからない」と言われる。
    • googleでは、検索ワードを変えても「初音ミク」の画像が出現しない(「はちゅねミク」「Ievan Polkka ネギ」などでも、初音ミク関連の画像が全く出てこない)
    • DTMマガジン11月号」で検索しても、googleではあの「初音ミク表紙」画像が全くでない。
  • 通常のテキスト検索は従来どおり行なえるようだ

早い話、「初音ミク」関連の画像がgoogleやyahooから検索結果として出てこず、MSNは公式画像から二次創作までたくさん出てくる、という状況になっています。

「なぜそのような状況になるか」

大きく考えて「なんらかの事故(偶然)」と「人為的な操作結果」が考えられますが、「事故(偶然)」の可能性は明らかに否定されるでしょう。
googleだけ、yahooだけではなく、googleもyahooも同時に」検索できなくなるような偶然は考えられませんし、「引っかからなさ具合」がとても事故とは思えないほど徹底して、ある意味さすがグーグル、といったレベルです。「少なくとも人為的な操作が行なわれている」事自体は確かだと考えていいでしょう。

(2007/10/19)追記
その「人為的操作」のきっかけが「何らかの事故」という話はありえるかもしれませんね。なんらかの事故(少なくとも無作為の現象)に呼応して、「人為的操作を行っている」という可能性はあるでしょう。ただしそれでも結局は「人為的操作」には変わらないわけですけれども・・・。

「どのような人為的操作が行なわれているか」

建前的には「著作権違反回避を目的とした、画像検索結果からのリジェクト」ではないかと考えます。

所謂陰謀論、「巨大企業からの圧力または買収による検閲」というのも巷にはありますが、「画像検索」のみに人為的操作が行われ「通常検索」は依然それなりにできることから、検閲説は却下できると考えていいでしょう。そもそももgoogleのような金持ち企業が「金」に負けるとは思えません。政治には負けるとしても(google中国のように)。

「政治的圧力」以外に、googleやyahooに「検索結果の人為的操作」を行なわせる手段があるのかと考えたとき、一つ思い浮かぶ可能性があります。。
それは著作権違反」という口実によるクレーム、つまり初音ミク著作権所有者」を名乗り「googleやyahooに対して、検索結果から画像を削除することを要求する」方法です。
検索エンジン提供企業は「著作権」に非常に過敏になっています。特にgoogleやyahooのように「著作権」がらみの訴訟や法的リスクを負っているところは本当に過敏すぎるほど過敏に行動してくると考えられます。


また、関連キーワードや「初音ミク中毒でないと分からないようなキーワード」ですら検索結果から「初音ミク画像」がリジェクトされているということから、少なくともgoogleでは「検索ワード」によるリジェクトではなく初音ミク」「初音 ミク」で検索した結果のリスト(画像データ、URL)を「ブラックリスト」に加えるような対応、つまり

という内容の対応が行われているのではないでしょうか。

はちゅねミク」「ネギミク」「Ievan Polkka」でも初音ミクが引っかからないのは、あらゆるキーワード検索結果から、最終出力前で「”初音ミクブラックリスト」をリジェクトしてるからと考えれば、現状との整合性(どんなキーワードでも初音ミク画像が出現せず、また普通のテキスト検索では問題なく行なえる)が取れます。

「誰が申請したか」

上記仮説では重大な問題として、「では誰が著作権関連クレーム」をつけたのか、というのが大きな問題として残ります。
これも大きく分けて「クリプトン関係者(正規の著作権保有者)」「無関係な第三者著作権所有者を騙る者)」の二通りが考えられますが、クリプトンの代表の方、ユーザー担当の方ともサーチエンジンへの関与を公式に否定しておられますし、そもそも関与して消させる意味がありません。となると、やはり「無関係な第三者初音ミク著作権所有者であると騙った」可能性が高いでしょう。

残った可能性は

というように推測していた結果をまとめると、最終的に残った可能性は冒頭に書いた「消せ消せ詐欺の被害に遭っている」説になります。自分としても相当突飛だと思うのですが、現状をみるとなかなか他に考えられる可能性は自分にはありません。



実はここまでの話は、初音ミク」以外にも明らかに人為的に検索結果操作が行われているという情報を知る前に書いた話です。なので事情の考察がかなりピンポイントなのですが、他の不自然な検索結果操作の話も、基本的な大枠は同じではないかと考えています。

特に、初音ミクだけではなく、多くの検索結果に対して明らかに人為的な操作が行われている形跡があり、さらに人為的な操作が行われている対象も、非常に大きな偏りがあるという現実を説明するには、現在Google広報が説明している内容(技術的な問題、バグ)ではあまりにも無理がありすぎなのは事実かと思います。全部が全部「消せ消せ詐欺」なのかはともかくとして・・・・。

一番の問題「だれが何のために」

ただし、どんな仮説を取るにしても、結局のところ一番重要な問題は
「だれが何のためにやっているか(やらせているか)」
です。どんな事情があるにしても、「ある特定のキーワードによる検索結果を人為的に情報封鎖していると思われても致し方の無い状況」は、サーチエンジンという現代の情報インフラにとって決して看過できない、極めて重要な問題だと思います。

2chのニュース速報+では、「ググれ」の代わりにゲイツに聞けをこれからの合言葉に!といった方向性が見られていました。実際、http://live.com/ による検索結果では、非常に優秀な結果を表示してきますし、少なくとも不自然な検閲は見られません。googleのブランドイメージが失墜しています。

数日の間に、googleやYahooは、それなりの報告と対策をだしてくると思います。その内容如何によっては、サーチエンジンの存在意義、サーチエンジンの勢力地図そのものを塗り替えかねないことになるかもしれません。色々興味深い話になるでしょう。そのときはどんな企業がどんな賞賛・バッシングを受け、どんな風に地図が塗り変わるのでしょうか。ひょっとして私たちは非常に大きな転換点を目の当たりにしているのかも知れません。

関連リンク:
“消えた初音ミク”問題 ヤフーとGoogle「原因を調査中」
http://www.itmedia.co.jp/news/articles/0710/18/news065.html

初音ミク」画像がネットから“消えた”?
http://www.itmedia.co.jp/news/articles/0710/18/news040.html

(2007/10/19) 誤字修正、関連リンク及びトラックバック追加

(2007/10/24) 記事追加
>エンジニアさん
コメント欄に書くには長くなりそうなので、本文でコメントさせていただきます。
エンジニアさんのいう「技術的問題(バグなどの事故)」「Googleの能力の限界(収集周期、探索範囲等)」の可能性を自分も最初に考えてみましたが、考えれば考えるほど「常識では考えられない事態」であることに気づいたわけです。

画像検索における「
nicovideo:keyword:初音ミク">初音ミク」問題の正解となる答え(その後の展開にも対応版):http://www.accessup.org/pj/6_B4C9CDFDBFCDA4B5A4F3/20071018.html

例えば上記はj-castでも紹介されたサイトですが、このサイトの説を単刀直入に言うならgoogleは、2ヶ月以上前の画像収集結果と、最新(3日ぐらい前?)のテキスト収集結果を無理やり関連つけて表示している」と主張しているのと同じなんですが、もしそんなことになってるなら「そんないい加減なもの、そもそも検索エンジン扱いしちゃだめだろ常考という話になると思います。事故でインデックスやキャッシュが飛んだ可能性にしても、「多重化もバックアップもないのか?Googleの生命線はそんなに軽いのか?」ということになります。
もちろんGoogleの中の人だって万能じゃあないのだから、完全にバグや欠陥なしでシステムを作るとかは無理だろうし、1分1秒の厳密な完全同期なんて不可能なのは当然としても、「2ヶ月前の画像収集結果+最新のテキスト検索結果の合成」というのは、Googleにしてはあまりに杜撰すぎる設計と実装だと思います。

自分が「きっかけや目的は不明だが、少なくとも何らかの人為的操作の結果であろう」と推測(憶測というべきでしょうか)したのは、「技術的問題、性能的限界と考えるにはあまりにもお粗末な結果だし、いくらなんでもそこまで致命的な欠陥を持っているとは考えにくい」と考えたからです。

(2007/10/25) 全体的に記述を整理しました。