Webサイトにログインするとき、「私はロボットではありません」が表示され、その左側にチェックを入れると、「○○のタイルをすべて選択してください」と表示されることがある。グーグルが提供している「reCAPTCHA(リキャプチャ)」と呼ばれる認証システムで、プログラムやボットによる不正アクセスを防ぐねらいがある。
2007年にカーネギーメロン大学が研究開発した技術をグーグルが2009年に買い取り、5年後に実用化された。当初は「私はロボットではありません」のチェックと歪んだ文字画像のテキスト入力だったのが、2017年に写真を選択させる仕組みに進化した。一部しか写っていない写真から自動車や家、道路標識、犬、猫、花、お菓子…をランダムに識別できるなら、操作しているのはかなり高い確率で人であるに違いない。
Webサイトへのログインで多用されるのはメールアドレス、ID、パスワードだ。ところがアルフェベットと数字の組み合わせなので、コンピュータに一定のルールを与えれば、成りすましやDoS/DDoSアタックが容易になる。イメージを識別できるかどうかでアクセスしてきたのが人かシステムかを確かめるのは、「なるほど」ではある。
毎日2億回のディープラーニング
リキャプチャが示す歪んだ文字や写真は何が元になっているのかというと、グーグルが収集したイメージでもなければシステムが生成しているのでもない。実は新聞記事や書籍の一部だという。ニューヨーク・タイムズの記事であったり、グーグル・プレイ・ブックスに追加される書籍だったりする。
つまりリキャプチャに示されるのはOCRで認識できなかった文字や画像で、認証プロセスを通じて、Chrome経由でWebサイトにアクセスしてくるユーザーに教えてもらっているというわけだ。ネットユーザーは知らないうちに、記事アーカイブや電子書籍の作成に参加していることになる。
だけでなく、実はネットユーザーはグーグルのディープラーニングに協力している(させられている)のだ。何せ全世界で毎日、リキャプチャが約2億件以上表示されているのだから、AIが育たないはずがない。
1日で3兆4千億円を売り上げたアリババの11月11日(光棍節=独身の日)のアクセス総数は8億2千万件だったという。同様にグーグルはOS、ブラウザ、メールなどを無償で提供し、毎日数十億件の利用を確保している。
GAFA(グーグル、アマゾン、フェースブック、アップル)+M(マイクロソフト)はもちろん、百度(バイドゥ)、阿里雲(アリババ)、騰訊雲(テンセント)、金山雲(キングソフト)、華為(HUAWEI)といったメガ・プラットフォーマーは、世界トップ10に入るコンピュータメーカであり、コンピュータ・ユーザーでもある。彼らと真正面から戦うより、どのように上手く付き合いつつ、どのタイミングでゲリラ的な反撃に出るかを考えるのが、無勢に立つ者の智慧というものだ。