ひょんなことで「メガ・プラットフォーマー恐るべし」を知る

f:id:itkisyakai:20181216183312j:plain

　Ｗｅｂサイトにログインするとき、「私はロボットではありません」が表示され、その左側にチェックを入れると、「○○のタイルをすべて選択してください」と表示されることがある。グーグルが提供している「ｒｅＣＡＰＴＣＨＡ（リキャプチャ）」と呼ばれる認証システムで、プログラムやボットによる不正アクセスを防ぐねらいがある。

　２００７年にカーネギーメロン大学が研究開発した技術をグーグルが２００９年に買い取り、５年後に実用化された。当初は「私はロボットではありません」のチェックと歪んだ文字画像のテキスト入力だったのが、２０１７年に写真を選択させる仕組みに進化した。一部しか写っていない写真から自動車や家、道路標識、犬、猫、花、お菓子…をランダムに識別できるなら、操作しているのはかなり高い確率で人であるに違いない。

　Ｗｅｂサイトへのログインで多用されるのはメールアドレス、ＩＤ、パスワードだ。ところがアルフェベットと数字の組み合わせなので、コンピュータに一定のルールを与えれば、成りすましやＤｏＳ／ＤＤｏＳアタックが容易になる。イメージを識別できるかどうかでアクセスしてきたのが人かシステムかを確かめるのは、「なるほど」ではある。

毎日２億回のディープラーニング

　リキャプチャが示す歪んだ文字や写真は何が元になっているのかというと、グーグルが収集したイメージでもなければシステムが生成しているのでもない。実は新聞記事や書籍の一部だという。ニューヨーク・タイムズの記事であったり、グーグル・プレイ・ブックスに追加される書籍だったりする。

　つまりリキャプチャに示されるのはＯＣＲで認識できなかった文字や画像で、認証プロセスを通じて、Cｈｒｏｍｅ経由でＷｅｂサイトにアクセスしてくるユーザーに教えてもらっているというわけだ。ネットユーザーは知らないうちに、記事アーカイブや電子書籍の作成に参加していることになる。

　だけでなく、実はネットユーザーはグーグルのディープラーニングに協力している（させられている）のだ。何せ全世界で毎日、リキャプチャが約２億件以上表示されているのだから、ＡＩが育たないはずがない。

　１日で３兆４千億円を売り上げたアリババの11月11日（光棍節＝独身の日）のアクセス総数は８億２千万件だったという。同様にグーグルはＯＳ、ブラウザ、メールなどを無償で提供し、毎日数十億件の利用を確保している。

　ＧＡＦＡ（グーグル、アマゾン、フェースブック、アップル）＋Ｍ（マイクロソフト）はもちろん、百度（バイドゥ）、阿里雲（アリババ）、騰訊雲（テンセント）、金山雲（キングソフト）、華為（ＨＵＡWＥＩ）といったメガ・プラットフォーマーは、世界トップ１０に入るコンピュータメーカであり、コンピュータ・ユーザーでもある。彼らと真正面から戦うより、どのように上手く付き合いつつ、どのタイミングでゲリラ的な反撃に出るかを考えるのが、無勢に立つ者の智慧というものだ。