Googleドライブの画像認識はどの程度優れていますか?

iOS向けGoogleドライブ

Googleが今週I / Oデベロッパーカンファレンスで発表したエキサイティングなことのなかで、注目を集めたのはDrive for iOSです。 「寝る人」という言葉は強すぎるかもしれません。「iOSの場合」を何にでも付ければ、注目されるでしょう。ただし、どの発表も見出しに対して競争するのは困難です Project Glass、ジェリービーンを搭載したネクサス7、そして スカイダイバー。ドライブが2日目の基調講演で非常に多くの方向を向いた原因の1つに(iOSの関連付けは別として)、その画像認識機能がありました。

ドライブは光学式文字認識(OCR)を使用して特定のトリックを実行します。これはGoogleにとって新しいことではありません。2009年には、Googleドキュメントで画像ファイルまたはPDFを取得してドキュメントに変換することができました。また、ページ上の文字を認識する機能を使用して、これらのファイルのいずれかの向きを変更することもできます。これらの機能はドライブに引き継がれましたが、基本的な画像認識も同様でした。まるでSFのように見えるかもしれませんが、ピラミッドの写真をドライブにアップロードすると、そのピラミッドを検索して、Googleがピラミッドについて知っていることに基づいてシステムがそれを識別できます。この機能は新しいように見えるかもしれませんが、GoogleはGoogleゴーグルと(微調整された形式の)画像で検索の両方で画像認識を使用しています。



iOS向けGoogleドライブGoogleがこの機能をドライブのiOSおよびAndroidバージョンに引き継ぐのはそれほどショックではありませんが、5 GBのデータを選別する高度な検索ツールがないプラットフォームでは非常に便利です。コンピューティングの大部分はサーバー側で行われるため、iPadがピラミッドを認識できるようにする必要はなく、インターネットに接続するだけで、Googleが検索機能の一部をファイルに貸すことができます。ドライブに配置しました。



ドライブの画像認識機能の非公式のテストを実施しました。これには、2、3のドキュメントと、ランダムに選択された一般的な画像など、ウェブ上のリソースを使用しました。検索ツールがそれらを識別するのに役立つ可能性のあるデータ(EXIF、ファイル名など)がないことを確認してから、ドライブにアップロードしました。 Googleのデモによると、私はそれぞれの基本的な説明でそれぞれを識別できるはずです。これがどうだったか…

  • 猫画像2枚 – 2つのうち2つが「猫」という用語で正しく識別されている
  • 犬の画像 –「犬」という用語が付いた1つに1つ
  • 4ピラミッド画像 –「ピラミッド」という用語を含む4つのうち4つ。 「ギザ」で4人に1人
  • Samsung Galaxy Tabの画像 –「タブレット」として識別されなかった。 「サムスン」と特定した
  • デルのラップトップのイメージ –「ラップトップ」として識別されなかった。 「デル」と特定した
  • ハードドライブイメージ –「ハードドライブ」として識別されませんでした。 「ドライブ」と「ディスク」として識別しました
  • ハンバーガーイメージ –「ハンバーガー」として識別されるが、「食品」や「夕食」などの曖昧な用語ではない
  • 請求書のJPG –「請求書」として識別され、その上で使用される会社名によって識別される
  • 1099納税フォーム、PDF –「taxes」、「tax form」、「1099」、「1099 misc」で識別
  • 識別できませんでした –冷蔵庫、グラフィックスカード、スマートフォン、および電球の撮影した画像

私の限られたデータセットでは、Googleの画像認識の有効性はまちまちでした。画像内のテキストと非常にうまく機能し、Google画像データベースにある画像と十分に機能し、それから私の個人的な画像と完全につまずきました。データを処理するのに十分な時間(1時間の大部分)をシステムに与えましたが、それを理解することができませんでした。



ドライブ

Googleドライブ:「wtf is that?」

画像認識はGoogleにとって特に新しいものではないかもしれませんが、印象的なのは、会社がそれをモバイルアプリに詰め込み、クラウド内の私の個人データセットに適用して、アプリにクラウドと通信させることができたことです。迅速に。確かに、ほとんどの作業はファイルがアップロードされた直後に行われますが、認識能力とカタログ化は、Googleが期待するものにほかなりません。

OCR機能と私のGoogleアカウントを使用する便利さは別として、iOS向けドライブは基本的に適切なDropboxの競争相手です。これはスムーズなエクスペリエンスであり、iPad 3でのパワフルなパフォーマンスに加えて、オフラインで保存するファイルと保存しないファイルを正確に選択できます。このアプリを使用すると、ファイルを共有した相手を簡単に確認できます。これは、グループの人々に最適です。高度な(ほとんど隠されている)ツールには、連絡先リストのユーザーと共有したり、ファイルの名前を変更したりする機能が含まれています。



OCRは印象的なトリックであることに加えて、ドライブにDropboxよりも顕著な利点をもたらします。このサービスはファイル名で検索でき、リンクをメールで送信する機能などの優れた機能を備えていますが、検索ツールはPDFのテキストに飛び込むこともできません。そして、私たちが知っているように、Googleは 賢くなるだけ 一方、他のサービスは、そのユーザーベース、計算能力、および大規模なナレッジグラフとの競争に苦労しています。

2007es.comのGoogle I / O 2012について詳しく読む

Copyright © 全著作権所有 | 2007es.com