カナダの高校生が作った、視覚障がい者用対象認識アプリiDentifi

視覚に制限がある、あるいは全く見ることのできない人が操作可能なように、慎重にデザインされている。
Open Image Modal

盲目あるいは弱視の人にとって、日々のタスクは辛いものだろう — 例えば、棚の中から目的の缶詰を見つけたり、テーブルの上から必要な本を拾い上げたりするといったことだ。もちろんスマートフォンはこの種の問題の解決を手助けをすることができる。もしそれが対象を識別して対象が何かを教えてくれるならだが — それこそがこのトロントの高校3年生が作ったアプリがしてくれることなのだ。

iOS用の新しい無償アプリiDentifiは、ユーザーがカメラを対象に向けると、その対象についての説明をすぐに聞くことができる。例えば:「赤いヘッドフォン」とか「木のテーブルの上にあるDarigoldミルクの瓶」といった具合だ。これはカメラが見ているものを説明できる唯一のアプリではないが、視覚障がい者を対象にしていること、ならびに最初から多言語に対応しているという利点を有している。Anmol Tukrelがこのアプリに取組始めたのは1年前、機械学習とコンピュータビジョンの可能性について学習した直後からだ。

最初彼は独自のニューラルネットワークを作り始めたが、ほどなく十分な速度と正確性を兼ね備えた一般利用可能なAPIの存在に気が付いた。これによって、ゼロから作成を始めなくてもアプリの他の部分に注力できた。iDentifiはGoogle Vision、Cloudsight、そしてGoogle Translateを利用している。ここではAI部品は信頼できるリソースだ。それらはまた、多種多様なオブジェクトや表現を使って訓練されているので、簡単に答に窮することもない。

アプリの残りの部分は、視覚に制限がある、あるいは全く見ることのできない人が操作可能なように、慎重にデザインされている:タップするとヒントを喋る明るくて大きなメインメニュー領域、使い慣れたカメラインターフェイス、対象認識モードの変更(基本的には、速さまたは正確性)と読み上げ速度の速さの調整オプション。

「視覚障がい者コミュニティからのフィードバックは、圧倒的に好意的なものでした」とTukrelはTechCrunchへの電子メールに書いている。「日々のタスク、読み物、ウェブのブラウズなどに便利に使って貰えています。例えば、食料品の買い物に行って、手に取ったものがコークなのかペプシなのかを知りたいとき、いつもならそれを訊ねるひとを探さなければなりません。しかしiDentifiを使えば、ただ写真を撮影するだけで、音声による説明を数秒のうちに得ることができるのです」。

アプリはテキストを読むこともできる、そのため近付いてよく調べたり、近くの人に助けを求めたりしなければならなかった、標識、メニュー、本のページ、雑誌の表紙、その他のものを容易に識別できるのだ。点字は偉大な標準だが、常に提供はされておらず、見つけることも容易ではない。

Open Image Modal

iDentifiはカナダのテレビやラジオで紹介され、かの地の多くの大学から賞賛を集めている。Tukrelはまた、視覚障がい者を代表するいくつかの組織と協力してきた。どの組織も彼に喜んで協力してくれたそうだ。

アプリは今日出たばかりだが、Tukrelはその開発を続ける計画だ。

「このアプリのための短期的な目標は、Androidへの移植です」と彼は書いている。しかし、その先に追加したい沢山の機能も挙げている:

・96言語をサポート

・対象が完全にビュー内に含まれるときに、自動的にフォーカスしキャプチャ

・ビデオモードでの対象認識

・市街地でのナビゲートを行うパノラマモード — 住所や交差点の読み上げなど

・歩行者用信号機を読み取り、横断しても安全か否かを歩行者に伝える

「最後に」と彼は書いた、「できるだけ多くの人を支援するために、私はこのアプリを完全に無料で提供し続けられることを願っています」。

私たちもそう願う。まずはApp StoreでiDentifiをチェックしてみよう、Androidバージョンが利用可能になったときにはお知らせする。

(翻訳:Sako)

(2016年11月18日TechCrunch日本版「カナダの高校生が作った、視覚障がい者用対象認識アプリiDentifi」より転載)

【関連記事】