04 9月 第8話 スマホで「顔」がわかるのはナゼ?
…
アンドウくん!元気出して!!
アンドウくんはアンドロイドだからしかたないんじゃが、気の毒なことをしたのう。。。
顔がわかるのもAIのおかげなの?
否、AIに頼らなくても可能じゃ。
デジカメでもできる機種があるぐらいじゃからの。
デジカメでもできる機種があるぐらいじゃからの。
な~んだ、意外とカンタンなんだね。
今となってはそう言えるが、開発中はさぞかしタイヘンだったろうな。
なにせ膨大なサンプルが必要じゃからのぅ。
なにせ膨大なサンプルが必要じゃからのぅ。
この場合のサンプルは、プログラムや実験に使うデータのことニャ。
「標本」と呼ばれることもあるニャよ。
「標本」と呼ばれることもあるニャよ。
へぇ~そうなんだ。
でも顔ってだいたい同じなのに、たくさんデータがないとダメなの?
でも顔ってだいたい同じなのに、たくさんデータがないとダメなの?
その「だいたい」がやっかいなんじゃ。
コンピュータに「だいたい」と言っても通じないからな。
コンピュータに「だいたい」と言っても通じないからな。
顔認識では、最初に目、鼻、口などのパーツを確認するニャ。
次にそれらの位置から「顔」かどうかを判断しているニャ。
次にそれらの位置から「顔」かどうかを判断しているニャ。
ひとによって目や鼻の大きさは違うし、位置もビミョウに異なるからな。
だから「だいたい」これくらいの大きさ、形、このあたりにあるはず、という範囲を指定しなければならん。
それには多くのデータがあったほうが精度が高まるんじゃよ。
だから「だいたい」これくらいの大きさ、形、このあたりにあるはず、という範囲を指定しなければならん。
それには多くのデータがあったほうが精度が高まるんじゃよ。
スマホのロックの「顔認証」も同じなの?
そうじゃ。
まず顔かどうかを確認し、それから持ち主の画像と比較するんじゃよ。
まず顔かどうかを確認し、それから持ち主の画像と比較するんじゃよ。
カメラって便利だね!
ほかにもわかることってないの?
ほかにもわかることってないの?
歩きかたで誰なのかわかる「歩容」という技術もあるぞ。
遠くのひとでもわかるから、防犯装置としても期待されているんじゃ。
遠くのひとでもわかるから、防犯装置としても期待されているんじゃ。
「ビッグデータ」と言われているように、世の中にはたくさんのデータがあるニャ。
それらをサンプルにして分析すると、いろんなことがわかるニャよ。
それらをサンプルにして分析すると、いろんなことがわかるニャよ。
よーし、それではアンドロイドの顔認識アプリを作るぞっ!
ビッグデータを活用するのじゃ~!!
ビッグデータを活用するのじゃ~!!
アンドロイドの顔って…
アンドウくんしかいないから、ビッグデータ、関係ないよね。。。
アンドウくんしかいないから、ビッグデータ、関係ないよね。。。
質問:スマホで「顔」がわかるのはナゼ?
答え:目や口などを見つけ、それらの位置や大きさから「顔」かどうかを判断しているからです。
子供でも顔の絵が描けるのは、ひとの顔とは「こういうもの」という知識があるからです。誰かに教わったわけでもないのに、怒っているときは眉が吊り上げる、笑いは口角を上げて表現するのも、経験から得た知識といえるでしょう。
しかしコンピュータには同じような知識がないため、「顔」とはどういうものなのかをプログラムしないといけません。そのプログラムで重要なのが、顔の特徴を記録した「データベース」です。
スマホやデジカメの顔認識では、まずデータベースをもとにカメラに写っている目や鼻などのパーツを特定します。つぎにそれらの位置から顔かどうかを判断します。目や鼻をデタラメな位置に配置した「福笑い」などを顔として認識しないのもこのためです。
デジカメやアプリによっては、笑ったときにシャッターが切られる便利な機能もあります。これも予め用意されたデータベースがあってこそ実現できる技術で、データベースには眉や口角などがどのように動いたときが「笑っている」のかが記録されています。コンピュータは本当に笑顔を理解しているわけではなく、カメラに写った画像をデータベースと照合し、条件が一致したらシャッターを切っているに過ぎません。
常識も感情も持たないコンピュータでも「顔」「笑顔」を認識できるのは、比較するための膨大なデータ、位置や大きさから顔かどうかを判断するプログラムがあるからです。