第8話 スマホで「顔」がわかるのはナゼ?

第8話 スマホで「顔」がわかるのはナゼ?

アンドウくん
アンドウくん

くるみ
アンドウくん!元気げんきして!!

はかせ
アンドウくんはアンドロイドだからしかたないんじゃが、気の毒き どくなことをしたのう。。。

わたる
かおがわかるのもAIのおかげなの?

はかせ
いな、AIにたよらなくても可能かのうじゃ。
デジカメでもできる機種きしゅがあるぐらいじゃからの。

わたる
な~んだ、意外いがいとカンタンなんだね。

はかせ
いまとなってはそうえるが、開発中かいはつちゅうはさぞかしタイヘンだったろうな。
なにせ膨大ぼうだいなサンプルが必要ひつようじゃからのぅ。

ナビ
この場合ばあいのサンプルは、プログラムや実験じっけん使つかうデータのことニャ。
標本ひょうほん」とばれることもあるニャよ。

わたる
へぇ~そうなんだ。
でもかおってだいたいおなじなのに、たくさんデータがないとダメなの?

はかせ
その「だいたい」がやっかいなんじゃ。
コンピュータに「だいたい」とってもつうじないからな。

ナビ
顔認識かおにんしきでは、最初さいしょはなくちなどのパーツを確認かくにんするニャ。
つぎにそれらの位置いちから「かお」かどうかを判断はんだんしているニャ。

はかせ
ひとによってはなおおきさはちがうし、位置いちもビミョウにことなるからな。
だから「だいたい」これくらいのおおきさ、かたち、このあたりにあるはず、という範囲はんい指定していしなければならん。
それにはおおくのデータがあったほうが精度せいどたかまるんじゃよ。

くるみ
スマホのロックの「顔認証かおにんしょう」もおなじなの?

はかせ
そうじゃ。
まずかおかどうかを確認かくにんし、それから持ち主も ぬし画像がぞう比較ひかくするんじゃよ。

わたる
カメラって便利べんりだね!
ほかにもわかることってないの?

はかせ
あるきかたでだれなのかわかる「歩容ほよう」という技術ぎじゅつもあるぞ。
とおくのひとでもわかるから、防犯ぼうはん装置そうちとしても期待きたいされているんじゃ。

ナビ
「ビッグデータ」とわれているように、世の中よ なかにはたくさんのデータがあるニャ。
それらをサンプルにして分析ぶんせきすると、いろんなことがわかるニャよ。

はかせ
よーし、それではアンドロイドの顔認識かおにんしきアプリをつくるぞっ!
ビッグデータを活用かつようするのじゃ~!!

わたる
アンドロイドのかおって…
アンドウくんしかいないから、ビッグデータ、関係かんけいないよね。。。

質問:スマホで「顔」がわかるのはナゼ?

 

答え:目や口などを見つけ、それらの位置や大きさから「顔」かどうかを判断しているからです。

子供でも顔の絵が描けるのは、ひとの顔とは「こういうもの」という知識があるからです。誰かに教わったわけでもないのに、怒っているときは眉が吊り上げる、笑いは口角を上げて表現するのも、経験から得た知識といえるでしょう。

しかしコンピュータには同じような知識がないため、「顔」とはどういうものなのかをプログラムしないといけません。そのプログラムで重要なのが、顔の特徴を記録した「データベース」です。

スマホやデジカメの顔認識では、まずデータベースをもとにカメラに写っている目や鼻などのパーツを特定します。つぎにそれらの位置から顔かどうかを判断します。目や鼻をデタラメな位置に配置した「福笑い」などを顔として認識しないのもこのためです。

デジカメやアプリによっては、笑ったときにシャッターが切られる便利な機能もあります。これも予め用意されたデータベースがあってこそ実現できる技術で、データベースには眉や口角などがどのように動いたときが「笑っている」のかが記録されています。コンピュータは本当に笑顔を理解しているわけではなく、カメラに写った画像をデータベースと照合し、条件が一致したらシャッターを切っているに過ぎません。

常識も感情も持たないコンピュータでも「顔」「笑顔」を認識できるのは、比較するための膨大なデータ、位置や大きさから顔かどうかを判断するプログラムがあるからです。