顔認識AI
今回は顔認識AIについてまとめる。
顔認識のタスク
顔認識のタスクは大きく分けて2つある。
論文の中ではごちゃ混ぜになっていることがある。
- 顔認証
顔画像が本人か否かを判断するタスク。
iphoneのセキュリティみたいな。
- 顔同定
顔画像が誰かを判断する。あたりまえだが顔認証よりかは難しい。
画像分類とは違うの??
画像分類の深層学習のモデルは基本的にはCNN層→FC層でsoftmax関数などで確率として出力される。
この時CNN層で行われているのが特徴量抽出でFC層で分類を行なっている。
顔認証ではFC層による分類を行わず、CNN層などで特徴量を抽出して終わり。
理由としては顔認識のタスクでは知らない人の画像(学習で使用しなかった人)を実際に分類しなくては行けないからである。
これが画像分類との違いである。
距離学習
上でも述べたように顔認識ではFC層による分類を行わず、画像の特徴量を抽出する。
分類では特徴量は特徴量空間の超平面によって分類できるように学習されていく。
そのため学習で使用した画像以外に対応できない。
顔認識では距離学習という手法を用いて、同じラベルの画像は近く異なるラベルは遠くになるように学習される。知らない画像が来たときも特徴量のクラスタとの類似度を持って判断できる。
距離学習の手法たち
ディープラーニングがかっこいい
最近よく聞くディープラーニングとAIの関係について
強いAIと弱いAI
まずAIとういうのは強いAIと弱いAIに分けられます。
強いAIというのは人間の知能に迫るようなAIで別名汎用的なAIともいいます。
ドラえもんのようにほぼ人間みたいなロボットのことですね。
逆に弱いAIは特化型AIと言われていて限定的な問題解決にしか使えません。
強いAIはまだ実現できていないので、AIの勉強しようと思ったら弱いAIについて学ぶわけですが、弱いAIにもたくさんの種類があるんですね。
機械学習
弱いAIのなかの種類のひとつで近年大きな成果をあげている機械学習というものがあります。機械学習は教師あり学習、教師なし学習、強化学習の3つに分類できます。
例えば猫の写真をAIに見せて猫であると認識させるためには『この写真は猫だよ』と教えなければいけません。この場合『猫』が教師になります。
教師なし学習の場合、この写真は何かわかんないけどAグループっぽいみたいな分類をすることになります。
強化学習はこれとは別物でゲームなどで使われるもので試行錯誤を通じて自分にとってより良い環境(勝ちに近い)にしていく手法です。将棋でAIがプロに勝ってニュースになったAlphaGOっていうAIは強化学習を使用しています。
ディープラーニング
では近年よく耳にするディープラーニングとは何なのでしょうか。
それも何がかっこいいかって実際の人間の脳を模倣して作っているんです。
人間の脳には約100兆ものニューロン(神経細胞)があるとされています。そしてニューロンをシナプスが繋いでいます。そのシナプスに電気信号が通って演算が行われるわけです。これをコンピュータ上で模倣したニューラルネットワークを使っているのがディープラーニングです。
めちゃかっこいいですよね。実際に脳をコンピュータ上で作ってるみたいで男のロマンです。