【顔認証・顔認識AI】顔画像データセットの入手方法と注意点について解説!
近年では、AIやテクノロジーの急激な発達により、IT企業のみならず様々な業界でAI技術が活用されています。その中で実際に導入が進んでいるのが、顔画像を検出して顔認識・顔認証を行うAIの技術です。
顔認証・顔認識AIは、社内DXのためにセキュリティや出退勤管理や広告効果の測定などに留まらず、顔の表情から感情を読み取り数値化するAIなど、様々な場面で利用されています。このように幅広い利用用途があるため、今後もさらに需要が高まっていくことが予想されますが、一方で、この技術についてはデータの取り扱いやAIの利用方法について注意が必要となります。
今回は顔認証AIの活用方法や活用における懸念点、AI開発にとって重要な顔画像データセットの収集方法や注意点について詳しく解説します。
目次
顔認証AIの現在
幅広く使われている顔認証AI
顔認証と聞くと、多くの人が最初に想像するのはスマートフォンで使用されているロック解除機能でしょう。それだけ顔認証技術はとても身近な技術になっています。
顔認証・顔認識AIを利用したシステムを活用することで、カメラ画像や映像で読み取った人の顔・表情から「年齢」「性別」「感情」「人種」など様々な情報を得ることができます。その結果、人の顔の特徴をAIが理解し、カメラに映った人の顔画像をデータベースと照合することで、個人を特定することが可能です。
その技術はさきほど挙げた、スマートフォンでのロック解除だけでなく、以下のようなサービスに使われています。
・企業などでの入退出・出退勤管理や受付業務の自動化(社員証などのICカードレス化、人事管理と紐づけることによる人事業務の削減に貢献)
・顔情報とクレジットカードや決済システムと連携させることで、顔認証だけで決済ができるサービス
・顔から読み取れる情報を用いて、該当する属性に合わせて商品をおすすめするサービス
・感情やストレスチェックを行い医療と連携するサービス
などにも使われています。
コロナ禍を乗り越えてさらなる発展を遂げた顔認証AI
上記のような顔認証技術は、非接触やモノの共用・共有、常時マスク着用を求められたコロナ禍でも注目され、さらなる成長を遂げました。
当初メガネやマスク、帽子着用時の顔認証ができなかったApple製品は、世界的な流行開始の2年後の2022年3月にiOS15.4をリリースし、上記着用時の認証ができるようになりました。
Apple社の例だけでなく、顔認証技術を使った製品を開発している多くの企業が新型コロナウイルス感染症対策に乗り出し、マスク着用時の顔認証だけでなく、体温測定機能や各部屋の入り口に認証カメラを設置することで行動履歴の把握をできるように技術改良を行いました。
顔認証AIのしくみ
人が他の人の顔を認識する方法
道端で昔の知人に会ったけど、名前が思い出せない。そんなときはないでしょうか。
それでもなぜ、あなたはその人なのかを認識することができたのでしょうか。
それは、髪型が変わっていたり、髪色が変わっていたり、ファッションが以前と変わっているのにも関わらず、過去の記憶の中にある多くの人々の顔情報や性別などの特徴を思い出して、顔の輪郭、目や口、鼻の特徴などから今の状態を予測し、照合させた結果、一致率が高かったためでしょう。
顔認証AIも同様に膨大な数の顔画像を学習して蓄積していった結果、人を判別できるようになっています。
また、人間が記憶できる容量をはるかに超えて、AIは膨大なデータを学習することが可能であり、データの量が増えていくことで、人の顔から特徴を読み取る性能を高めることができます。
AIがどうやって顔認証しているのか
AIが膨大なデータを学習し、目や鼻、口などの顔のパーツの形や位置、大きさを学習して照合することで、個人を特定することができます。
顔認証システムでAIが識別しているものをまとめると以下の3点になります。
・顔検出:カメラ画像・動画の中から顔の領域を検出する
・特徴点検出:目・鼻・口などの顔のパーツの特徴やその位置、各パーツの距離を正確に捉える
・顔照合:カメラで上記を認識したのち、事前に登録されている顔の特徴と照合することで本人であるのか、そうではなく他人なのかを判断する。
ディープラーニングがAIによる顔認識・顔認証を可能に
AIの機械学習の技術の一つであるディープラーニング(深層学習)は、人の手を介さず、大量のデータからパターンや意味を抽出するための技術です。これは人間の脳の構造を模倣したニューラルネットワークを使用しています。学習させるためにルールの構造を多層化させることで、より正しいルールを見つけさせようとする方法であるため、その名の通り「深層学習」、英語でディープラーニングと言われています。
このディープラーニングの技術により、大量のデータを扱うことができるようになったため、自動で特徴を抽出、学習することができるようになり、高い精度での画像認識が可能になりました。
また、これが可能になったのは、AIの機械学習が発達しただけでなく、画像処理装置(GPU)やクラウド技術、スマートフォンなどのデバイスの処理能力の向上、音声や動画などの非構造化データにも対応できるようになったためです。
顔認識・顔認証AIのさまざまな懸念点
顔認識・顔認証AIは上記で見たように、個人利用のみならず企業での利用が進み、業務の自動化や効率化、細かなニーズを満たすために幅広く利用されていることが分かりました。
一方で、顔認識・顔認証AIは使い方を誤ると大変危険な状態に陥ることが予想できるだけでなく、学習させるデータセットの均質性が取れていないことによる精度の低さなどの懸念点があります。
ルッキズムを助長する可能性
ルッキズムとは、人の外見に基づく偏見や差別のことです。顔認識AIは外見から読み取れる年齢や特徴から判断して商品をおすすめするという用途で使われ始めているという話をすでにしましたが、アメリカではその用途をさらに超えて、性的指向や支持政党まで判断できるという研究が2021年の発表後、波紋を呼びました。
この研究者によると、7割の正答率で政治思想を当てることができたとのことで、ビジネスとして応用されるAIとしては7割という数字はかなり低いものですが、政治思想となると話は変わってきてしまいます。そして同じ研究者がAIによる分析で性的指向についても研究を発表していますが、これが悪用されると、ナチスドイツが行ったような悲劇を繰り返すことになりかねません。
この技術を社会としてどのように扱うのか、科学と倫理の狭間に私たちは立たされています。
参考:nature「Facial recognition technology can expose political orientation from naturalistic facial images」https://www.nature.com/articles/s41598-020-79310-1
顔認識を用いた大量監視はEU・アメリカでは禁止に
2023年5月には、欧州連合(EU)の欧州議会の2つの委員会が公共の場所での顔認識や生体認証テクノロジーを用いた大規模な監視活動の禁止などを盛り込んだ、AIの規制案を承認しました。この規制案は、公共空間においてリアルタイムの生体認証システムの使用や顔認識のデータベースを作成する目的で、SNSや監視カメラ映像から生体データを無差別に収集する行為を禁止しています。
プライバシー保護の観点にさらに踏み込むべきという意見がある一方で、産業界からはイノベーションの妨げになるとして批判の声もあります。
また、アメリカでのBlack Lives Matter運動を契機として、大きく顔認識技術規制法の制定に向けた取組みが急速に広がりました。
参考:Forbes Japan「EUでAIの包括的規制案、「顔認識を用いた大量監視」を禁止へ」https://forbesjapan.com/articles/detail/63100
法学館憲法研究所「連載 デジタル社会と憲法 第4回「顔認識技術の法規制」」https://www.jicl.jp/articles/topics_digital_20220905.html
人種による認識率の違い
2019年に行われたアメリカ国立標準技術研究所(The National Institute of Standards and Technology:NIST)による顔認識技術のバイアスを特定することに焦点を当てた調査では、最も優れたアルゴリズムでも、西アフリカ、東アフリカ、東アジアの人々の誤認率が高く、東ヨーロッパの人々の誤認率が最も低いことが分かりました。
その理由は、エンジンを訓練するために使用される訓練データが人口統計学的に不均衡であったためです。これらの訓練データの不均衡を変えることは容易ではなく、中には、肌の色が黒いと光の反射が少ないため、分析するためのディテールが少なくなるといった物理的な要因も見られました。
参考:NIST「Ongoing Face Recognition Vendor Test (FRVT) 」https://pages.nist.gov/frvt/reports/demographics/annexes/annex_07.pdf
上記の例のように顔認識AIは学習されるデータによってバイアスを招いてしまう可能性があり、AIに学習させるデータセットの品質や量がAIの性能を大きく左右します。AIの精度を高めるために欠かせないのがアノテーションという作業となります。
顔認識・顔認証AI開発の手順
顔認証AI開発においては、膨大なデータを集めた後、その正解データとなる教師データを作成することが必要となります。その正確なデータを準備する作業をアノテーション(annotation)といいます。
アノテーション(annotation)とは、英語の辞書で調べてみると「注釈をつけること」と出てきます。これがAI分野においては「特定のデータに対して情報タグ(メタデータ)を付け加える」という意味になります。機械学習においてデータ収集した後、データにラベリングすることでそのラベルごとに仕分けをして、そのラベルの目的に沿った学習を行うことができるようになります。
このアノテーションは、AI開発の一過程ではありますが、AIによって代用することはできず、人の手によって準備されます。
すなわち、AIは自動的にすべてを解決してくれるわけではなく、人の手が加わって初めて活躍することができるのです。
AI開発に必要な顔画像データセットの入手方法
顔認証・顔認識AIを開発するためには、質の高いアノテーションが施された教師データとなるデータセットの準備が必要となることがお分かりいただけたと思います。それではそのようなデータセットはどのように手に入れる方法について解説します。
オープンソースのデータセットを利用する
インターネット上には様々なオープンソースのデータセットが公開されているため、それらを利用する事が可能です。これは専門知識や特定のドメインに関する情報を含むデータを収集する場合に有用です。このデータセットを利用することでデータの品質や適合性を高めることができますが、膨大な時間がかかってしまう可能性があります。
権利フリーで商用利用が可能となっているものとそうでないものがあるため、利用の際には規約に注意して利用するようにしましょう。
データ収集サービス
データ収集サービスでは、様々なソースから膨大なデータを集約・整理することを専門としているため、データに多様性を持たせることができます。
データ収集サービスを利用することで、他の方法よりコストがかさんでしまう可能性がありますが、データの質と多様性を確保することができ、アウトソーシングすることで開発担当がモデル開発に時間を多く割くことができるだけでなく、社内の人件費を抑えることにつながり、場合によってはコストが安く済むということも考えられます。
ライセンス付与済みのデータセット
データ収集サービスや研究所などが販売している、ライセンスが付与されたデータセットを利用することで、大規模かつ構造化されたデータセットをすぐに手に入れることができます。この場合はライセンス契約に基づき、データの利用や変更、共有について制限がかけられる可能性があります。また、専門性の高いデータセットの場合は、価格が高いため、コストがかかってしまうという面もあります。
認識・顔認証AIのためのデータセット利用の注意点
個人情報の保護・肖像権の侵害
顔画像についてはテキストと異なり、収集するのが難しいです。そのため、インターネット上から画像を収集したくなってしまうと思いますが、顔画像の使用については被写体となる方からの同意なしに使用することは肖像権の侵害に当たり、個人情報保護の観点において厳重に管理しなければなりません。
データのバイアスと多様性
すでに説明したように、データセットのボリュームやデータセット内で人種や年齢、性別などで偏りがある場合は、AIの判定結果に大きな影響を及ぼしてしまいます。データの多様性を確保することで、AIの品質を高めることができます。
ライセンス付与されたデータセットの利用
データセットを販売している企業は、ライセンスを付与していることが多いため、利用方法には制限がある場合もあります。
APTOが提供する顔画像データセット
APTOは、様々な種類の顔画像データを保有しております。過去には、合成した顔画像データセットを商用利用可能なデータとして提供しており、多くのユーザー様にご利用いただいています。
◼︎顔画像データセット
https://prtimes.jp/main/html/rd/p/000000022.000053927.html
◼︎顔画像データセット(マスクあり)
https://prtimes.jp/main/html/rd/p/000000027.000053927.html
◼︎データセットプラットフォーム
https://data.harbest.io/ja
まとめ
ここまで顔認証・顔認識AIの活用方法や注意点、そしてAI開発にあたって重要な顔画像データセットの収集方法や取り扱う際の注意点について解説してきました。
需要の高まりと顔認証・顔認識AI技術の今後の可能性がある一方で、顔認証システムやAIの導入におけるデータの取り扱いや、データの偏りによって特定の人種や性別のみが優先的に選択されてしまうような差別的なアルゴリズムとなってしまうなどの問題があります。AIの精度を高めるためには、学習させる顔画像のデータセットの質を高めなくてはなりません。最近では多くのAI関連企業や研究機関が積極的に、権利クリアの日本人の顔画像データセットの販売を開始しています。
harBest(ハーベスト)では、AI開発において重要な教師データの作成には弊社の多数のクラウドワーカーによる高品質なデータ作成により、WEBでの発注によるスピーディーかつコストパフォーマンスの高いデータセットの準備が可能です。
また、DX推進の必要性を感じていてもなかなか踏み出せないお客様に寄り添い、その一歩を踏み出すための課題設定からAI実装まで包括的なサポートをしております。 AI開発につきまして下記よりお気軽にお問い合わせください。