【アノテーション/物体検出】 AIを使って膨大なデータを効率的にチェックする方法とは?
AI分野は日々進化しており、AIによって生成された広告を見かけることも少なくありません。手元に膨大なデータはあっても、その使い方がわからない、または、データの整理の仕方がわからず、活用したくともできていないという方もいらっしゃるのではないでしょうか。さらに、仕事をする中で、人の目で確認することの非効率性や人が行うことによる生産性の低下、正確性の低下に関して、課題をお持ちの方もいらっしゃると思います。そのような課題はもしかしたらAIを活用した物体検出のアノテーションによって解決できるかもしれません。
今回は、そのような課題をお持ちの方に、そもそもアノテーションや物体検出とは何か、そのデータをうまく活用し、効率的かつ正確に判断できる方法と、利用する際の注意点について解説していきます。
1.大量のモノ・データをチェックするときの解決方法!アノテーションによる物体検出とは?
こんなお悩みはありませんか?
「社内に蓄積されているデータはあっても、データが整理されておらず、うまく活用できていない。」「商品として生産した商品の検品はこれまで人の目だけでやってきたが、どうも効率が悪く、ミスも出てきてしまっている。AIなど最新技術を使って効率を上げたい。」
「確認だけの単純作業だが、人がチェックしていると長時間かかってしまう。そしてやる気もなくなってきてしまい、ミスも多発。つまらない仕事だからと離職率が高く、すぐにまた人を募集しなければならない。」
以上はあくまでも一例です。
シンプルだけれども大量にあるデータを分類する業務、商品などを検品する確認業務をなんとか効率よくやりたいけどできていない。AIなんてよく聞くけれども本当に業務効率が上がるのか、むしろ使い方が難しくて手間がかかってしまうだけなのではないか。ぜひ使えるなら使いたいけどどこから手を付けていいか分からないという状況にいらっしゃる方は多いのではないでしょうか。そんな課題に対して今回は「AIを用いたアノテーションによる物体検出」という技術を使って解決する方法を説明していきます。
2.「AIを活用する」とは?
まずはアノテーションについて説明する前に、AIとは実際どのようなものなのかを見ていきたいと思います。
2-1.日本におけるAI
日本では少子高齢化に伴う人口減少や世界経済における競争力の激化により、企業においては人手不足やそれによる生産性向上のニーズ、新規事業の開発など多くの面で課題を抱えており、企業のDX(デジタルトランスフォーメーション/デジタル技術を活用することによって業務改善を行い、製品やサービス、ビジネスモデルまで変革していくとともに、企業・組織文化を改革することで競争上の優位に立てるようになること)の推進が声高に叫ばれるようになってきています。さらに中小企業においては上記に加えて従業員の高齢化により技術継承ができないなどの問題に直面している企業も少なくありません。そのような状況の中で、効率化や正確性を求めて人間に代わって単純な作業をスピーディーに行うためにAI(Artificial Intelligence:人工知能)を導入する企業は増えてきています。しかし導入においては、令和元年の総務省調べでは、大企業でも16.5%、中小企業では5.6%といまだに低い水準となっています。また、世界の国々と比較した場合も、「業務の一部をAIに置き換えている」「一部の業務でAIのパイロット運用(試験的に導入している)」を行っていると答えた合計の割合は中国では85%、アメリカでは51%、フランス・ドイツでは49%、日本では39%と世界と比べても低い割合となっています。(総務省令和元年版情報通信白書より)
引用元:https://www.soumu.go.jp/johotsusintokei/whitepaper/ja/r01/html/nd112220.html
上記のデータから明らかなように、まだまだ世界を見てもAIを実践的に導入できている割合が低く、AI導入については黎明期ともいえます。そのような中で、AIを導入することは日本国内のみならず、グローバルに比較した際も、他社との差をつけることができる一つの可能性となり得るでしょう。
2-2.AIがどのように活用されているか
AIは実に身近なところで多岐にわたって使用されています。
■検索エンジンに使われるAI
例えば今読んでいただいているこの記事にたどり着くまでにもすでにAIが利用されています。検索欄に文字を入れて検索ボタンを押したその瞬間からです。または、検索の文字を一文字入れただけでも予測ワードがいくつか出てくるかもしれません。どんなキーワードがよく検索されているか、そしてそれを検索した時間やそのユーザーが普段どのようなサイトを見ているかによっても変わってきます。そのようにして検索エンジンのシステムは学習データを蓄積することで、AIの精度を高めています。
■お問い合わせ対応(チャットボット)に使われるAI
そして最近よく見かけるようになった、お問い合わせの際に画面の右下や左下に出てくるチャットボットもAIの技術が使われています。カスタマーサービスは電話やメール、店頭などで人間が答えてくれるというサービスがほとんどでした。電話やメール、店頭で問い合わせをすると、返答に長い時間がかかってしまう、それ以前に電話が殺到してなかなかつながらない、窓口に行ったらたくさんの人が並んでいて全然私の順番にならないということが多いかもしれません。問い合わせをするときはちょっとした質問だけど私だけの個人的な質問だから問合せしないといけない、と多くの人が考えると思います。
しかし、サービス提供者側からすると、以前にも同じような質問をされたことがあり、それを答えるのに多くの時間を費やしてしまうと考えることも少なくありません。そこで多く寄せられる質問とその回答をAIに学習させることで、質問に答えることができ、その場で解決できない場合に初めて人間による対応を行うことで、相談者の母数を減らし、お客様にとっては待ち時間の短縮、サービス提供者にとっては個別対応が必要な業務に時間と人員を割くことができます。
■製造業や医療に使われるAI
AIが得意とする分野は何でしょうか。ここまで見てきたものにも共通していますが、「パターンや特徴を学習することで、検知したものに対する回答を出す」ということです。
例えば、こちらもイメージしやすいかと思いますが、製造業では製品を検品する際に傷がついていたり、異物が混入したり、規格通りに製造されているかを判断することで、市場に出る前のチェック作業にAIが活用されています。人間の目ではすり抜けてしまうものもAIであれば検知できるように質の高いデータを学習させることでヒューマンエラーを防いだり、スピーディーにチェックをしたり、そして労働力不足を補うことができるという課題も解決できます。
医療業界も同様に、ある症状の特徴を覚えさせることで人の目では見逃してしまいそうな症状を捉えることができるだけでなく、病歴や年齢などの個人データと照合させることで将来かかってしまう病気などのリスクを予測することも可能です。
以上の技術は今回解説する「AIを用いたアノテーションによる物体検出」を用いた活用法です。
このようにAIは私たちの生活の様々なところで活躍しています。AIが活躍するためには、機械学習の技術が必要となり、そのためには膨大な量のデータが必要となります。AIが学習を通して正確に活用されるためには、人の手によるアノテーションが準備されなければなりません。AIは勝手にすべてを解決してくれるわけではなく、人の手が加わって初めて活躍することができるのです。それでは、AI分野における機械学習と、AIが活躍するために必要なアノテーションとは何かということについて解説していきます。
3.アノテーションってなに?
カタカナやアルファベット表記ばかりでAIの分野は言葉を聞いただけでも難しい、だから余計に導入して運用していくのはそれ以上に難しいと考えている方は多いかもしれません。たしかに聞いただけでは意味が分かりづらいものばかりです。これらの言葉は英語などの外国語から来ている言葉なので難しく思われがちですが、その意味を知ると意外とそうではありません。順を追って解説していきます。
3-1.機械学習とは
まずは機械学習(Machine Learning)について説明していきます。AIの技術の一つで、大量のデータを読み込ませ、データの中の対象物の特徴やパターンを機械が自動で学習して認識できるようになることで、対象を自動的に検出できるようにすることです。つまり、反復的に学習させることで、データの中の規則性を学び、対象物について規則の通りにAの特徴を持つものはA、Bの特徴を持つものはBと判断することができるようになります。
3-2.機械学習の3つの手法と「教師データ」
機械学習は「強化学習」「教師あり学習」「教師なし学習」という3つの手法に分けることができます。いずれも大量のデータを読み込ませることには変わりはありませんが、それぞれの学習において準備するデータに違いがあります。強化学習とは、正解を与える代わりに将来の価値を最大化するために学習させる手法のことをいい、動的環境の中で試行錯誤のやり取りを重ねることでタスクを実行します。「教師あり/なし」とは、教師データを用いて学習させるか、そうでないかの違いとなります。
教師データとは教師というその言葉の指すイメージから、「入力されたテキスト・音声・画像に対する正しい出力(応答)について記載した正解データ」のことを指します。AIが実利用される際には、「教師あり学習」が利用されることが多いですが、このデータの質の高さがAIの精度を左右するのです。
3-3.アノテーション
ここまでAI開発に必要なアノテーションを理解するために必要な言葉を見てきました。アノテーション(annotation)とは、英語の辞書で調べてみると「注釈をつけること」と出てきます。これがAI分野においては「特定のデータに対して情報タグ(メタデータ)を付け加える」という意味になります。さらに詳しく説明すると、「教師データを作成する際に、テキストや音声、画像などのデータ情報タグ(メタデータ)を付加する作業」のこととなります。機械学習においてデータ収集した後、データにラベリングすることでそのラベルごとに仕分けをして、そのラベルの目的に沿った学習を行うことができるようになります。つまり、AI開発におけるアノテーションとは「教師データを作る作業」のことを指しています。
4.アノテーションの種類と方法
アノテーションには用途に応じて様々な種類があります。ここではよく使われている「テキスト」「音声」「画像・動画」のアノテーションについて紹介します。
4-1.テキストのアノテーション
テキストのアノテーションはAIの活用方法で例として挙げた、お問い合わせのチャットボット、ネットで検索する際に出てくる予測検索結果などで活用されています。文章に対して、タグやメタデータ(データについてより詳しく説明するデータ)などのラベル付けをする作業のことを指します。テキストのアノテーションの中には、テキストに含まれている感情や態度をラベル付けして分けるものや、書かれたテキストの背後にある意図を分析してカテゴリに分類するものもあります。
4-2.音声のアノテーション
音声のアノテーションは人間が話した言葉の意味にタグ付けを行う場合や音の種類に対してタグ付けを行う場合があります。例えばスマートフォンやスマートスピーカーに向かって話しかけるとそれに応答してくれますが、それには音声のアノテーションが活用されています。人間の話す音声を認識して正しい返答をするためには、音声データを文字起こししてテキスト化し、それぞれの単語に意味をタグ付けしていかなければなりません。また、それだけでなく、言語、話す人の性別や年齢、声の高さ低さの違いによっても認識しなければならないため、膨大な質の高い教師データが必要となります。
4-3.画像・動画のアノテーション
商品の不良品検出や自動車の自動運転技術などに活用されています。画像・動画アノテーションには大きく5つの種類に分けられます。
こちらは最もシンプルで、対象の画像1枚に対してこれは何か、どんな形をしているか、どんな色をしているかという1つの属性だけでタグ付けを行う手法です。例えば富士山の写真に対して「富士山かどうか」というラベリングを行います。画像や動画を効率的に分類できる一方で、対象物が画像のどこにあるかなどは示されないため、あいまいな情報となってしまうデメリットもあります。
アノテーターに画像内でラベリングをする必要がある特定の対象物が与えられ、それを検出して意味づけを行う手法です。例えば、ある画像内に鳥がいると分類された場合、どこに鳥が飛んでいるのを具体的示すことで、もう一つ踏み込んだ情報を提供することができます。物体検出はいくつかの手法に分けられます。
■2Ⅾバウンディングボックス
請求書や領収書の順番や種類がバラバラになってしまった、どの取引先からのモノだろうか。と困ることはありませんか。そういった際に長方形や正方形などの四角形(頂点が4つ)で領域を設定して、ターゲットとなるオブジェクトの位置を定義します。書類をスマートフォンでスキャンをしようとしたときに、その書類の周りを囲んでくれる線が現れるときと同じようなイメージです。
■3Ⅾバウンディングボックス
アノテーションの対象物に立方体(頂点が8つ)を適用して、その対象物の位置と深さを定義します。最近ではスマートフォンやタブレットを部屋の中でかざすと映っているものの長さを測れるアプリケーションがあります。画角に収まらないものでもスマートフォンやタブレットを動かすことで長さをほぼ正確に測れるようになっています。
■領域検出(セグメンテーション)
特定の領域を選択して、タグ付けを行う作業です。例えば、自転車と橋と人が映っている写真で、自転車のブランドを見たいと思い、自転車の領域だけを指定してタグ付けをします。他にもスマートフォンのロック解除やカメラの写真撮影機能のように目印となるものを検出するランドマークアノテーションというものもあります。これは顔の認識によく使われるアノテーション作業で、目、眉、鼻、口、輪郭といった顔のパーツを点で指定する形で行います。また、人物の姿勢推定モデルでは画像内の肩、肘、腰、膝、足首などの関節点に点を指定するものもあり、これを使用することで姿勢や野球の打球フォームなどの分析にも使われています。
■多角形ポリゴン(ポリゴンセグメンテーション)
複雑な形状の物体に対して、多角形で領域を指定してアノテーションを行うもので、正確に領域をアノテーションすることが可能です。
■領域分類(セマンティックセグメンテーション)
上記は画像全体や画像の一部の検出でしたが、そうではなく、ピクセル(画素)一つ一つに対して意味づけをするアノテーションを行います。
このようにアノテーションは多岐にわたる方法があり、目的やプロジェクトによって使われる手法が異なっています。
5.物体検出をすることで何ができる?
ここまでAI分野のアノテーションとは、アノテーションの種類は様々あり、物体検出はその技術・手法の一つということが分かりました。この物体検出技術は実際には様々な分野・製品で使われています。
■画像検索エンジン
身近な例から紹介していきましょう。海外に行ったときにレストランのメニューの意味が分からない、ということはありませんか。スマートフォンのアプリケーションではカメラを通してメニューを見ると、瞬時に翻訳され、それを見て「これを下さい」というだけで注文ができてしまいます。そのほかにも見たことがない生き物を見つけたときにそれは何だろうと検索欄の横にあるカメラマークを押してカメラを起動してその生き物を写したり、または写真で撮影したものをスキャンさせたりすると検索され、ネット上のその生き物についてのページを検索することができます。
■写真・ビデオ編集
写真やビデオ編集の際に、物体・人を検出し、特定の対象物をトリミングやカットすることができます。カットした後も自然に見えるようにAIが自動補正をかけてくれる機能もあります。それだけでなく、カメラにも人物に自動的にフォーカスを当てる機能も物体検出技術が使われています。映画業界ではコマーシャルで流れているトレーラー動画を作成するのに使用されています。
■セキュリティカメラ
マンションや街角、お店の中に設置されていることが多いセキュリティカメラも、ビデオから異常行動や犯罪行為を検出するのにも物体検出の技術が使用されています。最近では、ペットや小さい子供、高齢者が家の中で危険な目に遭わないかを確認するためのセキュリティカメラもあります。
■自動運転
近年で最も注目を浴びているのはこちらの自動運転技術ではないでしょうか。ロボットがいたらできるようになるのではと幼いころに夢見た方々も多いと思います。こちらは車載カメラを使用して周囲の状況を撮影、認知し、人や障害物を判別し、その時に取るべき運転行為を運転者に代わり自動的に行います。障害物検知以外にも、道路の白線を認識し、高速道路などで車線維持、車線変更を自動的にしてくれる機能まで備えた自動車もあります。
■製造業における検品作業
先に少し例を挙げましたが、こちらもイメージしやすい物体検知技術が活用された事例です。従来は製品を組み立てたり、部品を作製したりする際に、不良品が含まれていないか人間の目で作業をしていましたが、人間は長時間集中したり、体調が優れない場合は、同じ基準で検品をしていてもどうしてもミスをしてしまいます。また、若手と熟練者ではその差も出てきてしまう可能性があります。それをAIによる物体検出を使用することにより、ヒューマンエラーを取り除き、常に一定の品質を維持することができます。
■稼働率の視覚化
こちらは様々な業種で考えられますが、例えば、製造業においては利益を最大化したいと考えた際は工場を24時間とまではいかずとも、より長い時間稼働させることより多くの商品・製品を作ることができます。そしてその際どれだけ稼働した結果どれだけの商品・製品を作ることができ、どれだけ売れたのかというコスト計算、設備稼働率を把握する必要があります。工場内の設備に対してAIカメラの設置や、AI監視を行うことで、稼働率を人の感覚ではなく、確実に割り出すことができるようになります。
AI開発で工場の「見える化」に挑戦。製造業界全体を盛り上げるAI開発に着手
マイクロコントロールシステムズ株式会社様
これらの例だけではなく、AI分野の物体検出は幅広く活用され、効率性や正確性、そして安定性の向上に役立てられています。
6.物体検出のアノテーションをする際に注意すべきことは?
ここまで物体検出について解説してきましたが、最後に、物体検出のアノテーションをする際の注意点について解説します。
■プライバシーの確保
検知するデータの中にはプライバシーが含まれる可能性がある場合は、データの取り扱いは厳重な注意が必要です。
■使用する環境の変化による検出率の低下
外で活用される場合には、明暗差や夜間や曇りや雨の場合、場所によって検出率が低下することも考えられます。
■データにおいて最低限の解像度に抑える
画像の上に画像が重なっていたり、背景を変えたりすることで誤検知することもあります。なぜならAIでは一緒に映り込むものの特徴も把握し物体を見つけ出しているためです。
■カテゴリ数や物体検知の最大数を増やしすぎてしまう
見つけ出したいものの数や分類したいカテゴリを増やしすぎることで結果が出るまでに時間がかかったり、精度が下がってしまったりする可能性があります。
■教師データの誤りや偏り
アノテーションをする際には教師データの質の担保が欠かせないとお話しましたが、偏りや誤りがある場合は不正確な結果を出してしまいます。
まとめ
いかがでしたでしょうか。人間では時間がかかりすぎて手につけられない膨大なデータであっても、AIによる物体検出のアノテーションを用いることで、膨大なデータをラベリングし、整理、検品作業などの確認作業まで効率的かつ正確に運用することができます。そのためには、ラベリングする際に必要となる精度の高い教師データの作成が必要となります。
株式会社APTOは、業務効率化や自動化に必要性を感じていてもなかなか踏み出せないお客様に寄り添い、その一歩を踏み出し、課題設定からAI実装まで包括的なサポートをしております。また、AI開発において重要な教師データの作成に株式会社APTOが提供するプラットフォームサービスharBestを用いることで、高品質なデータ作成がスピーディーかつ高いクオリティで叶えることができます。
AI開発につきまして下記よりお気軽にお問い合わせください。
https://harbest.io/