画像認識技術で実現できるソリューション紹介

2019年10月23日(水)

概要

最近ではディープラーニングを用いた人工知能（以下AI）により非常に高い精度の画像認識が可能になりました。そこで本文では改めてAIとは何か、そもそも画像認識とは何かを確認し、それによって実現できるソリューションを紹介します。

画像認識とは？

画像から物体や文字などの特徴をつかみ、判別をするパターン認識技術のひとつです。画像データから対象となる物の形状、数、色などの特徴を抽出・分析・識別します。人間は画像を見たときに画像には「何が写っているか」「どこまでが物体なのか」を経験的に判別できます。しかし、コンピューターにとって画像とは画像を構成する最小の要素であるピクセル単位の情報の集合体、極端に言えば0と1の集まりにすぎません。なのでコンピューターにただ画像を与えても何の画像か識別できません。そこで画像を構成する各ピクセルに対して演算を行い、特徴を定量的に検出することでコンピューターに画像認識をさせます。演算のアルゴリズムやパラメーターを変更することで識別対象の変更や精度の向上ができます。しかし、画像のゆがみやノイズの除去・明るさや色合いの調整・輪郭の強調などの考慮するパラメーターが多く、高い認識率を出すためにそれぞれのパラメーターを人の手で調整するのは、効率的ではありません。そこで機械学習(AI)を用います。サンプル画像を大量に与え、コンピューターを学習させることでパラメーターを自動で調整し、精度をあげていく方法が現在では主流になっています。また動画は画像の連続した集まりですから、動画に対しても同様のことができます。

機械学習(AI)とは？

コンピューターが自ら学習していくシステムのことです。上述したようにコンピューターにデータを与えただけでは何もしないので、与えられたデータに対してどのような演算をするのか、何を基にパラメーターを調整するかといったモデルを構築する必要があります。構築後、大量のサンプルとなるデータを基にそのモデルが自動で最適化されていきます。ただし、データの質が悪い、サンプル数が少ない、適切なモデルでない場合は認識率が向上しません。そのため、対象に応じた適切なモデルの構築と良質なサンプルをそろえる必要があります。画像認識では人間の脳内の神経回路網を模したニューラルネットワークと呼ばれるモデルがよく用いられます。よく耳にする深層学習（ディープラーニング）とはこのモデルを多層構造化したものです。

事例紹介

画像認識とAIについて踏まえたうえで実際の導入事例を紹介します。

交通監視
作業者支援
帳票ラベル認識
商品認識
自動運転支援
人物検出
類似画像検索
マーカー認識

交通監視

AIによる画像認識技術を活かした交通監視システム

慢性的な交通渋滞は経済成長に悪影響をもたらすだけでなく、大気汚染などの環境問題の原因にもなっています。この問題解決に向けて画像認識技術を活用し、渋滞や事故をリアルタイムで検出する交通監視システムが必要となっています。従来の画像処理技術では自動車のヘッドライトや天候などさまざまな環境要因の影響を受けやすく、また交通事故や違反で多様性もあるため、高精度な検出が難しいという課題がありました。そこで大量の画像を用いた機械学習をさせることで高い認識精度を達成しました。このシステムによって交通状況を広域で把握し、渋滞の状況に応じた信号機の最適な制御などが期待されています。

作業者支援

AI画像認識による安全行動サポート技術

画像認識で人物検知をしてリスク対策をする事例はありますが、工場内では照明条件が異なり、多種多様な装置があることに加えて、作業員がさまざまな姿勢をとりながら作業するため、人物検知そのものが難しい環境も多くあります。そこでディープラーニングによる学習を用いることで実用レベルの人物検知が可能になりました。また、状況に応じて立ち入り禁止エリアが変化する工場内でも正しく認識する技術を確立しています。この認識技術によって、作業員の安全を確保するシステムを実現しています。

帳票ラベル認識

紙帳票を自動処理するAI

受注書・申込書・納品書・請求書などといった帳票を手打ちでデータ入力する作業は、効率的ではありません。しかし、これらの帳票は枚数が多いだけでなく種類も多様です。最近ではペーパーレス化に取り組む企業も多いですが、完全に紙書類の撤廃は難しい現状です。そこで紙書類を無くせないならば、帳票の分類からデータ入力までの単純作業を電子化・自動化するサービスを提供する事例があります。書類の分類とデータ化はAIシステム、自動入力はRPAツール（ロボットによる業務自動化）によって実現されています。 AIによって、二重線訂正印や黒丸の訂正の読み飛ばし、殴り書きのような手書き文字に対しても高い認識精度を達成し、データ入力作業の大部分の時間短縮を可能にしています。

商品認識

画像認識AIレジ

簡単でスムーズに会計できるレジがあれば人件費のカットなどのメリットにつながります。上述したように機械学習には大量のサンプルデータが必要ですが、それだけの個体を用意するのが時間もコストも厳しい場面があります。 AIは完全無欠ではないので誤認識する場合があります。しかし誤認識しても店員が簡単に修正できるためスムーズな会計を実現しています。これによりレジの処理速度の高速化や、研修期間の短縮に貢献しています。

自動運転支援

リアルタイム交通認識

自動車の運転は「周囲の状況や標識の認知」「それらに対する加減速や右左折の判断」「ハンドルやアクセル、ブレーキの操作」の3つに分けられます。このうちの1つである認知を画像認識AIがします。このAIはカメラなどのセンサーから得られた画像などのデータを取り入れ、周辺情報を把握します。正確な認識をするためには高性能なセンサーが必要であることはもちろん、高精度な解析能力と極めて短い時間で処理するシステムが必要です。

人物検出

顔認証ゲート

訪日外国人の増加に対応するため、顔認証技術を用いて日本人の出帰国手続きの効率化が検討されていました。そこでパスポートのIC（集積回路）チップの情報と顔認証ゲートで撮影された顔画像を照合することでスムーズな手続きに貢献しています。

類似画像検索

AIによる類似商品検索機能

「似ている商品を探したい」「名前がわからない商品を探したい」といった検索ニーズに対応するため画像から似た商品を検索するサービスが提供されています。この機能にもディープラーニングが用いられており、商品検出モデルと特徴抽出モデルの2つが用いられています。これにより大量のデータベースの中から高速な検索を可能にしています。

マーカー認識

ドローンの自律飛行アシスト

ドローンの操作には無線のコントローラーを用いる方法もありますが、衛星利用測位システム（以下GPS）を使ったドローンの制御もあります。しかし屋内などではGPSが届かない場合もあります。そこでGPSに代わってマーカーを使ってドローンの制御をします。ドローンに取り付けられたカメラからマーカーかどうかを判定するために画像認識が用いられています。