前提として、Deep Learning の活用例は自然言語処理や、時系列データの予測などもありますが、分かりやすい画像認識による活用を想定して書かせていただきます。
AIエンジニアとして、まずは Deep Learning を学びましょう。そしてある程度 Deep Learning を理解し、自分で犬猫分類、あるいは MNIST分類( Deep Learning の初心者の大半がここからスタートしますね)ができるようになったら、次のステップに進みましょう!
これからAIエンジニアとして仕事をしていく上では、まず間違いなく、Deep Learning だけでは解決できない課題にぶち当たります。そして、Deep Learning で分類問題を行う程度ならば、今やITリテラシーの高い方ならばそれほど難しくないでしょう。自社でAI人材を育てる企業も増えている中で、私のような、企業へ AI を提案する立場においては Deep Learning にプラスアルファが必要になります。言い換えれば、プラスアルアファがあると非常に強力な武器になります。
ここでは、Deep Learning を最大限に活かすためのプラスアルファ、画像処理について紹介します!
今まで人目で直接確認していたことを、 Deep Learning を用いてカメラの映像から自動的に検出できるようになりました。不審者や、火事などの異常、あるいは昨今のコロナ禍における密を自動的に検出するなど、非常に多くの需要があります。ショッピングモールで近頃よく見かける、体温測定のカメラもそうですね!
カメラの映像は、ハードウェアの性能が上がるにつれてどんどん高精細になっています。iPhoneも4K60psでの動画撮影が余裕になっています。高精細な画像は、私たちが綺麗に感じるだけでなく、AI も認識しやすいものになっています。遠くにいる人の顔も個人をはっきりと認識できるようになりますし、細かい文字なども読むことも可能です。米粒に書いた文字を読むことも余裕なぐらいです!
一定の撮影条件、屋内や晴れた日中などの好条件で撮影することができれば、AI の検出精度は極めて高いものになります。一方で、時間帯、天候が変わるとどうでしょうか。朝日や西日、夜間、雨や雪でも見え方が変わってしまい精度がガクッと落ちてしまうかもしれません。
Deep Learningは、こうした様々な撮影条件でも、画像をどんどん集めて学習させれば、どんどん検出精度は高くなります。しかしながら、どこかでは精度は打ち止めになってしまうことが大半です。
例えば自動運転の AI で95%の精度が出たとしても、それ以上の精度に高めるには困難かもしれません。95%の時点で人間が判断するよりも高精度だったとしても、事故を起こした際の責任問題や倫理の議論もあります。無人店舗でもそうです。お客さんが本来支払う金額よりも多く徴収してしまうこともあってはなりません。
Deep Learning 単体では95%までの精度が限界だとすると、残りはどうやって向上させればよいでしょうか。そこで画像処理の出番です。
AI に認識させるための入力画像をカメラの映像そのままではなく、AI が認識しやすいものに加工する前処理を行って、精度を高めることが考えられます。朝日や西日では明るさを抑えたり、夜間では逆に明るくしたり、雨や雪でも晴れた日の映像に近いものに加工することで、安定した精度が期待できます。
また、AI の判定とは別に、画像処理によるパターンマッチングも平行して行い、判定結果から総合的に判断することなども考えられます。
こうして、AI 単体での精度限界を向上させる試みがされています。
AI単体では95%でも、画像処理を組み合わせることで98%…99%…100%を目指せるかもしれません!
私は画像認識を主としたAIエンジニアなので、こちらを武器に日々戦っています!
ちなみに、画像処理を学ぶには以下の書籍がオススメです。画像処理エンジニア検定の資格取得を目指すことも良いかもしれません。
以下の書籍は、技術的にも詳しく記載されていますし、画像処理を学んだ後でも引き続き使える書籍です。読み応えは抜群です!