YOLOは画像内の様々な対象物を検出できる物体検出アルゴリズムです。
YOLOを用いたシステムは今日様々な分野で活用されています。
今回は物体検出アルゴリズムYOLOの概要や使い方、活用事例について紹介します!
目次
第1章 YOLOの概要
YOLOは「You Only Look Once」の略で、AIを活用した画像および映像分析で広く使われている 代表的な画像解析の手法の一つとなっております。
物体検出は、画像や動画内に映る特定のクラス(人、動物、車、食べ物など)とその位置を検出するAI技術です。
物体検出AIでは検出された対象物とその名前が上の画像のように表示されます。
物体検出のアルゴリズムは、Sliding window approach、Region proposal method+Deep learning、End-to-endと進化してきました。
YOLOはEnd-to-end(端から端まで)アルゴリズムでできており、その特徴は画像をひとつのニューラルネットワークに入力するだけで、入力画像から直接バウンディングボックスを出力することです。
これにより、工程が多かった従来の物体検出アルゴリズより高速かつ精度の高い物体検出を可能をしています。
第2章 YOLOの使い方
YOLOの使い方は大きく分けて2通りあります。学習済みモデルを使用する方法と、自分でモデルを学習させる方法です。
2-1 学習済みモデルでYOLOを使う場合
学習済みモデルとは大規模なデータセットを用いて事前にトレーニングされた機械学習のモデルのことです。
本来ならば自分でデータを用意しデータと正解をYOLOに与え学習させることでAIモデルを作りますが、それらが既に完了している学習済みモデルを利用することで物体検出を行うことができます。
ただし検出できる物体はモデルごとに異なるので注意が必要です。
モデルはHugging FaceやGit hubで手に入れることができます。
例えば、公式サイトで配布されている学習済みモデルにyolov3.weightsというモデルがあります。
10万枚の画像で学習されたモデルで、下の表に含まれる物体を検出したい場合はこのyolov3.weightsを使用することで自分で学習させることなく物体検出をすることができます。
モデルはこちら。
人 | ゾウ | ワイングラス | ダイニングテーブル |
自転車 | クマ | カップ | トイレ |
車 | シマウマ | フォーク | テレビ |
バイク | キリン | ナイフ | ノートパソコン |
飛行機 | リュックサック | スプーン | マウス |
バス | 傘 | ボウル | リモコン |
電車 | ハンドバッグ | バナナ | キーボード |
トラック | ネクタイ | リンゴ | 携帯電話 |
船 | スーツケース | サンドウィッチ | 電子レンジ |
信号機 | フリスビー | オレンジ | オーブン |
消火栓 | スキー | ブロッコリー | トースター |
ストップサイン | スノーボード | キャロット | シンク |
パーキングメーター | スポーツボール | ホットドッグ | 冷蔵庫 |
ベンチ | カイト | ピザ | 本 |
鳥 | 野球バット | ドーナツ | 時計 |
猫 | 野球グラブ | ケーキ | 花瓶 |
犬 | スケートボード | 椅子 | ハサミ |
馬 | サーフボード | ソファー | テディベア |
羊 | テニスラケット | 鉢植え | ヘアードライヤー |
牛 | ボトル | ベッド | 歯ブラシ |
2-2 自分で学習させる場合
YOLOで物体検出モデルを作る手順は
①データセットの収集
物体検出を行いたい対象物が含まれる数千から数万の画像を集めます。次にそれらの画像内の検出したい物体の位置と種類をラベル付けします。
②データの前処理
画像のサイズ、背景、色などを調整しデータの質を上げ、収集したデータをトレーニング用、テスト用、検証用に分けます。
③モデルのトレーニング
YOLOを使用して、トレーニングを行います。トレーニングはニューラルネットワークのパラメータの最適な値を探す操作です。
④モデルの評価、チューニング
モデルの評価では、テスト用の画像を使って性能を評価していきます。物体検知モデルの性能を測る際はmAP(mean Average Precision)を用います。
モデルのチューニングでは、より精度の良いAIを提供するために入力画像やパラメータを調整します。
第3章 YOLOの活用事例
YOLOは他の物体検出アルゴリズムと比べて処理が高速であることが特徴です。
よってリアルタイムで物体検出の結果が必要となる場面での利用に適しています。
この章ではYOLOが活用されている代表的な事例について紹介していきます。
自動運転
自動運転は車に搭載されたカメラに映った障害物や標識の内容をAIが認識、判断することで適切に車を操作します。
瞬時に認識することが求められるため、処理が高速であるYOLOが利用されます。
渋滞予測
画像やビデオから車や人を検出し、交通量を測定するのにYOLOが活用されています。
そのデータをもとにさらに他のモデルを用いて学習することで渋滞を予測するAIシステムを作ることができます。
異常検知
製造現場や工場ラインに設置したカメラから得られる製品の画像をもとに製品の異常を検知することにYOLOが利用されています。
従来の検査員による目視検査では熟練のスキルが必要であるため、検査員に依る精度のばらつきや少子高齢化による人材不足が問題でした。しかし異常検知AIにより、そういった問題を解決し、効率化や品質の向上が期待できるため採用する企業も増えてきています。
画像診断
CTや内視鏡、MRIなどから得られる画像や動画から疾患の診断や進行の程度を判断する画像診断にYOLOは活用されています。
医師より高い精度で診断でき期待されている一方で、実際に医療現場で利用するには技術面、倫理面、法律面の厳しい試験をクリアする必要があり社会実装には高いハードルがあるのが現状です。
第4章 まとめ
物体検出アルゴリズムのYOLOについて、その使い方や活用事例を紹介しました。
YOLOは今後より多くの業界や分野で活躍することが期待され、物体検出技術を取り入れたシステムは、将来的なビジネスの可能性の拡大につながると予想されます。YOLOを用いたシステムの導入を検討するのも良いかもしれませんね。
執筆者;きょうかのばあば きょうか
きょうかのばあば
デジタルシニア テクノロジーを使いこなす71歳のばあば👵
【資料無料ダウンロード】
・AI業務活用お役立ち資料
・用途別のおすすめAIをご紹介
・生成AIの業務導入事例も掲載
この記事は役に立ちましたか?
もし参考になりましたら、下記のボタンで教えてください。
コメント