技術共有

[opencv.dnn----画像分類----20240704]

2024-07-08

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

画像分類は、深層学習に基づくコンピューター ビジョン タスクの最も単純かつ基本的なカテゴリであり、そこで使用される CNN 特徴抽出テクノロジは、ターゲット検出やターゲット セグメンテーションなどの視覚タスクの基礎でもあります。

画像分類タスクに特有の具体的なプロセスは次のとおりです。
1. 指定されたサイズ、1/3 チャネル、幅と高さが通常等しい RGB 画像を入力します。
2. 畳み込みニューラルネットワークによるマルチスケール特徴抽出による高次元特徴量生成
3. 全結合ネットワークなどを利用して高次元特徴を分類し、各対象分類の確率値を出力します(確率の合計は1)
4. 確率値が最も高いものを画像分類結果として選択します

opencv.dnn模块可以直接加载深度学习模型,并进行推理输出运行结果。下面是opencv.dnn模块加载googlenet caffe模型进行图片分类的代码。
import cv2
import numpy as np
from labels import LABEL_MAP # 1000 labels in imagenet dataset

if __name__=='__main__':