Partage de technologie

[opencv.dnn----Classification des images----20240704]

2024-07-08

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

La classification d'images est la catégorie la plus simple et la plus basique de tâches de vision par ordinateur basée sur l'apprentissage en profondeur. La technologie d'extraction de caractéristiques CNN utilisée constitue également la base de tâches visuelles telles que la détection et la segmentation de cibles.

Spécifique à la tâche de classification d'images, le processus spécifique est le suivant :
1. Entrez une image RVB de la taille spécifiée, 1/3 canal, la largeur et la hauteur sont généralement égales
2. Extraction de caractéristiques à plusieurs échelles via un réseau neuronal convolutif pour générer des valeurs de caractéristiques de grande dimension
3. Utilisez un réseau entièrement connecté ou une autre structure pour classer les caractéristiques de grande dimension et générer la valeur de probabilité de chaque classification cible (la somme des probabilités est de 1)
4. Sélectionnez celui avec la valeur de probabilité la plus élevée comme résultat de la classification d'image

opencv.dnn模块可以直接加载深度学习模型,并进行推理输出运行结果。下面是opencv.dnn模块加载googlenet caffe模型进行图片分类的代码。
import cv2
import numpy as np
from labels import LABEL_MAP # 1000 labels in imagenet dataset

if __name__=='__main__':