Condivisione della tecnologia

[opencv.dnn----Classificazione delle immagini----20240704]

2024-07-08

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

La classificazione delle immagini è la categoria più semplice e basilare delle attività di visione artificiale basata sull'apprendimento profondo. La tecnologia di estrazione delle caratteristiche della CNN utilizzata in essa è anche la base per attività visive come il rilevamento e la segmentazione del bersaglio.

Specifico per l'attività di classificazione delle immagini, il processo specifico è il seguente:
1. Immettere un'immagine RGB della dimensione specificata, 1/3 del canale, larghezza e altezza sono generalmente uguali
2. Estrazione di caratteristiche multiscala attraverso la rete neurale convoluzionale per generare valori di caratteristiche ad alta dimensionalità
3. Utilizzare una rete completamente connessa o un'altra struttura per classificare caratteristiche ad alta dimensione e restituire il valore di probabilità di ciascuna classificazione target (la somma delle probabilità è 1)
4. Selezionare quello con il valore di probabilità più alto come risultato della classificazione dell'immagine

opencv.dnn模块可以直接加载深度学习模型,并进行推理输出运行结果。下面是opencv.dnn模块加载googlenet caffe模型进行图片分类的代码。
import cv2
import numpy as np
from labels import LABEL_MAP # 1000 labels in imagenet dataset

if __name__=='__main__':