2024-07-08
한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina
La classificazione delle immagini è la categoria più semplice e basilare delle attività di visione artificiale basata sull'apprendimento profondo. La tecnologia di estrazione delle caratteristiche della CNN utilizzata in essa è anche la base per attività visive come il rilevamento e la segmentazione del bersaglio.
Specifico per l'attività di classificazione delle immagini, il processo specifico è il seguente:
1. Immettere un'immagine RGB della dimensione specificata, 1/3 del canale, larghezza e altezza sono generalmente uguali
2. Estrazione di caratteristiche multiscala attraverso la rete neurale convoluzionale per generare valori di caratteristiche ad alta dimensionalità
3. Utilizzare una rete completamente connessa o un'altra struttura per classificare caratteristiche ad alta dimensione e restituire il valore di probabilità di ciascuna classificazione target (la somma delle probabilità è 1)
4. Selezionare quello con il valore di probabilità più alto come risultato della classificazione dell'immagine
opencv.dnn模块可以直接加载深度学习模型,并进行推理输出运行结果。下面是opencv.dnn模块加载googlenet caffe模型进行图片分类的代码。
import cv2
import numpy as np
from labels import LABEL_MAP # 1000 labels in imagenet dataset
if __name__=='__main__':