2024-07-08
한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina
La clasificación de imágenes es la categoría más simple y básica de tareas de visión por computadora basada en el aprendizaje profundo. La tecnología de extracción de características CNN utilizada en ella también es la base para tareas visuales como la detección y segmentación de objetivos.
Específico para la tarea de clasificación de imágenes, el proceso específico es el siguiente:
1. Ingrese una imagen RGB del tamaño especificado, 1/3 de canal, el ancho y el alto son generalmente iguales
2. Extracción de características de múltiples escalas a través de una red neuronal convolucional para generar valores de características de alta dimensión
3. Utilice una red completamente conectada u otra estructura para clasificar características de alta dimensión y generar el valor de probabilidad de cada clasificación objetivo (la suma de las probabilidades es 1)
4. Seleccione el que tenga el valor de probabilidad más alto como resultado de la clasificación de la imagen.
opencv.dnn模块可以直接加载深度学习模型,并进行推理输出运行结果。下面是opencv.dnn模块加载googlenet caffe模型进行图片分类的代码。
import cv2
import numpy as np
from labels import LABEL_MAP # 1000 labels in imagenet dataset
if __name__=='__main__':