Compartilhamento de tecnologia

[opencv.dnn----Classificação da imagem----20240704]

2024-07-08

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

A classificação de imagens é a categoria mais simples e básica de tarefas de visão computacional baseada em aprendizado profundo. A tecnologia de extração de recursos CNN usada nela também é a base para tarefas visuais, como detecção e segmentação de alvos.

Específico para a tarefa de classificação de imagens, o processo específico é o seguinte:
1. Insira uma imagem RGB de tamanho especificado, 1/3 canal, largura e altura geralmente iguais
2. Extração de recursos em várias escalas por meio de rede neural convolucional para gerar valores de recursos de alta dimensão
3. Use uma rede totalmente conectada ou outra estrutura para classificar recursos de alta dimensão e gerar o valor de probabilidade de cada classificação alvo (a soma das probabilidades é 1)
4. Selecione aquele com maior valor de probabilidade como resultado da classificação da imagem

opencv.dnn模块可以直接加载深度学习模型,并进行推理输出运行结果。下面是opencv.dnn模块加载googlenet caffe模型进行图片分类的代码。
import cv2
import numpy as np
from labels import LABEL_MAP # 1000 labels in imagenet dataset

if __name__=='__main__':