Обмен технологиями

[opencv.dnn----Классификация изображений----20240704]

2024-07-08

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

Классификация изображений — это самая простая и базовая категория задач компьютерного зрения, основанная на глубоком обучении. Используемая в ней технология извлечения признаков CNN также является основой для таких визуальных задач, как обнаружение и сегментация целей.

Для задачи классификации изображений конкретный процесс выглядит следующим образом:
1. Введите изображение RGB указанного размера, 1/3 канала, ширина и высота обычно равны.
2. Многомасштабное извлечение признаков с помощью сверточной нейронной сети для генерации многомерных значений признаков.
3. Используйте полностью связную сеть или другую структуру для классификации многомерных объектов и вывода значения вероятности каждой целевой классификации (сумма вероятностей равна 1).
4. Выберите в качестве результата классификации изображений изображение с наибольшим значением вероятности.

opencv.dnn模块可以直接加载深度学习模型,并进行推理输出运行结果。下面是opencv.dnn模块加载googlenet caffe模型进行图片分类的代码。
import cv2
import numpy as np
from labels import LABEL_MAP # 1000 labels in imagenet dataset

if __name__=='__main__':