2024-07-08
한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina
Классификация изображений — это самая простая и базовая категория задач компьютерного зрения, основанная на глубоком обучении. Используемая в ней технология извлечения признаков CNN также является основой для таких визуальных задач, как обнаружение и сегментация целей.
Для задачи классификации изображений конкретный процесс выглядит следующим образом:
1. Введите изображение RGB указанного размера, 1/3 канала, ширина и высота обычно равны.
2. Многомасштабное извлечение признаков с помощью сверточной нейронной сети для генерации многомерных значений признаков.
3. Используйте полностью связную сеть или другую структуру для классификации многомерных объектов и вывода значения вероятности каждой целевой классификации (сумма вероятностей равна 1).
4. Выберите в качестве результата классификации изображений изображение с наибольшим значением вероятности.
opencv.dnn模块可以直接加载深度学习模型,并进行推理输出运行结果。下面是opencv.dnn模块加载googlenet caffe模型进行图片分类的代码。
import cv2
import numpy as np
from labels import LABEL_MAP # 1000 labels in imagenet dataset
if __name__=='__main__':