2024-07-08
한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina
Klasifikasi gambar adalah kategori tugas computer vision yang paling sederhana dan paling dasar berdasarkan pembelajaran mendalam. Teknologi ekstraksi fitur CNN yang digunakan di dalamnya juga menjadi dasar untuk tugas visual seperti deteksi target dan segmentasi target.
Khusus untuk tugas klasifikasi gambar, proses spesifiknya adalah sebagai berikut:
1. Masukkan gambar RGB dengan ukuran tertentu, 1/3 saluran, lebar dan tinggi umumnya sama
2. Ekstraksi fitur multiskala melalui jaringan saraf konvolusional untuk menghasilkan nilai fitur berdimensi tinggi
3. Gunakan jaringan atau struktur lain yang terhubung sepenuhnya untuk mengklasifikasikan fitur berdimensi tinggi dan menghasilkan nilai probabilitas dari setiap klasifikasi target (jumlah probabilitasnya adalah 1)
4. Pilih salah satu yang mempunyai nilai probabilitas tertinggi sebagai hasil klasifikasi citra
opencv.dnn模块可以直接加载深度学习模型,并进行推理输出运行结果。下面是opencv.dnn模块加载googlenet caffe模型进行图片分类的代码。
import cv2
import numpy as np
from labels import LABEL_MAP # 1000 labels in imagenet dataset
if __name__=='__main__':