2024-07-08
한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina
Η ταξινόμηση εικόνων είναι η απλούστερη και πιο βασική κατηγορία εργασιών όρασης υπολογιστή που βασίζεται σε βαθιά μάθηση Η τεχνολογία εξαγωγής χαρακτηριστικών του CNN που χρησιμοποιείται σε αυτήν είναι επίσης η βάση για οπτικές εργασίες όπως η ανίχνευση στόχων και η τμηματοποίηση στόχων.
Ειδικά για την εργασία ταξινόμησης εικόνων, η συγκεκριμένη διαδικασία είναι η εξής:
1. Εισαγάγετε μια εικόνα RGB καθορισμένου μεγέθους, το 1/3 του καναλιού, το πλάτος και το ύψος είναι γενικά ίσα
2. Εξαγωγή χαρακτηριστικών πολλαπλής κλίμακας μέσω συνελικτικού νευρωνικού δικτύου για τη δημιουργία τιμών χαρακτηριστικών υψηλών διαστάσεων
3. Χρησιμοποιήστε ένα πλήρως συνδεδεμένο δίκτυο ή άλλη δομή για να ταξινομήσετε χαρακτηριστικά υψηλών διαστάσεων και να εξάγετε την τιμή πιθανότητας κάθε ταξινόμησης στόχου (το άθροισμα των πιθανοτήτων είναι 1)
4. Επιλέξτε αυτό με την υψηλότερη τιμή πιθανότητας ως αποτέλεσμα ταξινόμησης εικόνας
opencv.dnn模块可以直接加载深度学习模型,并进行推理输出运行结果。下面是opencv.dnn模块加载googlenet caffe模型进行图片分类的代码。
import cv2
import numpy as np
from labels import LABEL_MAP # 1000 labels in imagenet dataset
if __name__=='__main__':