Notifications
Clear all

Mô hình YOLOv7: Đánh dấu sự trở lại tuyệt vời của YOLO

2 Posts
2 Users
0 Reactions
2,028 Views
(@quan)
Member Moderator
Joined: 2 years ago
Posts: 50
Topic starter  

YOLOv7 đã trở nên nổi bật khi đánh bại tất cả các mô hình phát hiện vật thể hiện có cho đến nay. Bất kỳ ai đã từng làm việc trong lĩnh vực nhận diện đối tượng đều đã nghe nói về YOLO. Nó đã phát triển một thời gian và cho đến nay có rất nhiều phiên bản YOLO.

Yolo là một mô hình mạng CNN cho việc phát hiện, nhận dạng, phân loại đối tượng. Yolo được tạo ra từ việc kết hợp giữa các convolutional layers và connected layers. Trong đó các convolutional layers sẽ trích xuất ra các feature của ảnh, còn full-connected layers sẽ dự đoán ra xác suất đó và tọa độ của đối tượng.

YOLOv7 vượt qua tất cả các mô hình khác về cả tốc độ và độ chính xác trong phạm vi từ 5 FPS đến 160 FPS và có độ chính xác cao nhất 56,8% AP trong số tất cả các máy dò đối tượng thời gian thực với 30 FPS trở lên trên GPU V100. Máy dò đối tượng YOLOv7-E6 (56 FPS V100, 55,9% AP) hoạt động tốt hơn cả máy dò dựa trên máy biến áp SWINL Cascade-Mask R-CNN (9,2 FPS A100, 53,9% AP) 509% về tốc độ và 2% về độ chính xác và máy dò dựa trên phức hợp ConvNeXt-XL Cascade-Mask R-CNN (8,6 FPS A100, 55,2% AP) tăng 551% về tốc độ và 0,7% AP về độ chính xác. (Paper gốc: https://arxiv.org/pdf/2207.02696.pdf )

YOLO không phải là một kiến ​​trúc đơn lẻ mà là một framework dành cho nghiên cứu rất linh hoạt được viết bằng các ngôn ngữ lập trình cấp thấp. Framework có ba thành phần chính: đầu, cổ và xương sống. Các tập hợp thành phần và kiến ​​trúc khác nhau được liên kết với ba thành phần nêu trên tạo ra các phiên bản YOLO khác nhau.

(Theo Vishal Rajput)


   
Quote
Share: