Real-time Object Detection on Edge Devices
Учебный проект по детекции на Jetson: замерил FPS и проверил качество после оптимизации.
Project
YOLOv8TensorRTNVIDIA JetsonPyTorch
Бенчмарки
- FPS (avg)
- 47
- mAP@0.5:0.95
- 0.41 (val set)
- Latency (p95)
- 28 ms
Задача
Понять, как ускорить модель на edge-устройстве и не потерять слишком много точности.
Решение
Сделал экспорт в ONNX и запуск через TensorRT FP16, добавил одинаковый препроцессинг для train/inference и сравнил метрики.
Стек технологий
YOLOv8TensorRTNVIDIA JetsonPyTorch
Код
import tensorrt as trt
logger = trt.Logger(trt.Logger.WARNING)
builder = trt.Builder(logger)Результаты
- Около 45 FPS @ 640px на Jetson Orin
- Потеря качества небольшая относительно FP32