Neural Vision

Real-time Object Detection on Edge Devices

Учебный проект по детекции на Jetson: замерил FPS и проверил качество после оптимизации.

Project
YOLOv8TensorRTNVIDIA JetsonPyTorch

Бенчмарки

FPS (avg)
47
mAP@0.5:0.95
0.41 (val set)
Latency (p95)
28 ms

Задача

Понять, как ускорить модель на edge-устройстве и не потерять слишком много точности.

Решение

Сделал экспорт в ONNX и запуск через TensorRT FP16, добавил одинаковый препроцессинг для train/inference и сравнил метрики.

Стек технологий

YOLOv8TensorRTNVIDIA JetsonPyTorch

Код

import tensorrt as trt

logger = trt.Logger(trt.Logger.WARNING)
builder = trt.Builder(logger)

Результаты

  • Около 45 FPS @ 640px на Jetson Orin
  • Потеря качества небольшая относительно FP32