¡Llega YOLOv8.1! Presentando aplicaciones con Oriented Bounding Boxes

¡Hola!👋Soy Henry Navarro Hernández

Matemático, apasionado de los datos y la IA

Tabla de contenidos

Después de un año increíble, Ultralytics celebra el primer aniversario con el lanzamiento de YOLOv8.1 y las innovaciones Oriented Bounding Boxes (OBB). Este lanzamiento marca un año de logros extraordinarios en tecnología de IA. El año pasado, se  demostró la creciente influencia y adopción de YOLOv8, con más de 20 millones de descargas del paquete Ultralytics y el entrenamiento de 19 millones de modelos YOLOv8.

Con YOLOv8.1, presenciamos una revolución en la precisión de la detección de objetos angulares o rotados. Esta versión introduce modelos con Oriented Bounding Box, elevando la capacidad de segmentación y optimización de rendimiento. Sumérgete en las mejoras significativas de la arquitectura de modelos y las funciones de entrenamiento. Un avance que redefine los estándares en detección de objetos.

En este contexto, nosotros nos destacamos en el campo de la IA, especialmente en entrenamiento, prueba y despliegue de modelos como YOLOv8.1. Nuestra experiencia nos posiciona para potenciar las capacidades de YOLOv8.1, elevando la precisión y eficacia en la detección de objetos. Esta colaboración señala una fusión de innovación y aplicación práctica que promete expandir los límites de lo posible en la tecnología de la IA. En este artículo descubrirás cómo redefinimos el futuro de la detección de objetos.

La Historia de YOLO

Explorando el universo de YOLO (You Only Look Once), un algoritmo que ha revolucionado la  detección de objetos y es  popular por su velocidad y precisión, enfocándose en la detección de objetos como un único problema de regresión. Predice directamente las bounding boxes y probabilidades de clase a partir de imágenes completas en una sola evaluación. A continuación te presento un resumen de las versiones:

  • YOLOv1 (2016):  Fue pionero en el uso de una única red neuronal para predecir cajascajas delimitadoras y probabilidades de clase directamente desde imágenes completas. Aunque rápido, era menos preciso que sus contrapartes de dos etapas como R-CNN.
  • YOLOv2 (YOLO9000, 2017):Introduce anchor boxes para una precisión mejorada y la capacidad de detectar más de 9000 categorías de objetos.
  • YOLOv3 (2018): Incorpora mejoras como el uso de tres escalas diferentes para hacer predicciones, mejorando la detección de objetos pequeños y la incorporación de la estructura Darknet-53.
  • YOLOv4 (2020): Optimizado para cálculos paralelos,es eficiente y rápido en GPUs, con mejoras como CSPNet, PANet y SAM block.
  • YOLOv5 (2020): Desarrollado por Glen Jocher y Ultralytics, destaca por su simplicidad y ligereza, con mejoras en arquitectura y procedimientos de entrenamiento.
  • YOLOv6 (2022): Se enfoca en equilibrar velocidad, precisión y tamaño del modelo, adecuado para dispositivos móviles y de borde.
  • YOLOv7 (2022):  Ofrece rendimiento de última generación en detección de objetos en tiempo real, con optimizaciones arquitectónicas y de estrategias de entrenamiento.
  • YOLOv8: También de Ultralytics, muestra la versión más reciente con avances significativos y soporte para PyTorch, ONNX, OpenVINO, CoreML y TFLite.
  • YOLO-NAS (Neural Architecture Search): Este modelo aplica búsqueda de arquitectura neural a YOLO para automatizar el diseño de arquitecturas de red para tareas de detección de objetos.

Y ahora…

Presentamos con emoción a YOLOv8.1 la última joya de la serie YOLO. Ahora, con la detección de objetos usando Oriented Bounding Boxes, llevamos la precisión y eficiencia a nuevas alturas. Este avance marca un hito en la evolución de YOLO, permitiendo la detección en ángulos y rotaciones especialmente en escenarios de detección complejos.

yolov8 ultralytics
YOLOv8-obb aplicado a imágenes aéreas.

Ultralytics y sus modelos YOLOv8 OBB

El ‘framework’ de Ultralytics YOLOv8 ofrece modelos especializados donde las Oriented Bounding Boxes (OBB), se erigen como elementos cruciales para lograr una detección de objetos precisa y eficiente. Estos modelos, identificados por el sufijo -obb, como yolov8n-obb.pt, son meticulosamente entrenados con el conjunto de datos DOTA. Este último está compuesto por imágenes de diversas fuentes, como Google Earth, GF-2 y satélites JL-1, se presenta como un referente sólido para la detección de objetos en imágenes aéreas. Desde aviones hasta campos deportivos, cada categoría evoluciona a través de versiones sucesivas (v1.0 a v2.0), proporcionando una rica experiencia de aprendizaje.

En el ámbito de la detección de objetos, las bounding boxes convencionales presentan limitaciones al enfrentarse a objetos orientados vertical u horizontalmente. YOLOv8 OBB emerge como una solución, que eleva no solo la precisión de la detección, especialmente en objetos con orientaciones distintas, sino también la eficiencia en este proceso. Con un enfoque de un solo paso y optimizaciones en la arquitectura de la red neuronal, este modelo destaca por su rendimiento efectivo.

Resaltando la importancia del conjunto de datos DOTA (Detection of Objects in Aerial Images), se revela como un gran repositorio de imágenes aéreas de alta resolución. Con más de 1,7 millones de bounding boxes orientadas para 18 categorías de objetos, DOTA desafía y nutre a los modelos de detección de objetos, brindando una experiencia de aprendizaje completa. Prepárese para sumergirse en el fascinante mundo de YOLOv8 OBB y su asociación sin igual con DOTA.

Modelos Preentrenados

¿Sabes qué es lo más genial  de todo que Ultralytics tiene modelos YOLOv8 obb preentrenados? Estos modelos ya están entrenados con el conjunto de datos DOTA y listos para ser utilizados en análisis aéreos específicos. Veamos algunos de los modelos disponibles:

modelos entrenados
Modelos preentrenados disponibles por Ultralytics 

Predecir: muy fácil de usar

Implementar un modelo YOLOv8-obb entrenado para predecir oriented bounding boxes es tan simple como proporcionar una imagen al modelo.

Python

from ultralytics import YOLO

# Load a model
model = YOLO('yolov8n-obb.pt')  # load an official model

# Predict with the model
results = model('https://www.gim-international.com/cache/4/6/d/3/1/46d3179f7a866b93fb52c33da3554e4585c3084e.jpeg')  # predict on public image

CLI

yolo obb predict model=yolov8n-obb.pt source='https://www.gim-international.com/cache/4/6/d/3/1/46d3179f7a866b93fb52c33da3554e4585c3084e.jpeg'  # predict with official model on public image

A continuación te presentamos diversas fuentes para hacer la predicción

modelos de prediccion
Fuentes disponibles para predicción 

Resultados

Ejemplo de detección de objetos con oriented bounding boxes aplicada a imágenes de Google Maps. Todas las imágenes pertenecen a Google.

Exportación del modelo

Exportar modelos usando el ‘framework’ de Ultralytics ofrece varias ventajas,¡ y una de ellas es que mejora la velocidad!. Este proceso sencillo convierte tu modelo a formatos como ONNX, CoreML, TensorFlow Lite. ¿La mejor parte? Es compatible con diferentes plataformas y dispositivos.

Esta versatilidad te permite integrar fácilmente tu modelo en diversos entornos, desde aplicaciones móviles hasta dispositivos de borde. Y lo mejor de todo, el ‘framework’ YOLOv8 de Ultralytics facilita esta exportación, ofreciendo una licencia AGPL-3.0 para uso general. Si buscas opciones más personalizadas para proyectos comerciales, también está disponible una Licencia Empresarial. Así de adaptable y potente es YOLOv8 en escenarios del mundo real.

Python

from ultralytics import YOLO

# Load a model
model = YOLO('yolov8n-obb.pt')  # load an official model
model = YOLO('path/to/best.pt')  # load a custom trained model

# Export the model
model.export(format='onnx')

CLI

yolo export model=yolov8n-obb.pt format=onnx  # export official model
yolo export model=path/to/best.pt format=onnx  # export custom trained model

Reflexión

La tecnología de YOLOv8.1 por Ultralytics con Oriented Bounding Boxes (OBB), representa un salto transformador en la tecnología de detección de objetos. Este avance impacta significativamente en el análisis de imágenes aéreas y su integración en diversas plataformas, destacando la evolución continua y la importancia de la serie YOLO en IA. Desde el inicio (YOLOv1) hasta hoy cada iteración ha mejorado progresivamente la eficiencia, precisión y aplicabilidad del modelo.

La capacidad de exportar estos modelos para diversas aplicaciones del mundo real subraya la practicidad y robustez de YOLOv8.1, marcando un desarrollo crucial en visión por computadora e IA.

Recuerda que nosotros estamos liderando el camino en IA y análisis de datos. Contamos con la experiencia necesaria para sacar el máximo provecho de estas tecnologías en constante evolución Ya sea que desees sumergirte en las maravillas de la IA o incorporar estos avances a tus operaciones, somos el socio ideal. Habla con nuestro equipo y descubre las posibilidades que la innovación en inteligencia artificial y datos tiene para ofrecer.

contacta

Desarrolla tu siguiente proyecto de Data, IA, Cloud o Transformación Digital con nosotros. Empieza hablando con nuestro equipo comercial.

Tech Matters

La Newsletter mensual para conocer los proyectos de tecnología e inteligencia artificial que están teniendo un impacto positivo en el mundo.

Plazas limitadas

Próximo evento
Lead&Inspire: Aplicación de IA en entornos de desarrollo de software