A série YOLO (You Only Look Once), criada por Joseph Redmon e Ali Farhadi em 2015 durante o seu doutorado e desenvolvida pela Ultralytics, continua avançando nos modelos de visão computacional. A versão mais recente, YOLO11, oferece melhorias significativas em termos de precisão e eficiência em relação às versões anteriores. O YOLO11 pode realizar a classificação de imagens em alta velocidade com recursos mínimos, o que o torna adequado para aplicações em tempo real em dispositivos de ponta. Também descobrimos que a capacidade de usar a mesma estrutura para fazer estimativa de pose, detecção de objetos, segmentação de imagens e outras tarefas é muito poderosa. Esse desenvolvimento significativo também nos lembra que o uso de modelos “tradicionais” de aprendizado de máquina para tarefas específicas pode ser mais eficiente do que os modelos gerais de IA, como os modelos de linguagem de grande porte (LLMs).
