Los modelos modernos de ML son muy complejos y requieren de gran cantidad de conjuntos de datos para entrenamiento etiquetados para que puedan aprender de ellos. Snorkel comenzó en el laboratorio de IA de Stanford con la consideración de que etiquetar datos manualmente es muy costoso y, muchas veces, no es factible. Snorkel nos permite etiquetar datos de entrenamiento de forma programada a través de la creación de funciones de etiquetado. Snorkel utiliza técnicas de aprendizaje supervisadas para evaluar la precisión y correlación entre estas funciones de etiquetado y luego las vuelve a examinar y combina sus etiquetas de salida, produciendo como resultado etiquetas de entrenamiento de alta calidad. Desde entonces, los creadores de Snorkel han creado una plataforma comercial llamada Snorkel Flow. Si bien Snorkel ya no se desarrolla activamente, sigue siendo importante por sus ideas sobre el uso de métodos poco supervisados para el etiquetado de datos.