Desde la última vez que hablamos sobre Google BigQuery ML, se han agregado modelos más sofisticados, como Redes Neuronales Profundas y de Tablas con Autoaprendizaje, al conectar BigQuery ML con TensorFlow y Vertex AI como backend. BigQuery también ha introducido soporte para previsión de series temporales. Una de nuestra preocupaciones anteriormente era explicabilidad. A principios de este año fue anunciado BigQuery Explainable AI, dando un paso para abordar esto. También podemos exportar modelos de BigQuery ML a Cloud Storage como Tensorflow SavedModel y usarlos para predicción online. Aún quedan cosas pendientes como la dificultad de “entrega continua para aprendizaje automático” pero con su facilidad de uso, BigQuery ML sigue siendo una opción atractiva, sobre todo si la información ya está en BigQuery.
A menudo entrenar y predecir los resultados en modelos de aprendizaje automático (machine-learning) requiere código para llevar los datos al modelo. Google BigQuery ML invierte esto llevando el modelo a los datos. Google BigQuery es un almacen de datos diseñados para servir consultas a gran escala usando SQL, para casos de usos analitico. Google BigQuery ML extiende esta funcionalidad y su interfaz SQL para crear, entrenar y evaluar modelos de aprendizaje automático usando sus conjuntos de datos; y eventualmente correr modelos predictivos para crear un nuevo conjunto de datos BigQuery. Soporta un limitado conjunto de modelos out of the box, como regresión lineal para predicción o regresión binaria y multiclase para clasificación. También soporta, con limitada funcionalidad, la importación de modelos de TensorFlow previamente entrenados. Aunque BigQuery ML y su enfoque basado en SQL disminuye la barra para usar machine learning para hacer predicciones y recomendaciones, particularmente para exploración rapida, esto puede ser una desventaja al dejar de lado aspectos del entrenamiento del modelo tal como pruebas de sesgo ético, explicabilidad y entrega continua para modelos de machine learning.