Desde a última vez que falamos sobre o Google BigQuery ML, modelos mais sofisticados, como Deep Neural Networks e AutoML Tables, foram adicionados ao conectar o BigQuery ML com TensorFlow e Vertex AI como back-end. O BigQuery também introduziu suporte para previsão de séries temporais. Uma das nossas preocupações, anteriormente, era quanto à explicabilidade. No início deste ano, o BigQuery Explainable AI foi anunciado com disponibilidade geral, representando um passo importante na abordagem dessa questão. Também podemos exportar modelos do BigQuery ML para o Cloud Storage como um SavedModel do Tensorflow, e usá-los para previsão online. Ainda existem desvantagens como a facilidade de "entrega contínua para aprendizado de máquina", mas com sua baixa barreira de entrada, o BigQuery ML continua sendo uma opção atraente, principalmente quando os dados já residem no BigQuery.
Frequentemente, o treinamento e a previsão de resultados dos modelos de aprendizado de máquina exigem código para levar os dados ao modelo. Google BigQuery ML inverte essa lógica trazendo o modelo para os dados. Google BigQuery é um armazém de dados projetado para atender a consultas em larga escala usando SQL, para casos de uso analíticos. O Google BigQuery ML estende essa função e sua interface SQL para criar, treinar e avaliar modelos de aprendizado de máquina usando seus conjuntos de dados e, eventualmente, executar previsões de modelo para criar novos conjuntos de dados do BigQuery. Ele suporta um conjunto limitado de modelos prontos para uso, como regressão linear para previsão ou regressão binária e multiclasse para classificação. Ele também suporta, com funcionalidade limitada, a importação de modelos TensorFlow previamente treinados. Embora o BigQuery ML e sua abordagem baseada em SQL reduzam o nível de uso do aprendizado de máquina para fazer previsões e recomendações, particularmente para explorações rápidas, isso vem com um desafio: comprometer outros aspectos do treinamento de modelos, como testes de viés ético, explicabilidade e entrega contínua para aprendizado de máquina.