Desde la última vez que presentamos a Snowflake en el Radar, hemos ganado algo más de experiencia con él, así como con las mallas de datos como alternativa a los almacenes de datos (data warehouses) y lagos de datos. Snowflake continua impresionándonos con funcionalidades como viajes en el tiempo, clonación de copia cero, intercambio de datos y con su tienda (marketplace). No hemos encontrado nada que no nos guste, lo que ha llevado a los equipos a preferirlo por sobre otras alternativas. Redshift se está enfocando en la separación del almacenamiento y del procesamiento, que ha sido un punto fuerte de Snowflake, pero, incluso con Redshift Spectrum, no es tan fácil y ni flexible de usar, en parte por sus lazos previos con Postgres (por cierto, todavía nos gusta Postgres). Las consultas federadas pueden ser una razón para usar Redshift, pero, cuando se trata de operaciones, Snowflake es mucho más fácil de usar. BigQuery, que es otra alternativa, es muy fácil de operar pero Snowflake lo supera en ambientes de múltiples nubes (multi-cloud). También podemos decir que hemos usado Snowflake con éxito en GCP, AWS y Azure.
Snowflake ha probado ser un SaaS robusto para soluciones de almacenamiento de big data, warehouse, o lago de datos para muchos de nuestros clientes. Tiene una arquitectura superior para escalar almacenamiento, cómputo y servicios para cargar, descargar y utilizar datos. También es muy flexible: soporta almacenamiento de datos estructurados, semi estructurados y sin estructura; provee una lista creciente de conectores para distintos patrones de acceso como Spark para ciencia de datos y SQL para analíticas; y corre en múltiples proveedores de nube. Nuestro consejo para muchos de nuestros clientes es hacer uso de servicios gestionados según la utilidad de su tecnología, como almacenamiento de big data; sin embargo, si el riesgo y las regulaciones prohíben el uso de servicios gestionados, entonces Snowflake es un buen candidato para compañías con grandes volúmenes de datos y cargas pesadas de trabajo. Si bien hemos tenido éxito utilizando Snowflake en empresas medianas, nos falta aún experimentar Snowflake en ecosistemas grandes donde los datos necesitan ser reconocidos como propiedad de varios segmentos de la organización.
A menudo relacionamos el almacenamiento de datos (o “Data Warehousing”) a una infraestructura central que es difícil de escalar y administrar con las crecientes demandas alrededor de los datos. Snowflake, sin embargo, es una nueva solución de SQL Data Warehouse como servicio (SQL as a Service) construida desde cero para la nube. Con varias características cuidadosamente construidas tales como atomicidad a nivel de base de datos, soporte para datos estructurados y semiestructurados, funciones analíticas nativas, y sobre todo una separación clara de capas de almacenamiento, cómputo, y servicios, Snowflake aborda la mayoría de los desafíos a encontrarse en el área de Data Warehousing.