Enable javascript in your browser for better experience. Need to know to enable it? Go here.
Última actualización : Apr 26, 2023
NO EN LA EDICIÓN ACTUAL
Este blip no está en la edición actual del Radar. Si ha aparecido en una de las últimas ediciones, es probable que siga siendo relevante. Si es más antiguo, es posible que ya no sea relevante y que nuestra valoración sea diferente hoy en día. Desgraciadamente, no tenemos el ancho de banda necesario para revisar continuamente los anuncios de ediciones anteriores del Radar. Entender más
Apr 2023
Adoptar ?

DVC sigue siendo nuestra herramienta preferida para gestionar experimentos en proyectos de ciencia de datos. El hecho de que esté basado en Git lo convierte en un dominio conocido para que los desarrolladores lleven prácticas de ingeniería al ecosistema de ciencia de datos. La visión dogmática que tiene DVC de lo que es un un punto de control de un modelo encapsula cuidadosamente un conjunto de datos de entrenamiento, un conjunto de datos de prueba, hiperparámetros del modelo y el código. Convertir la reproducibilidad en una preocupación de primera clase, permite al equipo viajar en el tiempo a través de varias versiones del modelo. Nuestros equipos han utilizado con éxito DVC en producción para permitir la entrega continua para ML (CD4ML); ya que se puede conectar con cualquier tipo de almacenamiento (incluyendo AWS S3, Google Cloud Storage, MinIO y Google Drive). Sin embargo, con conjuntos de datos cada vez más grandes, capturar instantáneas basadas en el sistema de archivos puede volverse particularmente costoso. Cuando los datos subyacentes cambian rápidamente, DVC al control de un buen almacenamiento versionado, permite realizar un seguimiento de las desviaciones del modelo durante un período de tiempo. Nuestros equipos han utilizado eficazmente DVC además de formatos de almacenamiento de datos como Delta Lake que optimiza el control de versiones (COW). La mayoría de nuestros equipos de ciencia de datos configuran DVC como una tarea del día cero mientras inician un proyecto; por este motivo, nos complace moverlo a la sección de Adoptar.

May 2020
Probar ?

En el 2018 mencionamos a DVC junto con el versionamiento de datos para analíticas reproducibles. Desde entonces se ha convertido en la herramienta favorita para gestionar experimentos en proyectos de aprendizaje automático (machine learning, ML). Ya que se encuentra basado en Git, DVC es un ambiente familiar para las personas desarrolladoras de software que llevan sus costumbres de ingeniería a la práctica de ML. Puesto que versiona el código que procesa datos junto con los mismos datos y monitorea los estados en un pipeline, ayuda a ordenar las actividades de modelado sin interrumpir el flujo de trabajo de los analistas.

Publicado : May 19, 2020

Descarga el PDF

 

 

 

English | Español | Português | 中文

Suscríbete al boletín informativo de Technology Radar

 

 

 

 

Suscríbete ahora

Visita nuestro archivo para leer los volúmenes anteriores