No es un secreto que los datos han alcanzado una gran importancia a lo largo de la industria tecnológica en los últimos años. Hay un gran valor en capturar y utilizar la información correcta, y con esto han surgido varios perfiles especializados en las distintas etapas de esa cadena de valor.
Si estás pensando en adentrarte y especializarte en un rol de datos, necesitas armar un equipo o solo te interesa conocer más al respecto, en este blog te explicaré cuales son los principales roles técnicos del área.
Data Engineer (Ingeniera o Ingeniero de Datos)
Es común que los datos que se utilizan en una organización provengan de distintas fuentes internas o externas. Por ejemplo, un retailer podría tener información internamente capturada desde sus sistemas de venta y gestión de clientes, además de datos de la competencia mediante proveedores externos. Intentar consumir la información desde distintos orígenes resulta una tarea titánica.
Es aquí donde el rol de Data Engineer llega a facilitar las labores de las demás personas y procesos que utilizan los datos. Su trabajo consiste en consolidar las distintas fuentes en un único lugar de fácil acceso, por ejemplo, un Data Lake, Data Warehouse o simplemente una base de datos centralizada. Para esto, Data Engineers deben crear, mantener y coordinar sistemas y procesos dedicados a la carga de datos, limpieza de los mismos, homologación de las fuentes y otros tratamientos necesarios para asegurar la calidad de la información que ponen a disposición (Data Quality).
Algunas de las habilidades más comunes del rol son programación, SQL y herramientas para extraer, transformar y cargar (ETL, por sus siglas en inglés).
Data Analyst (Analista de Datos)
La principal misión de este rol consiste en responder distintas preguntas de negocio enfocadas en hechos actuales o pasados en base a datos. ¿Qué campaña de marketing ha sido la más rentable?, ¿cuál es el principal motivo de reclamos y cómo ha sido su desenlace? o ¿cómo es el perfil de nuestros clientes en cierto sector geográfico? son solo algunos ejemplos de preguntas que un/a Data Analyst podría ayudar a contestar.
Otra arista importante dentro de las labores de un/a Data Analyst es la comunicación de los hallazgos relevantes. Aquí herramientas como gráficos y paneles o dashboards juegan un papel fundamental. Estos últimos permiten monitorear los indicadores clave de la organización.
Dentro de las habilidades útiles para el rol de Data Analyst encontramos SQL, conocimientos en herramientas de Inteligencia de Negocio (BI por sus siglas en inglés) y comunicación.
Data Scientist (Científica o Científico de Datos)
Es popularmente conocido que las/os Data Scientists se dedican a desarrollar modelos de Machine Learning (ML) y, si bien es parte parte de su trabajo, esta tarea suele ser solo una pequeña porción de sus labores. Desde la definición de un problema, hasta su solución en base a datos hay múltiples etapas. Por lo general, encontrar los datos correctos, explorarlos y tratarlos se lleva la mayor parte del trabajo. Otras tareas luego de desarrollar un modelo consisten en medir y explicar los resultados desde un punto de vista técnico y no técnico.
Con ayuda de Machine Learning y herramientas estadísticas, los/las Data Scientist buscan responder preguntas predictivas a partir de grandes volúmenes de datos. Algunos de los tipos de modelos que desarrollan son:
Recomendación: ¿qué contenido (producto, película, post, etc) recomiendo a cada uno de mis usuarios?
Visión Computacional: detectar o clasificar elementos en imágenes
Modelos predictivos: pronosticar comportamientos futuros basados en datos históricos
Algunas de las habilidades importantes del rol de Data Scientist son la programación, SQL, estadística, Machine Learning y comunicación. Esta última es especialmente importante a la hora de definir correctamente el problema y presentar los avances y resultados.
Machine Learning Engineer (Ingeniera o Ingeniero de Aprendizaje Automático)
Normalmente Data Scientists y ML Engineers trabajan juntos y de forma complementaria. A la hora de desarrollar modelos de ML, las/os Data Scientists experimentan con distintos algoritmos y configuraciones en ambientes de desarrollo hasta llegar al mejor modelo. Desde aquí, las/os ML Engineers se encargan de poner dicho modelo en producción, preocupándose de tres cosas:
Calidad técnica del código: En este punto se revisita el código para responder preguntas tales como: ¿el modelo está programado correctamente?, ¿es necesario optimizar algún componente?, ¿es posible paralelizar?
Infraestructura del modelo: Aquí, las incógnitas claves son: ¿en dónde y cómo se ejecutará el modelo? Por ejemplo, si se necesitan predicciones por lotes una vez al día, calendarizar la ejecución del modelo en un script o pipeline puede ser una buena opción. Por el contrario, si se necesitan predicciones en línea o de manera instantánea, una buena opción sería productivizar el modelo en una API o microservicio.
Calidad del modelo: este aspecto se centra en garantizar que el modelo funcione correctamente en producción y que su desempeño se mantenga a lo largo del tiempo.
Un alto nivel de conocimientos en programación, machine learning e infraestructura cloud (especialmente orientada a ML) son habilidades útiles para el rol de ML Engineer. Debido a estas competencias, este rol suele ser un muy buen punto de partida en el mundo de los datos para las personas que tienen experiencia como desarrolladoras y complementan sus conocimientos con Machine Learning.
Ten en consideración que las tareas y habilidades requeridas para un cargo pueden cambiar entre distintas organizaciones, así que si estás pensando en sumarte a algunos de estos roles la invitación es a siempre evaluar e investigar las organizaciones a las que postulas. Además, el campo de los datos está en constante evolución y, si bien aquí exploramos algunos de sus roles técnicos, también existen otros tipos de cargos, como Product Owner/Manager y Data Steward. Además día a día surgen nuevas especializaciones en respuesta a los requerimientos de la industria. El campo de los datos en un área dinámica y llena de posibilidades ¡su potencial es ilimitado y tú puedes formar parte!
Aviso legal: Las declaraciones y opiniones expresadas en este artículo son las del autor/a o autores y no reflejan necesariamente las posiciones de Thoughtworks.