Skip to main content
Back to jobs

Técnico/a Datos

External
clgrupoindustrial logoClgrupoindustrial · Jerez DE Los Caballeros
Full-timeOn-siteToday
ETLGDPRIoTMLOpsNoSQLSnowflake
Cover LetterConnect

Prepare for this interview

Elite

AI-generated questions, company research, and talking points tailored to this role


Benefits

Paid time off

Additional Information

Conócenos: Nuestra historia se remonta a 1981, cuando Ricardo Leal, un joven emprendedor de Jerez de los Caballeros (Extremadura) decide poner en marcha un modelo de negocio que revolucionaría la economía de la provincia. Acababa de nacer Cristian Lay, la primera empresa española de venta directa por catálogo. Fue precisamente el espíritu de mejora continua y el deseo de superación lo que llevó a Ricardo Leal a seguir adquiriendo nuevas empresas de diferentes sectores industriales. Como consecuencia de esta expansión, en 2014 se constituye CL Grupo Industrial. Un holding 100% español que, lejos de detener su crecimiento, sigue expandiéndose de manera imparable hasta consolidar el Grupo que somos actualmente: nuestras empresas están distribuidas por todo el territorio nacional con una plantilla de casi 3000 colaboradores. Descripción de puesto: Diseño, Desarrollo y Mantenimiento de Pipelines de Datos (ETL/ELT) Ingesta de datos: Diseñar y configurar procesos para extraer datos desde múltiples fuentes (bases de datos transaccionales, APIs, archivos planos, logs, web scraping, dispositivos IoT). Transformación de datos: Desarrollar scripts y procesos para limpiar, normalizar, agregar y estructurar los datos brutos, transformándolos en formatos útiles para el negocio. Automatización y Orquestación: Configurar y programar flujos de trabajo (workflows) utilizando herramientas de orquestación para garantizar que los procesos se ejecuten de forma automática, secuencial y sin errores. Procesamiento en Batch y Streaming: Desarrollar soluciones tanto para el procesamiento de datos en lotes (batch) como para el procesamiento en tiempo real (streaming), según las necesidades del negocio. Arquitectura, Modelado y Almacenamiento de Datos Modelado de datos: Diseñar esquemas de bases de datos eficientes utilizando metodologías como el modelo estrella (Star Schema), copo de nieve (Snowflake) o Data Vault. Administración de repositorios: Crear y optimizar la estructura de los Data Warehouses (almacenes de datos corporativos) y Data Lakes (repositorios de datos brutos). Selección de tecnologías: Evaluar e implementar las mejores tecnologías de almacenamiento (relacionales, NoSQL, columnares o almacenamiento de objetos en la nube) según el volumen y tipo de datos. Optimización, Escalabilidad y Rendimiento Tuning de consultas: Monitorear, diagnosticar y optimizar consultas $SQL$ o procesos de Spark complejos que presenten cuellos de botella o altos consumos de cómputo. Escalabilidad del sistema: Asegurar que la infraestructura de datos pueda crecer de manera eficiente a medida que aumenta el volumen de información del negocio (escalado horizontal y vertical). Gestión de costes cloud: Monitorear y optimizar el uso de recursos en la nube para evitar sobrecostes innecesarios en el almacenamiento y procesamiento de datos. Calidad, Seguridad y Gobernanza de Datos Validación de datos: Implementar pruebas automáticas de calidad de datos dentro de los pipelines para detectar anomalías, valores nulos o registros corruptos antes de que lleguen al usuario final. Seguridad y Accesos: Colaborar con el equipo de seguridad para garantizar el cifrado de datos (en tránsito y en reposo) y gestionar los permisos de acceso basados en roles (RBAC). Cumplimiento normativo: Asegurar que el manejo, almacenamiento y borrado de datos cumpla con las normativas legales vigentes (como la GDPR). Catalogación de datos: Mantener la documentación técnica de los linajes de datos (saber de dónde viene cada dato y qué transformaciones ha sufrido) y actualizar el diccionario de datos. Soporte y Colaboración con Equipos de Analítica e IA Habilitación de Datos: Proveer conjuntos de datos limpios, preparados y accesibles a los Científicos de Datos y Analistas de BI para sus modelos e informes. Puesta en producción de modelos: Colaborar en la fase de "MLOps", ayudando a integrar los modelos predictivos desarrollados por el equipo de Ciencia de Datos dentro de los flujos de datos productivos de la empresa. Responsabilidades Disponibilidad del Dato: Garantizar que los flujos de datos ( pipelines ) funcionen sin interrupciones y los repositorios ( Data Lakes/Warehouses ) estén operativos según los acuerdos de nivel de servicio (SLA). Integridad y Calidad: Asegurar que los datos almacenados sean réplicas exactas y limpias de las fuentes de origen, sin duplicados ni corrupciones. Gobernanza y Seguridad: Restringir los accesos a datos sensibles, asegurando que solo el personal autorizado pueda consultar información crítica (cumplimiento de normativas de privacidad). Eficiencia Operativa: Mantener controlados los costes de cómputo y almacenamiento en la nube mediante un diseño de código eficiente. Información Adicional: Si estás interesado/a en esta oferta haz click en Solicitar para enviar una copia actualizada de tu CV. Te garantizamos la confidencialidad en el proceso.


Your Match

How well this role fits your profile.

Company Intel

What employees say

Worked at clgrupoindustrial? Share your experience

Interested in this role?

Apply on the company's website.

Cover LetterConnect