Data Engineer NLP (m/w/d)
ExternalPrepare for this interview
EliteAI-generated questions, company research, and talking points tailored to this role
About the role
statworx ist ein führendes Beratungs- und Entwicklungsunternehmen für Daten und KI mit Sitz in Frankfurt am Main. Wir bieten strategische Beratung für mittelständische Unternehmen und globale Konzerne. Wir entwickeln innovative Daten- & KI-Lösungen für alle Unternehmensbereiche und Tätigkeitsfelder. Wir befähigen Menschen auf allen Kompetenzniveaus mit unseren Daten- & KI-Bildungsformaten. Kurz gesagt: Wir unterstützen Unternehmen bei allen Aspekten der digitalen Transformation - seit mehr als 10 Jahren, in über 1.000 Daten- & KI-Projekten und für über 100 Kunden aus fast allen Industrien. Unsere AI Development-Abteilung dient als Katalysator für Data & AI Transformation. Dabei setzen wir auf eine ganzheitliche Herangehensweise, die von der initialen Evaluierung der KI-Reife über die Konzeption und Ausarbeitung der Daten- und KI-Lösung bis hin zur praktischen Umsetzung und Skalierung von KI-Lösungen reicht. Durch unsere tiefgehende Expertise in Data Engineering, Data Science, Machine Learning sorgen wir dafür, dass unsere Kunden den maximalen Nutzen aus ihren Daten ziehen. Focus: Data pipelines and provisioning for NLP and LLM-based applications Du verbindest klassisches Data Engineering mit modernen NLP-Ansätzen - insbesondere im Umfeld von Large Language Models (LLMs), Embeddings, Knowledge Graphs, Retrieval-Augmented Generation (RAG) und Text-to-SQL-Anwendungen Du konzipierst, entwickelst und betreibst moderne Datenarchitekturen, die die Basis für fortschrittliche NLP-Anwendungen bilden - von Knowledge-Management-Systemen über semantische Suchlösungen bis hin zu RAG-Use-Cases Du arbeitest eng mit unseren Kund:innen zusammen, verstehst ihre fachlichen Anforderungen und Datenprozesse und entwickelst daraus maßgeschneiderte, skalierbare Daten- und KI-Lösungen Du implementierst skalierbare Datenpipelines und -infrastrukturen, um große Mengen strukturierter und unstrukturierter Daten effizient bereitzustellen, zu transformieren und zu versionieren Du stellst Datenqualität, -sicherheit und -governance über die gesamte Wertschöpfungskette sicher und etablierst Best Practices im Umgang mit sensiblen Daten in KI-Projekten Du verantwortest den Aufbau und Betrieb skalierbarer Dateninfrastrukturen in Cloud-Umgebungen und automatisierst Deployments sowie Monitoring-Systeme, um Zuverlässigkeit und Verfügbarkeit sicherzustellen Du berätst unsere Kund:innen und internen Teams strategisch zu Datenarchitekturen, Technologien, Tools und Best Practices und agierst als verlässliche:r Sparringspartner:in Du unterstützt jüngere Kolleg:innen, teilst dein Wissen aktiv im Team und trägst durch Workshops, Blogbeiträge oder interne Talks zur Weiterentwicklung der Data-Engineering-Community bei statworx bei Du hast ein erfolgreich abgeschlossenes Masterstudium - z. B. in (Wirtschafts-)Informatik oder einem vergleichbaren Studiengang Du bringst mindestens fünf Jahre einschlägige Berufserfahrung im Bereich Data Engineering oder Data Architecture mit Du verfügst über ein tiefes Verständnis moderner Datenarchitekturen (Data Lakes, Lakehouses, Data Warehouses) und bist mit ETL-/ELT-Prozessen sowie Datenmodellierung bestens vertraut Idealerweise hast du Erfahrung im Aufbau von Dateninfrastrukturen für NLP-Anwendungen - insbesondere im Umfeld von LLMs, Retrieval-Augmented Generation (RAG), Semantic Layern und Knowledge Graphs Praktische Erfahrung mit Text-to-SQL-Systemen oder der Entwicklung von Schnittstellen zwischen natürlicher Sprache und Datenbanken ist ein Plus Du hast Erfahrung mit Cloud-Plattformen (Azure, AWS oder GCP) und modernen Datenplattformen wie Databricks oder Snowflake Du kennst dich mit Infrastructure-as-Code (z. B. Terraform, Pulumi) und CI/CD-Workflows (z. B. GitHub Actions, GitLab CI, Azure DevOps) aus Du besitzt sehr gute Kenntnisse in Python, SQL und Bash/Shell und legst Wert auf sauberen, effizienten und wartbaren Code Du verstehst die Bedeutung von Data Governance, Sicherheit und Datenschutz (z. B. DSGVO) und berücksichtigst diese Aspekte konsequent bei der Architekturplanung Du kombinierst analytisches Denkvermögen mit der Fähigkeit, fachliche Anforderungen in technische Lösungen zu übersetzen, und kommunizierst sicher mit Stakeholdern auf allen Ebenen Du sprichst fließend Englisch (in Wort und Schrift) und verfügst über fortgeschrittene Deutschkenntnisse - oder bist bereit, diese aktiv auszubauen Data Science- und KI-Beratung als Kerngeschäft: Dich erwarten spannende Projekte mit namhaften Kund:innen - von innovativen NLP-Use Cases bis hin zu anspruchsvollen Data-Science- und Machine-Learning-Anwendungen Fachliche Tiefe und Vielfalt: Du arbeitest an komplexen, vielseitigen Fragestellungen und erweiterst dabei kontinuierlich deine Expertise in Data Science, Machine Learning und Künstlicher Intelligenz Weiterentwicklung auf allen Ebenen: Wir fördern deine methodische, fachliche und persönliche Entwicklung - durch regelmäßiges Feedback, individuelle Förderung und unser Mentoring-Programm Kultur und Zusammenarbeit:
Your Match
How well this role fits your profile.
Company Intel
What employees say
Worked at statworx? Share your experience