Team Lead Platform Operations (all genders)

External

Envelio · Cologne, Germany

Full-timeRemote1w ago

TypeScriptPythonAWSAzureGCPKubernetes

Cover Letter Connect

Prepare for this interview

Elite

AI-generated questions, company research, and talking points tailored to this role

About the role

Zu einfach ist langweilig! Gemeinsam haben wir die Mission, die Energiewende voranzutreiben. Wir lieben, was wir tun und dabei ist uns kein Thema zu groß. Wir übernehmen Verantwortung für unsere Arbeit und wachsen an jeder neuen Aufgabe. Kurz gesagt: Own it, love it, grow with it. Wir sind ein bodenständiges Team aus Kaffee- und Mate-Liebhaber:innen. Unser Geek-Humor resultiert in einer rituellen Nutzung von Emojis und der enzyklopädischen Herausarbeitung von unnützem Wissen. Mehr als 150 envelianer:innen mit über 20 verschiedenen Nationalitäten sind bereits an Bord. Komm dazu und wachse mit uns! Als Team Lead Platform Operations (all genders) baust du ein hoch technisches Team von rund 6 Personen auf und führst es mit Fokus auf den stabilen, sicheren und planbaren Betrieb unseres Produkts: der Intelligent Grid Platform (IGP). Dein Team verantwortet Product Operations : Ihr stellt sicher, dass Kunden-IGP-Umgebungen zuverlässig laufen, ihr treibt operative Prozesse wie Incident Handling und Releases voran und ihr leitet aus realen Produktionssignalen systematische Verbesserungen ab. Du arbeitest eng mit Product, Customer Success und Engineering Teams zusammen. Außerdem arbeitest du eng mit dem SRE/Infrastructure Team zusammen, das die Plattform-Grundlage verantwortet (Cluster Provisioning, Deployment Pipelines, Observability-Tooling etc.), während dein Team den Fokus auf den operativen Betrieb der IGP für Kunden im Tagesgeschäft legt. Du hilfst dabei, unser Operating Model schrittweise in Richtung 24/7 Zuverlässigkeit für Kunden-Umgebungen weiterzuentwickeln (Prozesse, Ownership und Eskalation) - gemeinsam mit Engineering, SRE/Infrastructure und Customer Success. Du coachst und betreust deine Mitarbeitenden und hilfst ihnen durch 1:1-Gespräche und regelmäßiges Feedback, sich weiterzuentwickeln Du verantwortest und entwickelst die operative Ausführung des IGP-Betriebs über Kunden-Umgebungen hinweg Du stellst schnelle und strukturierte Bearbeitung von kundenrelevanten Problemen sicher (z.B. IGP Incidents / HOTs) und sorgst für nachhaltige Follow-ups Du schaffst Klarheit über Ownership und Eskalationswege für Production-Themen und koordinierst effizient über Squads hinweg mit Customer Success Du treibst Operational Excellence: ruhige Incident-Kommunikation, pragmatische Problemlösung und eine Kultur kontinuierlicher Verbesserung (blameless) Du balancierst kurzfristige operative Arbeit (Service wiederherstellen) mit langfristigen Investments (Toil reduzieren, Reliability verbessern, Tooling und Runbooks verbessern) Du setzt Prioritäten, planst Kapazitäten und steuerst Roadmap/Backlog für Operations-relevante Arbeit Du formst das Team im Rekrutierungsprozess und gestaltest individuelle Entwicklungspfade Perfektion ist ein Mythos! Viel mehr interessiert uns der Mensch hinter dem Bildschirm. Diese Kriterien sind also eher als Orientierungshilfe für dich gedacht. Wir sind gespannt, wie deine individuellen Fähigkeiten zu uns passen. Du hast starke Erfahrung im Betrieb komplexer Cloud-Applikationen und weißt, wie man Services unter realen Constraints zuverlässig betreibt Du betreibst produktive Services auf Cloud-Infrastruktur (AWS/Azure/GCP) und kennst typische Failure-Modes Du hast Praxis mit Linux und Networking-Basics im Troubleshooting (Logs, Systemzustand, Connectivity) Du kennst moderne Betriebsmodelle wie Container/Kubernetes (oder vergleichbar) und kannst Deployments im Betrieb bewerten (Rollouts, Rollbacks) Du bist sicher in Incident Management, Root Cause Analyse und Priorisierung unter Zeitdruck Du hast nachweisliche Erfahrung in der Führung und Entwicklung eines Teams in einem operativ geprägten Umfeld Du kannst Stakeholder gut managen und über Teams hinweg koordinieren (Engineering Squads, Product, Customer Success) Du reduzierst operativen Aufwand nachhaltig durch bessere Prozesse, Automatisierung und Dokumentation Du kommunizierst klar, gerade in High-Pressure-Situationen, und sorgst für Alignment auf Next Steps Du beherrschst Deutsch und Englisch fließend in Wort und Schrift. Klar definierte Verantwortung für Produktthemen und effiziente Koordination zwischen Squads und Customer Success Strukturiertes Incident Management (Service wiederherstellen, klar kommunizieren, dann Ursachenanalyse) Release-Prozesse mit pragmatischem Risikomanagement (sichere Änderungen, schnelle Rollbacks bei Bedarf) Monitoring- und Alerting-Hygiene (signal over noise) Umfassende Runbooks und Automatisierung zur langfristigen Reduzierung operativer Belastung Multi-cloud, hybrid on-prem Setup mit Kubernetes und Helm als Standard Anwendung primär in Python und TypeScript Standard Backing Services wie PostgreSQL, RabbitMQ, Redis Gitlab & Gitlab CI Terraform für Infrastructure as Code Passe den Arbeitsmodus an deinen Lifestyle an - fully remote (#LI-Remote) oder hybrid mit Office-Option Option zum mobilen Arbeiten aus dem Ausland (bis zu drei Monate pro Jahr von überall in der EU oder den USA) State of the Art Technologie und moder

Your Match

How well this role fits your profile.

Company Intel

What employees say

Worked at envelio? Share your experience

Interested in this role?

Apply on the company's website.

Cover Letter Connect