Data Engineer; befristet oder als Praktikum; w/m/d
Verfasst am 2026-01-16
-
Software Entwicklung
Dateningenieur, Software-Ingenieur
Was wir machen
Bei Vara sind wir überzeugt, dass eine verbesserte Brustkrebsfrüherkennung für jede Frau weltweit Standard sein sollte. Unsere KI-gestützte Softwareplattform, entwickelt in enger Zusammenarbeit mit Radiologinnen und Radiologen in Deutschland, führt zu einer höheren Erkennungsrate, einer geringeren Rate falsch-positiver Ergebnisse und reduziert den Arbeitsaufwand bei Routineuntersuchungen – belegt durch die bisher größte prospektive Studie im Gesundheitswesen mit rund 500.000 teilnehmenden Frauen.
Unsere Mission ist es, die Brustkrebsvorsorge effektiver, messbarer und zugänglicher zu gestalten. Durch die Verbesserung der Früherkennung und die Sicherstellung klinisch belegter Ergebnisse leisten wir einen wichtigen Beitrag zu den nationalen Bemühungen um eine bessere Frauengesundheit.
Vara wurde 2018 als erstes Unternehmen aus Merantix, Europas führendem KI-Venture-Studio, gegründet und ist zu einem internationalen Team von 25 engagierten Fachkräften gewachsen. Unser vielfältiges Team vereint Unternehmer, Experten aus dem Gesundheitswesen und Technologieinnovatoren mit einem gemeinsamen Ziel: die Brustkrebsvorsorge nachhaltig zu verbessern.
Weitere Informationen findest du auf unserer Website:(Sie können sich bewerben oder uns per E-Mail kontaktieren in dem Sie die untenstehende Online-Bewerbungsbox verwenden).ai
Deine RolleWir suchen eine:n Data Engineer zur befristeten Unterstützung unseres ML & Data Teams während der Elternzeit eines Teammitglieds. Die Position ist von März 2026 (früherer Start möglich) bis mindestens November 2026 angesetzt, mit Überlappungszeiten zu Beginn und Ende für eine gründliche Wissensübergabe.
Abhängig von der Entwicklung besteht die Option auf einen unbefristeten Vertrag nach Ablauf der Befristung.
Du wirst dabei helfen, die Dateninfrastruktursecut, die unsere KI-Modelle antreibt, zu warten und zu verbessern – von unseren cloud-basierten Datenpipelines, die medizinische Bilddaten verarbeiten, bis hin zu internen Tools zur Überwachung der Modell-Performance.
In Zusammenarbeit mit unseren ML Engineers und Softwareentwickler:innen trägst du zu realen Systemen bei, die im Rahmen des deutschen Brustkrebs-Screening-Programms in Produktion eingesetzt werden.
Unser Data Stack ist Python-zentriert:
Wir nutzen Polars und DuckDB für die Datenverarbeitung, Postgre
SQL für unsere Datenbanken und Tools wie NiceGUI und Streamlit für das interne Monitoring. Die Infrastruktur läuft auf Docker, und wir legen Wert auf sauberen, gut dokumentierten Code.
Diese Rolle eignet sich auch für Masterstudierende, die im Rahmen eines längerfristigen Praktikums praktische Erfahrungen in einer Produktions-ML-Umgebung sammeln möchten.
Dein ProfilBasis-Qualifikationen
Du passt super zu uns, wenn Folgendes auf dich zutrifft:
- Gute Deutschkenntnisse in Wort und Schrift (mindestens Niveau C1) – du wirst mit medizinischen Datenexporten und Dokumentationen in deutscher Sprache arbeiten.
- Master-Abschluss in Informatik, Data Science, Informationssystemen oder einem verwandten technischen Bereich (oder gleichwertige praktische Erfahrung).
- Du übernimmst Verantwortung für deine Arbeit und legst Wert auf exzellente Ergebnisse.
- Starke Python-Programmierkenntnisse.
- Solides Verständnis von SQL und relationalen Datenbanken.
- Vertrautheit mit Konzepten und Tools der Datenverarbeitung (pandas, Polars, DuckDB).
- Sicherer Umgang mit der Linux-Kommandozeile und Git.
- Effektive Kommunikationsfähigkeit in Wort und Schrift, sowohl in Deutsch als auch in Englisch.
- Hohe Detailgenauigkeit und ein echtes Engagement für Datenqualität.
- Ein strukturierter Arbeitsstil, der es dir ermöglicht, nach der Einarbeitung mit minimaler Anleitung zu arbeiten.
Bevorzugte Qualifikationen
Bevorzugte Qualifikationen
Bevorzugte Qualifikationen sind genau das – auch wenn du nicht alle davon mitbringst, möchten wir dich trotzdem kennenlernen!
- Erfahrung mit Docker und containerisierten Deployments.
- Vertrautheit mit der Postgre
SQL-Administration. - Erfahrung im Aufbau von Datenpipelines oder ETL-Prozessen.
- Hintergrund in Analytics, Data Engineering oder Backend-Entwicklung.
- Vertrautheit mit medizinischen Daten oder regulierten Umgebungen (Kenntnis der DSGVO).
- Erfahrung mit Python-Web-Frameworks (FastAPI, Django, Flask, Streamlit, NiceGUI).
Flexibles Arbeiten
Im…
Um nach Stellen zu suchen, sie anzusehen und sich zu bewerben, die Bewerbungen aus Ihrem Standort oder Land akzeptieren, klicken Sie hier, um eine Suche zu starten: