Data Scientist (Hintergrund in Statistik) & Zertifizierter Data Engineer (DP-203)
Aktualisiert am 15.11.2024
Profil
Mitarbeiter eines Dienstleisters
Remote-Arbeit
Verfügbar ab: 15.11.2024
Verfügbar zu: 80%
davon vor Ort: 50%
Skill-Profil eines fest angestellten Mitarbeiters des Dienstleisters

Einsatzorte

Einsatzorte

Wien (+200km) München (+200km) Zürich (+200km) Salzburg (Österreich) (+200km) Graz (+200km)
Deutschland, Schweiz, Österreich
möglich

Projekte

Projekte

1 Jahr
2024-01 - 2024-12

Data Engineering Projekt für einen Kunden im Bereich Eisenbahninfrastruktur

Data Engineer Python Data Vault
Data Engineer
  • Entwicklung und Pflege eines skalierbaren Data-Engineering-Frameworks auf Databricks, das sowohl Data Vault 2.0- als auch Data-Lake-Architekturen für End-to-End-Verarbeitungen unterstützt.
  • Erstellung eines Generators für synthetische Daten und Implementierung automatisierter Tests (Unit, System, End-to-End), um die Robustheit und Genauigkeit des Frameworks zu verbessern.
  • Aufbau und Verwaltung von Azure-Synapse-Pipelines, Optimierung von Workflows im Code und Behebung von Verarbeitungsfehlern zur Steigerung der Leistung und Minimierung von Ausfallzeiten.
  • Zusammenarbeit in einem englischsprachigen, agilen Team mit Verantwortung für Versionskontrolle (Azure DevOps, Git), Dokumentation und Wissensaustausch im Team.
Azure DevOps Git) Databricks
Python Data Vault
Eisenbahninfrastrukturunternehmen
Wien
5 Monate
2024-04 - 2024-08

RAG-Backend für Empfehlung von Website-Verbesserungen

Data Engineer / Scientist Python Large Language Models OpenAI
Data Engineer / Scientist
  • Entwicklung eines Backends zur Automatisierung von Website-Verbesserung-Empfehlungen mithilfe von LLMs.
  • Feintuning des LLM über die OpenAI-API zur Erstellung genauer und personalisierter Inhalte.
  • Durchführung umfassender Tests und Audits, um Halluzinationen zu minimieren und robuste Empfehlungen zu gewährleisten.
Python Large Language Models OpenAI
Remote
5 Monate
2023-11 - 2024-03

Automatisiertes Web-Scraping für personalisierte Werbung

Data Engineer / Scientist Python Docker Kubernetes ...
Data Engineer / Scientist
  • Entwicklung eines Web-Scraping-Bots auf Basis von Selenium für Psychotherapeuten-Websites, um zielgerichtete Werbung durch dynamische Website-Navigation zu ermöglichen.
  • Optimierung der Datenverarbeitung mit Pandas und Azure Storage, Speicherung der Ergebnisse in der Azure-Infrastruktur.
  • Automatisierte Bereitstellung der Lösung mit Docker, Azure Container Storage und Azure Kubernetes Service für eine skalierbare Ausführung.
Python Docker Kubernetes Azure
Remote
4 Monate
2023-11 - 2024-02

Lead-Matching für Industriekunden

Data Engineer / Scientist Python
Data Engineer / Scientist

  • Einsatz von NLP-Techniken zur Abgleichung inkonsistenter Lead- und Kundendaten, was die Datenkonsistenz erheblich verbesserte.
  • Bewertung des Automatisierungspotenzials für das Lead-Matching, um Kundenbeziehungsprozesse effizienter zu gestalten.
  • Automatisierte Bereitstellung der Lösung mit Docker, Azure Container Storage und Azure Kubernetes Service, um eine effiziente Skalierbarkeit zu gewährleisten.
Python
Industriekunden
Remote

Aus- und Weiterbildung

Aus- und Weiterbildung

1 Jahr 10 Monate
2023-09 - 2025-06

Master of Science in Data Science

Master of Science in Data Science, University of Applied Sciences Technikum Vienna Vienna
Master of Science in Data Science
University of Applied Sciences Technikum Vienna Vienna
Thesis: Scenario-Driven Benchmarking of GANs, VAEs, and LLMs for Synthetic Tabular Data Generation
1 Monat
2024-02 - 2024-02

Microsoft - Data Engineer Associate

Microsoft
Microsoft
Advanced skills in data engineering capabilities on Microsoft Azure.
1 Monat
2024-02 - 2024-02

Databricks Certified Machine Learning Associate

Databricks
Databricks
The Databricks Certified Machine Learning Associate certification exam assesses an individual?s ability to use Databricks to perform basic machine learning tasks. This includes an ability to understand and use Databricks Machine Learning and its capabilities like AutoML, Feature Store, and select capabilities of MLflow. It also assesses the ability to make correct decisions in machine learning workflows and implement those workflows using Spark ML. Finally, an ability to understand advanced characteristics of scaling machine learning models is assessed. Individuals who pass this certification exam can be expected to complete basic machine learning tasks using Databricks and its associated tools.
2 Jahre 4 Monate
2020-10 - 2023-01

Bachelor of Science in Statistics

Bachelor of Science in Statistics, University of Vienna
Bachelor of Science in Statistics
University of Vienna
Thesis: A Comparison Of Projection and Penalization Methods for Latent Factor Linear Models

Position

Position

Ich bin ein vielseitiger Data Engineer und Scientist mit fundiertem Wissen in der Entwicklung skalierbarer Datenlösungen und modernster Machine-Learning-Technologien. Mit meiner Erfahrung in der Arbeit an komplexen Datenprojekten über verschiedene Branchen hinweg, biete ich Expertise in der Optimierung von Datenarchitekturen, der Automatisierung von Prozessen und der Entwicklung innovativer KI-gestützter Anwendungen.

  • Aufbau skalierbarer Datenframeworks mit Technologien wie Databricks und Azure Synapse. Fokus auf Data Vault 2.0 und Data-Lake-Architekturen zur effizienten End-to-End-Verarbeitung großer Datenmengen.

  • Entwicklung und Deployment automatisierter Lösungen für Datenanalysen, Web Scraping und personalisierte Inhalte. Einsatz von Docker und Kubernetes für maximale Skalierbarkeit.

  • Anwendung von NLP-Techniken zur Datenanreicherung und Lead-Matching sowie Feinabstimmung von LLMs zur Generierung personalisierter Inhalte.

  • Implementierung synthetischer Datenmodelle und automatisierter Tests zur Sicherstellung der Datenqualität und Systemrobustheit.

  • Tiefes Verständnis von Python, SQL und weiteren Tools wie Azure DevOps, Pandas, PySpark, Docker und Kubernetes.

  • Arbeit in agilen, englischsprachigen Teams, mit Fokus auf Kollaboration und Dokumentation zur Förderung des Wissensaustauschs.

Mit meiner Leidenschaft für datengetriebene Innovationen und meiner Fähigkeit, technische Herausforderungen pragmatisch zu lösen, strebe ich danach, Unternehmen dabei zu unterstützen, das Potenzial ihrer Daten vollständig auszuschöpfen.

Kompetenzen

Kompetenzen

Produkte / Standards / Erfahrungen / Methoden

Python
Experte
R
Experte
SQL
Experte
Databricks
Fortgeschritten
Azure
Fortgeschritten
Docker
Fortgeschritten
Git
Fortgeschritten
Jira
Fortgeschritten
SAFe
Fortgeschritten
Kubernetes
Fortgeschritten

Einsatzorte

Einsatzorte

Wien (+200km) München (+200km) Zürich (+200km) Salzburg (Österreich) (+200km) Graz (+200km)
Deutschland, Schweiz, Österreich
möglich

Projekte

Projekte

1 Jahr
2024-01 - 2024-12

Data Engineering Projekt für einen Kunden im Bereich Eisenbahninfrastruktur

Data Engineer Python Data Vault
Data Engineer
  • Entwicklung und Pflege eines skalierbaren Data-Engineering-Frameworks auf Databricks, das sowohl Data Vault 2.0- als auch Data-Lake-Architekturen für End-to-End-Verarbeitungen unterstützt.
  • Erstellung eines Generators für synthetische Daten und Implementierung automatisierter Tests (Unit, System, End-to-End), um die Robustheit und Genauigkeit des Frameworks zu verbessern.
  • Aufbau und Verwaltung von Azure-Synapse-Pipelines, Optimierung von Workflows im Code und Behebung von Verarbeitungsfehlern zur Steigerung der Leistung und Minimierung von Ausfallzeiten.
  • Zusammenarbeit in einem englischsprachigen, agilen Team mit Verantwortung für Versionskontrolle (Azure DevOps, Git), Dokumentation und Wissensaustausch im Team.
Azure DevOps Git) Databricks
Python Data Vault
Eisenbahninfrastrukturunternehmen
Wien
5 Monate
2024-04 - 2024-08

RAG-Backend für Empfehlung von Website-Verbesserungen

Data Engineer / Scientist Python Large Language Models OpenAI
Data Engineer / Scientist
  • Entwicklung eines Backends zur Automatisierung von Website-Verbesserung-Empfehlungen mithilfe von LLMs.
  • Feintuning des LLM über die OpenAI-API zur Erstellung genauer und personalisierter Inhalte.
  • Durchführung umfassender Tests und Audits, um Halluzinationen zu minimieren und robuste Empfehlungen zu gewährleisten.
Python Large Language Models OpenAI
Remote
5 Monate
2023-11 - 2024-03

Automatisiertes Web-Scraping für personalisierte Werbung

Data Engineer / Scientist Python Docker Kubernetes ...
Data Engineer / Scientist
  • Entwicklung eines Web-Scraping-Bots auf Basis von Selenium für Psychotherapeuten-Websites, um zielgerichtete Werbung durch dynamische Website-Navigation zu ermöglichen.
  • Optimierung der Datenverarbeitung mit Pandas und Azure Storage, Speicherung der Ergebnisse in der Azure-Infrastruktur.
  • Automatisierte Bereitstellung der Lösung mit Docker, Azure Container Storage und Azure Kubernetes Service für eine skalierbare Ausführung.
Python Docker Kubernetes Azure
Remote
4 Monate
2023-11 - 2024-02

Lead-Matching für Industriekunden

Data Engineer / Scientist Python
Data Engineer / Scientist

  • Einsatz von NLP-Techniken zur Abgleichung inkonsistenter Lead- und Kundendaten, was die Datenkonsistenz erheblich verbesserte.
  • Bewertung des Automatisierungspotenzials für das Lead-Matching, um Kundenbeziehungsprozesse effizienter zu gestalten.
  • Automatisierte Bereitstellung der Lösung mit Docker, Azure Container Storage und Azure Kubernetes Service, um eine effiziente Skalierbarkeit zu gewährleisten.
Python
Industriekunden
Remote

Aus- und Weiterbildung

Aus- und Weiterbildung

1 Jahr 10 Monate
2023-09 - 2025-06

Master of Science in Data Science

Master of Science in Data Science, University of Applied Sciences Technikum Vienna Vienna
Master of Science in Data Science
University of Applied Sciences Technikum Vienna Vienna
Thesis: Scenario-Driven Benchmarking of GANs, VAEs, and LLMs for Synthetic Tabular Data Generation
1 Monat
2024-02 - 2024-02

Microsoft - Data Engineer Associate

Microsoft
Microsoft
Advanced skills in data engineering capabilities on Microsoft Azure.
1 Monat
2024-02 - 2024-02

Databricks Certified Machine Learning Associate

Databricks
Databricks
The Databricks Certified Machine Learning Associate certification exam assesses an individual?s ability to use Databricks to perform basic machine learning tasks. This includes an ability to understand and use Databricks Machine Learning and its capabilities like AutoML, Feature Store, and select capabilities of MLflow. It also assesses the ability to make correct decisions in machine learning workflows and implement those workflows using Spark ML. Finally, an ability to understand advanced characteristics of scaling machine learning models is assessed. Individuals who pass this certification exam can be expected to complete basic machine learning tasks using Databricks and its associated tools.
2 Jahre 4 Monate
2020-10 - 2023-01

Bachelor of Science in Statistics

Bachelor of Science in Statistics, University of Vienna
Bachelor of Science in Statistics
University of Vienna
Thesis: A Comparison Of Projection and Penalization Methods for Latent Factor Linear Models

Position

Position

Ich bin ein vielseitiger Data Engineer und Scientist mit fundiertem Wissen in der Entwicklung skalierbarer Datenlösungen und modernster Machine-Learning-Technologien. Mit meiner Erfahrung in der Arbeit an komplexen Datenprojekten über verschiedene Branchen hinweg, biete ich Expertise in der Optimierung von Datenarchitekturen, der Automatisierung von Prozessen und der Entwicklung innovativer KI-gestützter Anwendungen.

  • Aufbau skalierbarer Datenframeworks mit Technologien wie Databricks und Azure Synapse. Fokus auf Data Vault 2.0 und Data-Lake-Architekturen zur effizienten End-to-End-Verarbeitung großer Datenmengen.

  • Entwicklung und Deployment automatisierter Lösungen für Datenanalysen, Web Scraping und personalisierte Inhalte. Einsatz von Docker und Kubernetes für maximale Skalierbarkeit.

  • Anwendung von NLP-Techniken zur Datenanreicherung und Lead-Matching sowie Feinabstimmung von LLMs zur Generierung personalisierter Inhalte.

  • Implementierung synthetischer Datenmodelle und automatisierter Tests zur Sicherstellung der Datenqualität und Systemrobustheit.

  • Tiefes Verständnis von Python, SQL und weiteren Tools wie Azure DevOps, Pandas, PySpark, Docker und Kubernetes.

  • Arbeit in agilen, englischsprachigen Teams, mit Fokus auf Kollaboration und Dokumentation zur Förderung des Wissensaustauschs.

Mit meiner Leidenschaft für datengetriebene Innovationen und meiner Fähigkeit, technische Herausforderungen pragmatisch zu lösen, strebe ich danach, Unternehmen dabei zu unterstützen, das Potenzial ihrer Daten vollständig auszuschöpfen.

Kompetenzen

Kompetenzen

Produkte / Standards / Erfahrungen / Methoden

Python
Experte
R
Experte
SQL
Experte
Databricks
Fortgeschritten
Azure
Fortgeschritten
Docker
Fortgeschritten
Git
Fortgeschritten
Jira
Fortgeschritten
SAFe
Fortgeschritten
Kubernetes
Fortgeschritten

Vertrauen Sie auf Randstad

Im Bereich Freelancing
Im Bereich Arbeitnehmerüberlassung / Personalvermittlung

Fragen?

Rufen Sie uns an +49 89 500316-300 oder schreiben Sie uns:

Das Freelancer-Portal

Direktester geht's nicht! Ganz einfach Freelancer finden und direkt Kontakt aufnehmen.