Data Engineer/Scientist
Aktualisiert am 12.04.2024
Profil
Mitarbeiter eines Dienstleisters
Remote-Arbeit
Verfügbar ab: 01.08.2024
Verfügbar zu: 100%
davon vor Ort: 80%
Skill-Profil eines fest angestellten Mitarbeiters des Dienstleisters

Einsatzorte

Einsatzorte

Essen (+75km) Ibbenbüren (+75km) Cochem (+75km) Bonn (+75km) Soest (+50km)
möglich

Projekte

Projekte

1 Jahr
2023-05 - 2024-04

Erstellung analytischer Auswertungen

Data Scientist Python SQL Statis
Data Scientist

  • Entwicklung und Operationalisierung von Machine Learning Modellen.
  • Erarbeitung und Anwendung von statistischen Verfahren zum Zwecke der Datenanalyse.
  • Aggregation und effiziente Auswertung großer Datenmengen mit SQL.
  • Entwicklung von Datenverarbeitungsstrecken.
  • Visualisierung von Daten in Tableau und Plotly.

Jupyter Tableau
Python SQL Statis
3 Monate
2023-01 - 2023-03

Aufbau Datenverarbeitungsstrecke für Messdaten

Entwickler
Entwickler
  • Datenrestauration für fehlerhafte Messdaten
  • Explorative Datenanylse
  • Bereinigung und Aufbereitung von Daten
  • Analyse von Zeitreihendaten
  • Interpolation fehlender Werte
  • Erstellung parametrisierter Notebooks für eine Datenbereinigungspipeline (papermill)
  • Erstellung von Dokumentation für Pipelinenutzer 
Python Jupyter MongoDB Docker Statistik
10 Monate
2022-03 - 2022-12

Analyse von Gesprächsinhalten

Data Analyst SQL Tableau Oracle ...
Data Analyst
  • Management der Datenverarbeitungsstrecke

  • Bereinigung und Aufbereitung von Daten

  • Explorative Datenanalyse

  • Sprachanalyse für Hotline-Calls

  • Anforderungsanalyse und Kommunikation mit Stakeholdern

  • Datenvisualisierung und Erstellung von Dashboards

  • Ausführung von Analyseaufträgen

  • Erstellung von Schulungsunterlagen für Nutzer

Tableau SQL Oracle Verint Speech Analytics Statistik
SQL Tableau Oracle Verint Speech Analytics Statistik
6 Monate
2021-10 - 2022-03

Treiberanalyse Mitarbeiterfluktuation

Data Scientist Python Pandas Seaborn ...
Data Scientist

  • Bereinigung und Aufbereitung von Daten
  • Explorative Datenanalyse, Korrelationsanalyse
  • Treiberanalyse zur Identifikation von Fluktuationsursachen bei Mitarbeitern
  • Visualisierung
  • Sekundärforschung
  • Agile Methodik
  • Verwendung von logistischer Regression und Gradient Boost Klassifikationen
R R-Studio Jupyter Gitlab
Python Pandas Seaborn PySpark dplyr ggplot
Remote
6 Monate
2021-04 - 2021-09

Prognostizierung von Heizungsverbräuchen im Energieumfeld

Data Engineer / Developer Python Statistik
Data Engineer / Developer
  • ETL-Prozesse entwickeln und betreuen 
  • Rohdaten prüfen und bereinigen 
  • Datenexploration 
  • Verarbeitung, Analyse und Plotting von geographischen Daten
  • Programmatische Umsetzung von technischen Vorgaben und Geschäftslogik Analyse von Verbrauchsdaten und Erstellung von Zukunftsszenarien Einbindung lokaler und cloudbasierter Datenbanken 
  • Vorbereitung und Export von Daten für verschiedene Tools 
  • Aufbereitung und Präsentation der Ergebnisse
Python( papermills geopandas sklearn matplotlib) KNN - Classifier AWS CodeCommit Jupyter PostgreSQL
Python Statistik
Bergheim
4 Monate
2021-01 - 2021-04

Co-Entwicklung eines Datenexplorations- und Analyse-Tools

Data Scientist / Developer R-Programmierung Machine Learning Random Forest ...
Data Scientist / Developer
  • Entwicklung einer reaktiven Analyse-App für explorative Datenanalyse
  • Codemanagement (gitlab)
  • Erstellen von Visualisierungen und Grafiken
  • Debugging
R-Studio R-Shiny
R-Programmierung Machine Learning Random Forest Clustering
Remote
4 Monate
2020-10 - 2021-01

Customer Churn Analyse (Telekommunikation)

Data Scientist Python Statistik GCP ...
Data Scientist
  • Datenexploration
  • Data Preprocessing & Scaling
  • Vorhersage der Abwanderungswahrscheinlichkeit
  • Cross-Validation
  • Gradient Boosting (AdaBoost, XGBoost, CatBoost)
  • Deployment eines ML-Vorhersagemodells auf GCP
  • Implementierung einer Rest-API zur Vorhersage
  • Erstellung einer Dashboard-Visualisierung auf Basis von dash
Spyder GCP dash
Python Statistik GCP ML
Remote
10 Monate
2020-01 - 2020-10

Analyse der Nutzungsmotivation von Medieninhalten & Audience Research

Data Scientist/Developer Python Statistik SQL ...
Data Scientist/Developer
  • Datenexploration und Visualisierung
  • Live-Streaming
  • Faktorenanalyse
  • Bereinigung und Analyse von Datensätzen
  • Präsentation und Kommunikation der Ergebnisse
  • Mitwirkung in qualitativen und quantitativen Forschungsprojekten
  • Recherchetätigkeiten/Sekundärforschung
  • Agile Arbeit
Tableau SPSS R-Shiny
Python Statistik SQL R-Programmierung
Köln
7 Monate
2019-06 - 2019-12

Schätzung von Versicherungszahlungen

Data Scientist/Developer lineare Regression Outliers Influence (Statsmodels) Statistik ...
Data Scientist/Developer
  • Datenexploration und Visualisierung
  • Auffinden von Korrelationen
  • Data Preprocessing / Skalierung
  • Aufbau von linearen Modellen
  • Analyse der Residuen auf Normalität
  • Modelinterpretation und Annahmen
  • Evaluation der Vorhersage
lineare Regression Outliers Influence (Statsmodels) Statistik Python Jupyter
6 Monate
2019-01 - 2019-06

Entwicklung von Vorhersagemodellen zu Hauspreisen

Data Scientist/Developer TensorFlow Python Jupyter ...
Data Scientist/Developer
  • Datenexploration und Visualisierung
  • Data Preprocessing
  • Aufbau eines neuronalen Netzwerks
  • Evaluierung der Ergebnisse
TensorFlow Python Jupyter Sequential Neural Network

Aus- und Weiterbildung

Aus- und Weiterbildung

2 Jahre 1 Monat
2018-10 - 2020-10

Sociology and Social Research

Master of Science, Universität zu Köln
Master of Science
Universität zu Köln
3 Jahre 1 Monat
2015-10 - 2018-10

Soziologie

Bachelor of Arts, Otto-Friedrich-Universität Bamberg
Bachelor of Arts
Otto-Friedrich-Universität Bamberg

Position

Position

Data Science Consultant mit Schwerpunkt auf klassischer Statistik (Regressions-modelle, Faktorenanalyse, Clusteranalyse, etc.) und Machine Learning (KM/KNN Clustering, Random Forests, Boosting etc.).

Sehr gute Erfahrung in Python und R, Tableau und SQL, hervorragender Teamplayer, beherrscht den Aufbau von Vorhersagemodellen, agile Entwicklung von Datenstrecken und Datenexploration/Visualisierung.

Kompetenzen

Kompetenzen

Produkte / Standards / Erfahrungen / Methoden

Clustering
dash
Jupyter
lineare Regression
Machine Learning
ML
Outliers Influence (Statsmodels)
R
Random Forest
Random Forest Classifiers
SPSS
SPSS
Spyder
Statistik
Statistik
Stochastic Gradient Descent
Support Vector Classifier
Tableau
TensorFlow

Programmiersprachen

Python
R
R-Programmierung
R-Studio

Datenbanken

AWS
GCP
SQL

Design / Entwicklung / Konstruktion

Sequential Neural Network

Branchen

Branchen

  • Medien und Telekommunikation
  • Versicherung
  • Immobilien

Einsatzorte

Einsatzorte

Essen (+75km) Ibbenbüren (+75km) Cochem (+75km) Bonn (+75km) Soest (+50km)
möglich

Projekte

Projekte

1 Jahr
2023-05 - 2024-04

Erstellung analytischer Auswertungen

Data Scientist Python SQL Statis
Data Scientist

  • Entwicklung und Operationalisierung von Machine Learning Modellen.
  • Erarbeitung und Anwendung von statistischen Verfahren zum Zwecke der Datenanalyse.
  • Aggregation und effiziente Auswertung großer Datenmengen mit SQL.
  • Entwicklung von Datenverarbeitungsstrecken.
  • Visualisierung von Daten in Tableau und Plotly.

Jupyter Tableau
Python SQL Statis
3 Monate
2023-01 - 2023-03

Aufbau Datenverarbeitungsstrecke für Messdaten

Entwickler
Entwickler
  • Datenrestauration für fehlerhafte Messdaten
  • Explorative Datenanylse
  • Bereinigung und Aufbereitung von Daten
  • Analyse von Zeitreihendaten
  • Interpolation fehlender Werte
  • Erstellung parametrisierter Notebooks für eine Datenbereinigungspipeline (papermill)
  • Erstellung von Dokumentation für Pipelinenutzer 
Python Jupyter MongoDB Docker Statistik
10 Monate
2022-03 - 2022-12

Analyse von Gesprächsinhalten

Data Analyst SQL Tableau Oracle ...
Data Analyst
  • Management der Datenverarbeitungsstrecke

  • Bereinigung und Aufbereitung von Daten

  • Explorative Datenanalyse

  • Sprachanalyse für Hotline-Calls

  • Anforderungsanalyse und Kommunikation mit Stakeholdern

  • Datenvisualisierung und Erstellung von Dashboards

  • Ausführung von Analyseaufträgen

  • Erstellung von Schulungsunterlagen für Nutzer

Tableau SQL Oracle Verint Speech Analytics Statistik
SQL Tableau Oracle Verint Speech Analytics Statistik
6 Monate
2021-10 - 2022-03

Treiberanalyse Mitarbeiterfluktuation

Data Scientist Python Pandas Seaborn ...
Data Scientist

  • Bereinigung und Aufbereitung von Daten
  • Explorative Datenanalyse, Korrelationsanalyse
  • Treiberanalyse zur Identifikation von Fluktuationsursachen bei Mitarbeitern
  • Visualisierung
  • Sekundärforschung
  • Agile Methodik
  • Verwendung von logistischer Regression und Gradient Boost Klassifikationen
R R-Studio Jupyter Gitlab
Python Pandas Seaborn PySpark dplyr ggplot
Remote
6 Monate
2021-04 - 2021-09

Prognostizierung von Heizungsverbräuchen im Energieumfeld

Data Engineer / Developer Python Statistik
Data Engineer / Developer
  • ETL-Prozesse entwickeln und betreuen 
  • Rohdaten prüfen und bereinigen 
  • Datenexploration 
  • Verarbeitung, Analyse und Plotting von geographischen Daten
  • Programmatische Umsetzung von technischen Vorgaben und Geschäftslogik Analyse von Verbrauchsdaten und Erstellung von Zukunftsszenarien Einbindung lokaler und cloudbasierter Datenbanken 
  • Vorbereitung und Export von Daten für verschiedene Tools 
  • Aufbereitung und Präsentation der Ergebnisse
Python( papermills geopandas sklearn matplotlib) KNN - Classifier AWS CodeCommit Jupyter PostgreSQL
Python Statistik
Bergheim
4 Monate
2021-01 - 2021-04

Co-Entwicklung eines Datenexplorations- und Analyse-Tools

Data Scientist / Developer R-Programmierung Machine Learning Random Forest ...
Data Scientist / Developer
  • Entwicklung einer reaktiven Analyse-App für explorative Datenanalyse
  • Codemanagement (gitlab)
  • Erstellen von Visualisierungen und Grafiken
  • Debugging
R-Studio R-Shiny
R-Programmierung Machine Learning Random Forest Clustering
Remote
4 Monate
2020-10 - 2021-01

Customer Churn Analyse (Telekommunikation)

Data Scientist Python Statistik GCP ...
Data Scientist
  • Datenexploration
  • Data Preprocessing & Scaling
  • Vorhersage der Abwanderungswahrscheinlichkeit
  • Cross-Validation
  • Gradient Boosting (AdaBoost, XGBoost, CatBoost)
  • Deployment eines ML-Vorhersagemodells auf GCP
  • Implementierung einer Rest-API zur Vorhersage
  • Erstellung einer Dashboard-Visualisierung auf Basis von dash
Spyder GCP dash
Python Statistik GCP ML
Remote
10 Monate
2020-01 - 2020-10

Analyse der Nutzungsmotivation von Medieninhalten & Audience Research

Data Scientist/Developer Python Statistik SQL ...
Data Scientist/Developer
  • Datenexploration und Visualisierung
  • Live-Streaming
  • Faktorenanalyse
  • Bereinigung und Analyse von Datensätzen
  • Präsentation und Kommunikation der Ergebnisse
  • Mitwirkung in qualitativen und quantitativen Forschungsprojekten
  • Recherchetätigkeiten/Sekundärforschung
  • Agile Arbeit
Tableau SPSS R-Shiny
Python Statistik SQL R-Programmierung
Köln
7 Monate
2019-06 - 2019-12

Schätzung von Versicherungszahlungen

Data Scientist/Developer lineare Regression Outliers Influence (Statsmodels) Statistik ...
Data Scientist/Developer
  • Datenexploration und Visualisierung
  • Auffinden von Korrelationen
  • Data Preprocessing / Skalierung
  • Aufbau von linearen Modellen
  • Analyse der Residuen auf Normalität
  • Modelinterpretation und Annahmen
  • Evaluation der Vorhersage
lineare Regression Outliers Influence (Statsmodels) Statistik Python Jupyter
6 Monate
2019-01 - 2019-06

Entwicklung von Vorhersagemodellen zu Hauspreisen

Data Scientist/Developer TensorFlow Python Jupyter ...
Data Scientist/Developer
  • Datenexploration und Visualisierung
  • Data Preprocessing
  • Aufbau eines neuronalen Netzwerks
  • Evaluierung der Ergebnisse
TensorFlow Python Jupyter Sequential Neural Network

Aus- und Weiterbildung

Aus- und Weiterbildung

2 Jahre 1 Monat
2018-10 - 2020-10

Sociology and Social Research

Master of Science, Universität zu Köln
Master of Science
Universität zu Köln
3 Jahre 1 Monat
2015-10 - 2018-10

Soziologie

Bachelor of Arts, Otto-Friedrich-Universität Bamberg
Bachelor of Arts
Otto-Friedrich-Universität Bamberg

Position

Position

Data Science Consultant mit Schwerpunkt auf klassischer Statistik (Regressions-modelle, Faktorenanalyse, Clusteranalyse, etc.) und Machine Learning (KM/KNN Clustering, Random Forests, Boosting etc.).

Sehr gute Erfahrung in Python und R, Tableau und SQL, hervorragender Teamplayer, beherrscht den Aufbau von Vorhersagemodellen, agile Entwicklung von Datenstrecken und Datenexploration/Visualisierung.

Kompetenzen

Kompetenzen

Produkte / Standards / Erfahrungen / Methoden

Clustering
dash
Jupyter
lineare Regression
Machine Learning
ML
Outliers Influence (Statsmodels)
R
Random Forest
Random Forest Classifiers
SPSS
SPSS
Spyder
Statistik
Statistik
Stochastic Gradient Descent
Support Vector Classifier
Tableau
TensorFlow

Programmiersprachen

Python
R
R-Programmierung
R-Studio

Datenbanken

AWS
GCP
SQL

Design / Entwicklung / Konstruktion

Sequential Neural Network

Branchen

Branchen

  • Medien und Telekommunikation
  • Versicherung
  • Immobilien

Vertrauen Sie auf Randstad

Im Bereich Freelancing
Im Bereich Arbeitnehmerüberlassung / Personalvermittlung

Fragen?

Rufen Sie uns an +49 89 500316-300 oder schreiben Sie uns:

Das Freelancer-Portal

Direktester geht's nicht! Ganz einfach Freelancer finden und direkt Kontakt aufnehmen.