Data Scientist, spezialisiert auf Machine Learning, Deep Learning, und die Entwicklung maßgeschneiderter, effizienter Algorithmen.
Aktualisiert am 30.10.2024
Profil
Freiberufler / Selbstständiger
Verfügbar ab: 30.10.2024
Verfügbar zu: 100%
davon vor Ort: 100%
Data Science
R
Python
Deutsch
Muttersprache
Englisch
Fließend (C2)
Spanisch
Grundkenntnisse (A2)

Einsatzorte

Einsatzorte

München (+100km) Nürnberg (+50km) Mindelheim (+100km) Erlangen (+100km) Deggendorf (+75km)
nicht möglich

Projekte

Projekte

10 Jahre 1 Monat
2014-12 - heute

Dozententätigkeit

Dozent
Dozent
  • Halten und Weiterentwickeln der Kurse ?Data Science Methodenkurs?, ?Praktische Datenanalyse mit R? und ?Programmieren mit R?
Essential Data Science GmbH, München
1 Jahr 1 Monat
2023-10 - 2024-10

Implementierung einer Testsuite zur Erstellung einer stabilen Datenpipeline

Data Scientist / Data Engineer
Data Scientist / Data Engineer
  • Skalierung, Optimierung und Modularisierung des bestehenden Prototypcodes zu einer produktionsreifen Geschäftsanwendung
  • Implementierung einer Testsuite zur Erstellung einer stabilen Datenpipeline
  • Algorithmusoptimierung und Erweiterung der Anwendung auf neue Funktionen
Python AWS pytest kedro pandas scikit-learn xgboost pandera pydantic git Jira Agile
Pharma-Unternehmen
München
2 Monate
2023-09 - 2023-10

Klinische Simulationsstudie

  • Programmierung einer Simulation zur Power-Bestimmung einer klinischen Studie in von den statistischen Annahmen abweichenden realen Szenarien
R RStudio
Pharma-Unternehmen
Utrecht, Niederlande
5 Monate
2022-11 - 2023-03

Shape Risk Management

Data Scientist
Data Scientist
  • Entwicklung browserbasierter interaktiver Risiko-Reports für Shape und Performance einer PFC für Strompreise
Python streamlit pandas Azure DevOps git Jira scikit-learn Agile
E.ON SE
Essen
2 Jahre 6 Monate
2020-05 - 2022-10

Energy Trading

Data Engineer
Data Engineer
  • Entwicklung einer Datenverarbeitungspipeline die die Wirtschaftlichkeit für Energiekontrakte berechnet
  • Migration eines Datenverarbeitungssystems von Palantir Foundry nach Amazon Web Services
  • Erstellung von Analysen und Reports für Anwender aus dem Handel
Palantir Foundry AWS (Lambda; Glue; S3; SageMaker) Python pySpark SQL Azure DevOps
EnBW AG
Karlsruhe
1 Jahr 8 Monate
2020-05 - 2021-12

Management und Entwicklung einer Data Pipeline in Palantir Foundry

Cloud Data Engineer Python PySpark Palantir Foundry ...
Cloud Data Engineer
  • Entwicklung einer Datenverarbeitungspipeline die die Wirtschaftlichkeit für Energiekontrakte berechnet
  • Migration eines Datenverarbeitungssystems von Palantir Foundry nach Amazon Web Services
  • Erstellung von Analysen und Reports für Anwender aus dem Handel
Python PySpark Palantir Foundry AWS (Lambda Glue S3 SageMaker) pySpark SQL Azure DevOps
EnBW AG, Karlsruhe
Remote
4 Monate
2020-09 - 2020-12

Klinische Studie

  • Durchführung einer klinischen Studie zum Vergleich von sGPVI-Blutwerten in Placebo- und Treatment Gruppen
R RStudio
Pharma-Unternehmen
München
1 Jahr 8 Monate
2018-08 - 2020-03

End-to-End Deployment

Full Stack Data Scientist, Energy Analytics Python xgboost Spark ...
Full Stack Data Scientist, Energy Analytics
  • End-to-End Deployment eines Prognosemodells für Stromgeneration auf Microsoft Azure
  • Entwickelte Python-Paket für Prognosemodelle von Energieverbrauch von Privathaushalten
  • Entwickelte Modelle zur Anomalieerkennung von ungewöhnlichem Stromverbrauch
Python xgboost Spark Azure Cloud Docker Databricks git Jira
E.ON SE
München
4 Monate
2018-04 - 2018-07

Big Data Engineering

AWS Spark Hadoop ...
  • Implementierte eine Datenverarbeitungs-Pipeline, von gelieferten Daten in einen internen Hive-Speicher, mit Spark in Python und R
AWS Spark Hadoop Python Hive Databricks R
aifora GmbH
Düsseldorf
4 Monate
2018-04 - 2018-07

Predictive Analytics

Python scikit-learn Jupyter ...

  • Programmierte ein Modell zur automatischen Berechnung von Einstellungen von Fitnessgeräten aufgrund von Körpersegmentlängen

Python scikit-learn Jupyter Scrum/Agile
Milon Care GmbH
11 Monate
2017-05 - 2018-03

Automatische Fehlerkorrektur in Zeitreihen

Data Scientist R RStudio Shiny ...
Data Scientist
Drei Folgeaufträge:
  • Erstellte ein Programm zum automatischen Pricing von Kundenanfragen
  • Entwarf und programmierte einen Algorithmus zur Generierung von Price Forward Curves für Strompreise, von Stunden- bis Monatsgranularität
  • Programmierte eine Shiny-Applikation zur explorativen Einstellung von Parametern für einen Handelsalgorithmus
  • Optimierte die Laufzeit eines R-Programms zum realtime-Pricing von Handelsdaten von 120 Sekunden pro Iteration auf 15 Sekunden
R RStudio Shiny VBA
Trumpf AG
Ditzingen (Remote)
2 Monate
2018-01 - 2018-02

Search Engine Optimization

Amazon Web Services (EC2) R
  • Webseiten-Audit mit sitespeed.io
  • Setup einer AWS-Instanz zum Web-crawling mit Sitebulb
  • Mitarbeit an einem Algorithmus zum automatischen Vorschlagen von Keywords für Webseiten
Amazon Web Services (EC2) R
Artios.io
London (remote)
6 Monate
2017-05 - 2017-10

Automatische Fehlerkorrektur in Zeitreihen

  • Entwickelte einen Algorithmus, der automatisch falsche Werte in Zählerständen erkennt und korrigiert
R
Trumpf AG
Ditzingen
6 Monate
2017-01 - 2017-06

Mitentwicklung an einem Produktempfehlungssystem

Data Scientist R xgboost
Data Scientist
  • Implementierte einen Algorithmus zur Interpretation von Interaktionen in xgboost-Modellen
  • Benchmarking gegen Warenkorbanalyse / Assoziationsregeln
R xgboost
BASF SE
Ludwigshafen
2 Jahre 3 Monate
2015-04 - 2017-06

Effiziente Parameterschätzung in R

Doktorand Parallel Processing Algorithmenentwicklung Statistik ...
Doktorand
  • Entwarf und programmierte einen laufzeiteffizienten EM-Algorithmus zur Schätzung von Risikoparametern bei Krebspatienten
R Sun Grid Engine
Parallel Processing Algorithmenentwicklung Statistik Cluster Computing
IBE, LMU
München
1 Jahr 6 Monate
2015-08 - 2017-01

Automatisierung wiederkehrender Analysen

Algorithmenentwicklung
  • Entwickelte Skripte zur automatisierten Auswertung quartalsweise wiederkehrender Datenauswertungen
SPSS Python
Algorithmenentwicklung
Ipsos Loyalty GmbH
München
2 Monate
2016-06 - 2016-07

Price Forward Curve für Strompreise

Data Scientist R Parallel Processing Performanceoptimierung ...
Data Scientist


    R Parallel Processing Performanceoptimierung Shiny
    Bayerngas Energy GmbH
    München
    3 Monate
    2015-11 - 2016-01

    Leitung eines Marktforschungsprojekts

    Freiberuflicher Statistiker Statistik Datenanalyse
    Freiberuflicher Statistiker
    • Leitung eines Marktforschungsprojekts
    • Entwurf des Untersuchungsdesigns und anschließende statistische Auswertung und Berichterstellung
    R
    Statistik Datenanalyse
    Sport- und Freizeitparadies GYM 80 GmbH
    3 Monate
    2015-10 - 2015-12

    Datenanalyse für eine Forschungsarbeit

    Freiberuflicher Statistiker RMarkdown Gemischte Lineare Modelle R
    Freiberuflicher Statistiker
    • Entwickelte ein statistisches Prognosemodell für einen Biomarker anhand verschiedener klinischer Parameter
    R
    RMarkdown Gemischte Lineare Modelle R
    Universitätsklinikum, Tirol
    Tirol
    2 Jahre 3 Monate
    2013-10 - 2015-12

    Parallelisierung eines statistischen Modells

    Doktorand Parallel Processing
    Doktorand
    • Parallelisierte via MapReduce-Ansatz ein GAMs (Generalisiertes Additives Modell) in R
    • Reduzierung der Laufzeit statistischer Modelle auf großen Genexpressionsdatensätzen
    R
    Parallel Processing
    Genzentrum, LMU
    München
    2 Monate
    2015-08 - 2015-09

    Statistische Auswertung einer empirischen Studie

    Freiberuflicher Statistiker Datenanalyse
    Freiberuflicher Statistiker
    • Bestimmung relevanter Faktoren auf den Erfolg von frühkindlichen Bildungsprogrammen
    • In Zusammenarbeit mit der Kindernothilfe
    SPSS
    Datenanalyse
    Fakultät für Psychologie und Pädagogik, LMU München
    6 Monate
    2013-04 - 2013-09

    Machine Learning-Vergleichsstudie, Masterarbeit

    Cluster Computing Machine Learning
    • Planung und Durchführung einer Vergleichsstudie von Machine Learning-Algorithmen zur Klassifikation von Reflektanzspektren
    • [URL zur Veröffentlichung auf Anfrage]
    Sun Grid Engine R
    Cluster Computing Machine Learning
    Erlangen
    7 Monate
    2013-03 - 2013-09

    Statistische Beratung von Studierenden und Externen

    Wissenschaftliche Hilfskraft
    Wissenschaftliche Hilfskraft
    Statistisches Beratungslabor
    2 Jahre
    2011-05 - 2013-04

    Programmierung statistischer Lösungen in R und SPSS

    Statistiker Statistik Datenanalyse Algorithmen
    Statistiker

    Programmierung statistischer Lösungen in R und SPSS

    Relevante Projekte:

    • Entwicklung von R-Paketen, -Skripten und Dokumentationen im Bereich Lebensmittelsicherheit für
      das Bundesinstitut für Risikobewertung (BfR)

    • Datenbankentwicklung (MySQL) in einem Projekt zur Berechnung von Wachstums- und Inaktivierungsparametern von mikrobiologischen Modellen
    SPSS R MySQL
    Statistik Datenanalyse Algorithmen
    3 Monate
    2012-03 - 2012-05

    Entwicklung eines Prognosemodells

    R
    • Entwicklung eines Prognosemodells der Benutzerzahlen für eine neue Smartphone-App
    R
    Münchner Start-Up

    Aus- und Weiterbildung

    Aus- und Weiterbildung

    3 Jahre 11 Monate
    2013-10 - 2017-08

    Promotion (Dr. rer. nat)

    Dr.rer.nat, IBE, Ludwig-Maximilians-Universität München
    Dr.rer.nat
    IBE, Ludwig-Maximilians-Universität München

    • Dissertation auf Anfrage

    2 Jahre
    2011-10 - 2013-09

    Master-Studium der Statistik

    Master, Ludwig-Maximilians-Universität, München
    Master
    Ludwig-Maximilians-Universität, München
    • Machine Learning
    3 Jahre
    2008-10 - 2011-09

    Bachelor-Studium der Statistik

    Bachelor, Ludwig-Maximilians-Universität, München
    Bachelor
    Ludwig-Maximilians-Universität, München
    • Nebenfach Informatik
    2 Jahre 11 Monate
    2005-09 - 2008-07

    Ausbildung zum Fachinformatiker

    Fachinformatiker, Bundesamt für Migration und Flüchtlinge, Nürnberg
    Fachinformatiker
    Bundesamt für Migration und Flüchtlinge, Nürnberg
    • Fachrichtung Anwendungsentwicklung

    Position

    Position

    • Data Scientist

    Kompetenzen

    Kompetenzen

    Top-Skills

    Data Science R Python

    Schwerpunkte

    Big Data
    Spark, Databricks, Amazon AWS, Microsoft Azure
    Data Science
    Machine Learning, Deep Learning, maßgeschneiderte Algorithmen
    Deep Learning
    Kommunikation
    Schulungen, anwenderfreundliches Vermitteln von Methoden und Ergebnissen, technisches sowie angewandtes Schreiben
    Machine Learning
    Optimierung
    Laufzeitoptimierung von Programmen und Algorithmen, Automatisierung von komplexen Arbeitsabläufen
    Programmieren
    Python, R, SQL, Linux shell

    Produkte / Standards / Erfahrungen / Methoden

    Algorithmen
    Algorithmenentwicklung
    Apache Spark
    Cloudera
    Cluster Computing
    Sun Grid Engine
    Datenanalyse
    Hadoop
    Cloudera Certified Spark and Hadoop Developer
    Parallel Processing
    in R. Multicore sowie Clusterumgebungen
    Performanceoptimierung
    R
    SPSS
    Statistik
    Promotion in Statistik

    Profil:

    • Ich bin Data Scientist im Bereich Machine Learning, und verbinde ein tiefes mathematisches Verständnis der relevanten Algorithmen mit der Fähigkeit, komplexe Analysen in klarer und umsetzbarer Form zu kommunizieren


    IT-Kenntnisse:

    Machine Learning

    • scikit-learn
    • Keras
    • mlr


    Big Data

    • Spark
    • Databricks


    Cloud Computing

    • Amazon Web Services (AWS)
    • Microsoft Azure


    Sonstiges

    • Git
    • Docker
    • Emacs


    Community & Open-Source:

    • mlr: 
      • Machine Learning in R, R-Paket
      • Contributor des R-Pakets mlr. Diverse Erweiterungen und Bugfixes als Pull-Requests auf GitHub
    • Deep Learning:
      • Startup Name Generator, auf GitHub
      • Python-Paket zum Generieren von Namensvorschlägen für Unternehmen und Software
    • GenoGAM: 
      • A GAM based framework for analysis of ChIP-Seq data, Bioconductor-Paket
      • Miterstellung eines R-Pakets zum Berechnen parallelisierter statistischer Modelle auf DNA

    • Blogging: 
      • Zwei Blogs über Statistik und Machine Learning
      • ?Link auf Anfrage

    Programmiersprachen

    Bash
    Seit 2003
    Linux shell
    Python
    Seit 2017
    R
    Seit 2010
    Shiny
    SPSS
    Seit 2015
    SQL

    Datenbanken

    MySQL
    NoSQL

    Berechnung / Simulation / Versuch / Validierung

    Sun Grid Engine
    xgboost

    Branchen

    Branchen

    • Energie
    • Pharma
    • Finanzen
    • Marktforschung
    • Start-Ups
    • Universitäten

    Einsatzorte

    Einsatzorte

    München (+100km) Nürnberg (+50km) Mindelheim (+100km) Erlangen (+100km) Deggendorf (+75km)
    nicht möglich

    Projekte

    Projekte

    10 Jahre 1 Monat
    2014-12 - heute

    Dozententätigkeit

    Dozent
    Dozent
    • Halten und Weiterentwickeln der Kurse ?Data Science Methodenkurs?, ?Praktische Datenanalyse mit R? und ?Programmieren mit R?
    Essential Data Science GmbH, München
    1 Jahr 1 Monat
    2023-10 - 2024-10

    Implementierung einer Testsuite zur Erstellung einer stabilen Datenpipeline

    Data Scientist / Data Engineer
    Data Scientist / Data Engineer
    • Skalierung, Optimierung und Modularisierung des bestehenden Prototypcodes zu einer produktionsreifen Geschäftsanwendung
    • Implementierung einer Testsuite zur Erstellung einer stabilen Datenpipeline
    • Algorithmusoptimierung und Erweiterung der Anwendung auf neue Funktionen
    Python AWS pytest kedro pandas scikit-learn xgboost pandera pydantic git Jira Agile
    Pharma-Unternehmen
    München
    2 Monate
    2023-09 - 2023-10

    Klinische Simulationsstudie

    • Programmierung einer Simulation zur Power-Bestimmung einer klinischen Studie in von den statistischen Annahmen abweichenden realen Szenarien
    R RStudio
    Pharma-Unternehmen
    Utrecht, Niederlande
    5 Monate
    2022-11 - 2023-03

    Shape Risk Management

    Data Scientist
    Data Scientist
    • Entwicklung browserbasierter interaktiver Risiko-Reports für Shape und Performance einer PFC für Strompreise
    Python streamlit pandas Azure DevOps git Jira scikit-learn Agile
    E.ON SE
    Essen
    2 Jahre 6 Monate
    2020-05 - 2022-10

    Energy Trading

    Data Engineer
    Data Engineer
    • Entwicklung einer Datenverarbeitungspipeline die die Wirtschaftlichkeit für Energiekontrakte berechnet
    • Migration eines Datenverarbeitungssystems von Palantir Foundry nach Amazon Web Services
    • Erstellung von Analysen und Reports für Anwender aus dem Handel
    Palantir Foundry AWS (Lambda; Glue; S3; SageMaker) Python pySpark SQL Azure DevOps
    EnBW AG
    Karlsruhe
    1 Jahr 8 Monate
    2020-05 - 2021-12

    Management und Entwicklung einer Data Pipeline in Palantir Foundry

    Cloud Data Engineer Python PySpark Palantir Foundry ...
    Cloud Data Engineer
    • Entwicklung einer Datenverarbeitungspipeline die die Wirtschaftlichkeit für Energiekontrakte berechnet
    • Migration eines Datenverarbeitungssystems von Palantir Foundry nach Amazon Web Services
    • Erstellung von Analysen und Reports für Anwender aus dem Handel
    Python PySpark Palantir Foundry AWS (Lambda Glue S3 SageMaker) pySpark SQL Azure DevOps
    EnBW AG, Karlsruhe
    Remote
    4 Monate
    2020-09 - 2020-12

    Klinische Studie

    • Durchführung einer klinischen Studie zum Vergleich von sGPVI-Blutwerten in Placebo- und Treatment Gruppen
    R RStudio
    Pharma-Unternehmen
    München
    1 Jahr 8 Monate
    2018-08 - 2020-03

    End-to-End Deployment

    Full Stack Data Scientist, Energy Analytics Python xgboost Spark ...
    Full Stack Data Scientist, Energy Analytics
    • End-to-End Deployment eines Prognosemodells für Stromgeneration auf Microsoft Azure
    • Entwickelte Python-Paket für Prognosemodelle von Energieverbrauch von Privathaushalten
    • Entwickelte Modelle zur Anomalieerkennung von ungewöhnlichem Stromverbrauch
    Python xgboost Spark Azure Cloud Docker Databricks git Jira
    E.ON SE
    München
    4 Monate
    2018-04 - 2018-07

    Big Data Engineering

    AWS Spark Hadoop ...
    • Implementierte eine Datenverarbeitungs-Pipeline, von gelieferten Daten in einen internen Hive-Speicher, mit Spark in Python und R
    AWS Spark Hadoop Python Hive Databricks R
    aifora GmbH
    Düsseldorf
    4 Monate
    2018-04 - 2018-07

    Predictive Analytics

    Python scikit-learn Jupyter ...

    • Programmierte ein Modell zur automatischen Berechnung von Einstellungen von Fitnessgeräten aufgrund von Körpersegmentlängen

    Python scikit-learn Jupyter Scrum/Agile
    Milon Care GmbH
    11 Monate
    2017-05 - 2018-03

    Automatische Fehlerkorrektur in Zeitreihen

    Data Scientist R RStudio Shiny ...
    Data Scientist
    Drei Folgeaufträge:
    • Erstellte ein Programm zum automatischen Pricing von Kundenanfragen
    • Entwarf und programmierte einen Algorithmus zur Generierung von Price Forward Curves für Strompreise, von Stunden- bis Monatsgranularität
    • Programmierte eine Shiny-Applikation zur explorativen Einstellung von Parametern für einen Handelsalgorithmus
    • Optimierte die Laufzeit eines R-Programms zum realtime-Pricing von Handelsdaten von 120 Sekunden pro Iteration auf 15 Sekunden
    R RStudio Shiny VBA
    Trumpf AG
    Ditzingen (Remote)
    2 Monate
    2018-01 - 2018-02

    Search Engine Optimization

    Amazon Web Services (EC2) R
    • Webseiten-Audit mit sitespeed.io
    • Setup einer AWS-Instanz zum Web-crawling mit Sitebulb
    • Mitarbeit an einem Algorithmus zum automatischen Vorschlagen von Keywords für Webseiten
    Amazon Web Services (EC2) R
    Artios.io
    London (remote)
    6 Monate
    2017-05 - 2017-10

    Automatische Fehlerkorrektur in Zeitreihen

    • Entwickelte einen Algorithmus, der automatisch falsche Werte in Zählerständen erkennt und korrigiert
    R
    Trumpf AG
    Ditzingen
    6 Monate
    2017-01 - 2017-06

    Mitentwicklung an einem Produktempfehlungssystem

    Data Scientist R xgboost
    Data Scientist
    • Implementierte einen Algorithmus zur Interpretation von Interaktionen in xgboost-Modellen
    • Benchmarking gegen Warenkorbanalyse / Assoziationsregeln
    R xgboost
    BASF SE
    Ludwigshafen
    2 Jahre 3 Monate
    2015-04 - 2017-06

    Effiziente Parameterschätzung in R

    Doktorand Parallel Processing Algorithmenentwicklung Statistik ...
    Doktorand
    • Entwarf und programmierte einen laufzeiteffizienten EM-Algorithmus zur Schätzung von Risikoparametern bei Krebspatienten
    R Sun Grid Engine
    Parallel Processing Algorithmenentwicklung Statistik Cluster Computing
    IBE, LMU
    München
    1 Jahr 6 Monate
    2015-08 - 2017-01

    Automatisierung wiederkehrender Analysen

    Algorithmenentwicklung
    • Entwickelte Skripte zur automatisierten Auswertung quartalsweise wiederkehrender Datenauswertungen
    SPSS Python
    Algorithmenentwicklung
    Ipsos Loyalty GmbH
    München
    2 Monate
    2016-06 - 2016-07

    Price Forward Curve für Strompreise

    Data Scientist R Parallel Processing Performanceoptimierung ...
    Data Scientist


      R Parallel Processing Performanceoptimierung Shiny
      Bayerngas Energy GmbH
      München
      3 Monate
      2015-11 - 2016-01

      Leitung eines Marktforschungsprojekts

      Freiberuflicher Statistiker Statistik Datenanalyse
      Freiberuflicher Statistiker
      • Leitung eines Marktforschungsprojekts
      • Entwurf des Untersuchungsdesigns und anschließende statistische Auswertung und Berichterstellung
      R
      Statistik Datenanalyse
      Sport- und Freizeitparadies GYM 80 GmbH
      3 Monate
      2015-10 - 2015-12

      Datenanalyse für eine Forschungsarbeit

      Freiberuflicher Statistiker RMarkdown Gemischte Lineare Modelle R
      Freiberuflicher Statistiker
      • Entwickelte ein statistisches Prognosemodell für einen Biomarker anhand verschiedener klinischer Parameter
      R
      RMarkdown Gemischte Lineare Modelle R
      Universitätsklinikum, Tirol
      Tirol
      2 Jahre 3 Monate
      2013-10 - 2015-12

      Parallelisierung eines statistischen Modells

      Doktorand Parallel Processing
      Doktorand
      • Parallelisierte via MapReduce-Ansatz ein GAMs (Generalisiertes Additives Modell) in R
      • Reduzierung der Laufzeit statistischer Modelle auf großen Genexpressionsdatensätzen
      R
      Parallel Processing
      Genzentrum, LMU
      München
      2 Monate
      2015-08 - 2015-09

      Statistische Auswertung einer empirischen Studie

      Freiberuflicher Statistiker Datenanalyse
      Freiberuflicher Statistiker
      • Bestimmung relevanter Faktoren auf den Erfolg von frühkindlichen Bildungsprogrammen
      • In Zusammenarbeit mit der Kindernothilfe
      SPSS
      Datenanalyse
      Fakultät für Psychologie und Pädagogik, LMU München
      6 Monate
      2013-04 - 2013-09

      Machine Learning-Vergleichsstudie, Masterarbeit

      Cluster Computing Machine Learning
      • Planung und Durchführung einer Vergleichsstudie von Machine Learning-Algorithmen zur Klassifikation von Reflektanzspektren
      • [URL zur Veröffentlichung auf Anfrage]
      Sun Grid Engine R
      Cluster Computing Machine Learning
      Erlangen
      7 Monate
      2013-03 - 2013-09

      Statistische Beratung von Studierenden und Externen

      Wissenschaftliche Hilfskraft
      Wissenschaftliche Hilfskraft
      Statistisches Beratungslabor
      2 Jahre
      2011-05 - 2013-04

      Programmierung statistischer Lösungen in R und SPSS

      Statistiker Statistik Datenanalyse Algorithmen
      Statistiker

      Programmierung statistischer Lösungen in R und SPSS

      Relevante Projekte:

      • Entwicklung von R-Paketen, -Skripten und Dokumentationen im Bereich Lebensmittelsicherheit für
        das Bundesinstitut für Risikobewertung (BfR)

      • Datenbankentwicklung (MySQL) in einem Projekt zur Berechnung von Wachstums- und Inaktivierungsparametern von mikrobiologischen Modellen
      SPSS R MySQL
      Statistik Datenanalyse Algorithmen
      3 Monate
      2012-03 - 2012-05

      Entwicklung eines Prognosemodells

      R
      • Entwicklung eines Prognosemodells der Benutzerzahlen für eine neue Smartphone-App
      R
      Münchner Start-Up

      Aus- und Weiterbildung

      Aus- und Weiterbildung

      3 Jahre 11 Monate
      2013-10 - 2017-08

      Promotion (Dr. rer. nat)

      Dr.rer.nat, IBE, Ludwig-Maximilians-Universität München
      Dr.rer.nat
      IBE, Ludwig-Maximilians-Universität München

      • Dissertation auf Anfrage

      2 Jahre
      2011-10 - 2013-09

      Master-Studium der Statistik

      Master, Ludwig-Maximilians-Universität, München
      Master
      Ludwig-Maximilians-Universität, München
      • Machine Learning
      3 Jahre
      2008-10 - 2011-09

      Bachelor-Studium der Statistik

      Bachelor, Ludwig-Maximilians-Universität, München
      Bachelor
      Ludwig-Maximilians-Universität, München
      • Nebenfach Informatik
      2 Jahre 11 Monate
      2005-09 - 2008-07

      Ausbildung zum Fachinformatiker

      Fachinformatiker, Bundesamt für Migration und Flüchtlinge, Nürnberg
      Fachinformatiker
      Bundesamt für Migration und Flüchtlinge, Nürnberg
      • Fachrichtung Anwendungsentwicklung

      Position

      Position

      • Data Scientist

      Kompetenzen

      Kompetenzen

      Top-Skills

      Data Science R Python

      Schwerpunkte

      Big Data
      Spark, Databricks, Amazon AWS, Microsoft Azure
      Data Science
      Machine Learning, Deep Learning, maßgeschneiderte Algorithmen
      Deep Learning
      Kommunikation
      Schulungen, anwenderfreundliches Vermitteln von Methoden und Ergebnissen, technisches sowie angewandtes Schreiben
      Machine Learning
      Optimierung
      Laufzeitoptimierung von Programmen und Algorithmen, Automatisierung von komplexen Arbeitsabläufen
      Programmieren
      Python, R, SQL, Linux shell

      Produkte / Standards / Erfahrungen / Methoden

      Algorithmen
      Algorithmenentwicklung
      Apache Spark
      Cloudera
      Cluster Computing
      Sun Grid Engine
      Datenanalyse
      Hadoop
      Cloudera Certified Spark and Hadoop Developer
      Parallel Processing
      in R. Multicore sowie Clusterumgebungen
      Performanceoptimierung
      R
      SPSS
      Statistik
      Promotion in Statistik

      Profil:

      • Ich bin Data Scientist im Bereich Machine Learning, und verbinde ein tiefes mathematisches Verständnis der relevanten Algorithmen mit der Fähigkeit, komplexe Analysen in klarer und umsetzbarer Form zu kommunizieren


      IT-Kenntnisse:

      Machine Learning

      • scikit-learn
      • Keras
      • mlr


      Big Data

      • Spark
      • Databricks


      Cloud Computing

      • Amazon Web Services (AWS)
      • Microsoft Azure


      Sonstiges

      • Git
      • Docker
      • Emacs


      Community & Open-Source:

      • mlr: 
        • Machine Learning in R, R-Paket
        • Contributor des R-Pakets mlr. Diverse Erweiterungen und Bugfixes als Pull-Requests auf GitHub
      • Deep Learning:
        • Startup Name Generator, auf GitHub
        • Python-Paket zum Generieren von Namensvorschlägen für Unternehmen und Software
      • GenoGAM: 
        • A GAM based framework for analysis of ChIP-Seq data, Bioconductor-Paket
        • Miterstellung eines R-Pakets zum Berechnen parallelisierter statistischer Modelle auf DNA

      • Blogging: 
        • Zwei Blogs über Statistik und Machine Learning
        • ?Link auf Anfrage

      Programmiersprachen

      Bash
      Seit 2003
      Linux shell
      Python
      Seit 2017
      R
      Seit 2010
      Shiny
      SPSS
      Seit 2015
      SQL

      Datenbanken

      MySQL
      NoSQL

      Berechnung / Simulation / Versuch / Validierung

      Sun Grid Engine
      xgboost

      Branchen

      Branchen

      • Energie
      • Pharma
      • Finanzen
      • Marktforschung
      • Start-Ups
      • Universitäten

      Vertrauen Sie auf Randstad

      Im Bereich Freelancing
      Im Bereich Arbeitnehmerüberlassung / Personalvermittlung

      Fragen?

      Rufen Sie uns an +49 89 500316-300 oder schreiben Sie uns:

      Das Freelancer-Portal

      Direktester geht's nicht! Ganz einfach Freelancer finden und direkt Kontakt aufnehmen.