Data Analyst, Data Scientist - MS BI Stack inkl. Python & Azure
Aktualisiert am 15.10.2024
Profil
Mitarbeiter eines Dienstleisters
Remote-Arbeit
Verfügbar ab: 01.01.2025
Verfügbar zu: 100%
davon vor Ort: 100%
Skill-Profil eines fest angestellten Mitarbeiters des Dienstleisters
Deutsch
Muttersprache
Englisch
Verhandlungssicher
Französisch
Fortgeschritten

Einsatzorte

Einsatzorte

Ulm (Donau) (+50km) Remote (+500km)
Deutschland
möglich

Projekte

Projekte

6 Monate
2024-04 - heute

Datenbankentwicklung im Backend

Principal Consultant, Entwickler SQL Azure Data Factory Azure Devops ...
Principal Consultant, Entwickler
Für ein datenorientiertes Produkt des Kunden unterstützt unser Berater bei der Entwicklung von Datenbankstrukturen in einem komplexen Backend aus vielen Datenbanken. Zu seinen Aufgaben gehören die Entwicklung und Wartung von Datenstrecken ins Backend hinein via Azure Data Factory. Mit Hilfe von Pipelines und Dataflows werden die Daten aus verschiedenen Quellen gelesen, transformiert und anschließend in die Backend-Datenbanken geschrieben. Darüber hinaus entwickelt er Prozeduren mit denen die Frontends die Daten für die vielfältigen Funktionen des Produkt perfomant abfragen können. Auf Grund der Komplexität der Datenstrukturen ist unser Berater ebenfalls für Datenqualitätsanalysen zuständig und führt Anforderungsanalysen zu Backend-Verbesserungen mit den Fachbereichen durch.
Anforderungsanalyse Data Modeling Datenanalyse Entwicklung/Methoden Schnittstellendesign Performanceoptimierung Testing/QS/QM Dokumentation
SQL Azure Data Factory Azure Devops Git MS Azure SQL Database Common ETL Development Data Lake Data Quality Azure Data Lake CI/CD
2 Jahre 3 Monate
2022-07 - heute

Aufbau eines Cloud DWH in Azure mit AdventureWorks Datensatz

Architekt, Entwickler Systemarchitektur Datenmodellierung Entwicklung ...
Architekt, Entwickler
Zur Weiterbildung auf dem Azure-Technologiestack mit den modernsten technischen Möglichkeiten, entwickelt unsere Competence Area Business Intelligence ein Cloud Datawarehouse mit dem bekannten AdventureWorks Datensatz. Ziel dabei ist, die verschiedenen Möglichkeiten der Architektur durchzuspielen und umzusetzen und darauf aufbauend die jeweiligen Vor- und Nachteile aus konzeptioneller sowie aus praktischer Anwendungssicht zu dokumentieren.
Azure Data Factory Azure Data Lake Azure DevOps Azure Synapse Analytics Databricks Delta Lake Microsoft Fabric Microsoft Power BI Sternschema/Kimball
Systemarchitektur Datenmodellierung Entwicklung Testing Dokumentation
Dienstleistungsbranche
3 Jahre 4 Monate
2021-06 - heute

Automatisierung der Kriterienüberprüfung von eingehenden Rechnungen

Principal Data Scientist, Architekt Anforderungsanalyse Konzeption Design ...
Principal Data Scientist, Architekt

Für zentrale Prozesse beim Kunden müssen eingehende Rechnungen auf bestimmte Kriterien hin überprüft werden. Diese Überprüfung erfolgt momentan manuell anhand von Checklisten für jede einzelne Rechnung. Ziel des Projektes ist, diesen Prozessschritt vollständig zu automatisieren, inklusive der Übergabe der Rechnungen an die Softwarelösung und der Weitergabe der Informationen an das nachfolgende Softwaremodul.

Die technische Lösung basiert dabei auf einem mehrstufigen Verfahren. Mit Hilfe von OCR werden alle Rechnungen textuell auswertbar gemacht. Basierend auf den Bilddateien der Rechnungen sowie dem daraus extrahierten Text werden pro Kriterium Features generiert. Diese Features fungieren dann als Inputdaten für KI-Methoden, welche die jeweilige Kriterienerfüllung vorhersagen. Die somit vollautomatisch ausgefüllte Checkliste wird im Anschluss elektronisch direkt an das nachfolgende Softwaremodul weitergesendet.
Azure DevOps GIT Jupyter Notebook
Anforderungsanalyse Konzeption Design Schnittstellendesign Technische Projektleitung Python Textanalyse Machine Learning OCR Bildbearbeitung Predictive Analytics Regular Expression API
3 Jahre 4 Monate
2021-06 - heute

Data Engineering auf halb-strukturierten Daten in einem pharmazeutischen Backendsystem

Principal Consultant, Entwickler Fachliche Anforderungsanalyse Datenmodellierung Datenaufbereitung ...
Principal Consultant, Entwickler

Die verschiedenen Backendsysteme der Laborinformationssysteme (LIMS) des Kunden haben sehr komplexe und unterschiedliche Datenstrukturen, die ungeeignet sind, um Auswertungen auf ihnen vorzunehmen. Eine Analyse-Datenbank besteht nur punktuell. Ziel des Einsatzes ist daher, Datenstrukturen zu erstellen, damit die Daten in strukturierter Form mit hoher Datenqualität vorliegen, um sie für statistische Analysen verwenden zu können. Neben der komplexen Datenstruktur gibt es die weitere Herausforderung, dass die Datenstrukturen plattformunabhängig funktionstüchtig sein müssen.

Unser Entwickler schreibt komplexe SQL-Abfragen und gestaltet diese so modular wie möglich, um Synergien zwischen den Strukturanforderungen nutzen zu können. Um die Anforderung der Plattformunabhängigkeit zu wahren, werden die Statements in ANSI-SQL verfasst. Da die Dateneingabe pro Labor oder pro Prozessschritt unterschiedlich ist (Silobildung), ist viel Kommunikation mit unterschiedlichsten Wissensträgern nötig, um die fachliche Korrektheit der Daten zu wahren und Personen aus der Datengenerierung mit den Personen aus der Datenauswertung zusammenzubringen, um Prozesse so zu verbessern, dass diese für alle Stakeholder Vorteile bringen.
ANSI-SQL Atlassian JIRA / Confluence Bitbucket Exasol LIMS (Labor-Informations-management-System) Microsoft Excel Oracle Database TIBCO Spotfire Snowflake
Fachliche Anforderungsanalyse Datenmodellierung Datenaufbereitung Datenanalyse Testing Performance-Optimierung Dokumentation Regular Expression SQL GIT
Pharma
2 Monate
2024-01 - 2024-02

Airbnb Preisvorhersage basierend auf Geodaten-Features

Data Scientist Datenanalyse Datenaufbereitung Feature Engineering ...
Data Scientist
Basierend auf einem Kaggle-Datensatz zu Airbnb-Zimmern aus Berlin, hat unser
Berater seine in Kursen erlernten Fähigkeiten zu Geodatenverarbeitung an einem
praktischen Beispiel testen und weiter verfeinern können.
Ziel war es, ein Vorhersagemodell für Airbnb-Preise basierend auf Geodaten-Features
zu erstellen. Hierzu hat unser Berater Daten aus externen Quellen (bspw. Open Data
(ODIS) Berlin sowie Openstreetmap) mit den Standortdaten der Zimmer verknüpft,
um neue Features (bspw. Distanzmaße zu Haltestellen oder Anzahl der
unterschiedlichen Tourismusattraktionen in mehreren Umgebungs-Radien) zu
generieren.
Technisch kamen dabei die auf Geodaten zugeschnittende PostgreSQL-Erweiterung
PostGIS als Datenbank, QGIS als GIS, sowie Python mit den Paketen Geopandas und
Folium in Jupyter Notebooks als Hauptwerkzeug für die Datenaufbereitung,
Datenmodellierung, sowie Datenvisualisierung zum Einsatz.
Docker Jupyter Notebook PostGIS Python QGIS SQL
Datenanalyse Datenaufbereitung Feature Engineering Feature Selection Datenvisualiserung Predictive Modeling Geodatenverarbeitung Machine Learning Predictive Analytics
4 Monate
2023-07 - 2023-10

Erweiterung eines DWH und Erstellung von Berichten für operatives und Konzern-Controlling

Principal Consultant, Architekt, Entwickler Fachliche Anforderungsanalyse Technische Anforderungsanalyse Systemarchitektur ...
Principal Consultant, Architekt, Entwickler

Der Konzern benötigt eine zentrale Anlaufstelle für die Auswertung von Daten, die in verschiedenen Quellsystemen erfasst werden. Die Aufgabe besteht darin, die Daten aus verschiedensten Quellsystemen zusammenzuführen und in einem DWH zu harmonisieren. Auf dieser geschaffenen Datenbasis sollen neue Kennzahlen berechnet und anschaulich mit Power BI visualisiert werden.

Hierfür wird ein bestehendes DWH erweitert, in dem zusätzliche Datenquellen zusammengefügt und aufbereitet wurden. Zur Erstellung und Darstellung der Berichte wird Power BI-Service mit einem strikten Rollenkonzept inkl. Rechteverteilung genutzt.
Atlassian JIRA / Confluence Azure Data Factory Azure Data Lake Azure DevOps Microsoft Power BI Microsoft SQL Server
Fachliche Anforderungsanalyse Technische Anforderungsanalyse Systemarchitektur Datenmodellierung Schnittstellendesign Entwicklung Testing Dokumentation SQL GIT
Gesundheits- & Sozialwesen
2 Jahre 4 Monate
2021-06 - 2023-09

Administration und Support für Power BI bei einem größeren Beratungsunternehmen

Senior Consultant, Administrator Kommunikation Problemanalyse Support ...
Senior Consultant, Administrator

Das Projekt umfasst die Betreuung aller Self-Service Power BI-Nutzer in den europäischen Niederlassungen des Kunden und Administration der Berichtsserver.

Unser Berater steht den Power BI-Usern des Kunden für alle technischen Fragen zu Power BI zur Verfügung und unterstützt sie beim Aufbau ihrer Bereiche auf dem Power BI Report Server. Zudem administriert er die Datenbank- und Applikationsserver der verschiedenen Power BI Report Server Umgebungen, sorgt für eine einfach wartbare Rollenstruktur innerhalb der Berichtsbereiche, und pflegt die Wartungsberichte für die Bereichsinhaber.
Power BI Report Server Microsoft Power BI Microsoft SQL Server
Kommunikation Problemanalyse Support Administration Dokumentation SQL
1 Jahr 7 Monate
2020-11 - 2022-05

Prognose von Rechtsfällen und Maklerpotentialen

Data Scientist Problemanalyse Dokumentation Support ...
Data Scientist

Die von einem alphaQuest Kollegen entwickelten monatlichen bzw. quartalsweisen Prognosen von Rechtsfällen und Maklerpotentialen in einem großen Versicherungskonzern werden während der Betriebsphase weiter unterstützt. Zudem wurde die Dokumentation der beiden Projekte nachgeholt.

Zu den Aufgaben gehört unter anderem die regelmäßigen Datenbeladungen durchzuführen, die Power BI-Berichte auf dem Power BI Report Server zu pflegen, bei fehlenden bzw. unplausiblen Daten das Problem zu analysieren und ggf. ETL-Strecken und Modellierung anpassen, sowie die Pflege der (SQL) Server.
Jupyter Notebook Microsoft Power BI Microsoft SQL Server Microsoft SQL Server Integration Services (SSIS) Power BI Report Server
Problemanalyse Dokumentation Support R Python SQL Git Machine Learning
Versicherung
6 Monate
2021-10 - 2022-03

Einführung eines DWH und Erstellung von Berichten für operatives und Konzern-Controlling

Architekt Fachliche Anforderungsanalyse Technische Anforderungsanalyse Systemarchitektur ...
Architekt

Der Konzern benötigt eine zentrale Anlaufstelle für die Auswertung von Daten, die in verschiedenen Quellsystemen erfasst werden. Die Aufgabe besteht darin, die Daten aus verschiedensten Quellsystemen zusammenzuführen und in einem DWH zu harmonisieren. Auf dieser geschaffenen Datenbasis sollen neue Kennzahlen berechnet und anschaulich mit Power BI visualisiert werden.

Hierfür wurde ein DWH mit Historisierung konzipiert, in dem die verschiedenen Datenquellen zusammengefügt und aufbereitet wurden. Zur Erstellung und Darstellung der Berichte wird Power BI-Service mit einem strikten Rollenkonzept inkl. Rechteverteilung genutzt.

Die Daten sind im DWH zusammengeführt und die gewünschten Berichte werden über Power BI-Service zur Verfügung gestellt. Schulungen für die Nutzung von Power BI-Desktop für zukünftiges Self-Service-BI sind angedacht.
Atlassian JIRA / Confluence Azure Data Factory Azure Data Lake Azure DevOps Data Vault 2.0 Microsoft Power BI Microsoft SQL Server
Fachliche Anforderungsanalyse Technische Anforderungsanalyse Systemarchitektur Datenmodellierung Schnittstellendesign Git SQL Sternschema/Kimball API
Gesundheits- & Sozialwesen
1 Jahr
2020-07 - 2021-06

DWH-Einführung für Gesundheitskonzern

Senior Consultant, Entwickler Anforderungsanalysen Datenmodellierung Entwicklung ...
Senior Consultant, Entwickler

 Für einen großen Kunden aus dem Gesundheitssektor sollte ein Data Warehouse System eingerichtet werden, das Daten aus diversen Datenquellen (Informationssystemen) integriert und zentral zwecks Lösung fachlicher Fragestellungen bereitstellt. Das DWH sollte in mehrere logische Schichten unterteilt sein: Staging Area, Core-DWH, Data Mart. Außerdem sollte eine Repository-Software mit einem Remote-Zugriff entwickelt werden.


Es wurde das DWH erschaffen, womit konsistentes Reporting auf Grundlage der tagesaktuellen Datenbasis ermöglicht wurde. Hierbei wurde Skalierbarkeit und Beschleunigung sowie eine bessere Steuerung des Betriebes von medizinischen Einrichtungen erreicht. Außerdem wurde das Wissen an das interne IT-Team des Auftraggebers im Zuge des Auftrags und mithilfe von Workshops übertragen. Der Kunde ist daher in der Lage, u.a. das DWH eigenständig zu betreiben, zu warten, darin Daten zu ändern und zu aktualisieren, bestehende Prozeduren zu erweitern und Kennzahlenbäume zu implementieren.  

Atlassian JIRA / Confluence Azure DevOps Data Vault 2.0 Microsoft Power BI Microsoft SQL Server Microsoft SQL Server Integration Services (SSIS) Oracle Database
Anforderungsanalysen Datenmodellierung Entwicklung Testing Datenvisualisierung Dokumentation Git DAX SQL Scrum Sternschema/Kimball
Gesundheits- & Sozialwesen
2 Monate
2020-11 - 2020-12

Digitalisierung von Antragsformularen

Data Scientist Entwicklung Testing Datenvisualisierung ...
Data Scientist

 Die eingescannten Antragsformulare eines großen Versicherungskonzerns werden digitalisiert. Dabei werden Herausforderungen gemeistert wie die Auswahl des richtigen Dokuments aus einer Vielzahl von Vertragsdokumenten, das Klassifizieren von sehr verschiedenen Antragsformularversionen, sowie das Klassifizieren der händischen Antworten der Antragsteller.


Bildklassifizierung mit neuronalen Netzen
Die Modelle können mit nahezu 100-prozentiger Wahrscheinlichkeit Formulare und Antworten erkennen. Somit wird die Datenbasis des Kunden fortwährend um bisher nicht auswertbare Informationen erweitert.  

Jupyter Notebook Microsoft Power BI Microsoft SQL Server Microsoft SQL Server SSIS Power BI Report Server
Entwicklung Testing Datenvisualisierung Dokumentation Bildbearbeitung Deep Learning GIT Machine Learning Microsoft Power BI Predictive Analytics Python SQL
Versicherung
3 Monate
2020-04 - 2020-06

Pflege des zentralen Finanz- und Personal-Reporting von Sachsen-Anhalt

Senior Consultant Anforderungsanalyse Datenanalyse Requirements-Engineering ...
Senior Consultant

Das Land Sachsen-Anhalt erhebt und speichert erhebliche Mengen an Daten, die im ISA-Data Warehouse nutzbar gemacht werden. Gestaffelt nach den Adressaten Bürger, Abgeordnete sowie Ressorts wurde eine einheitliche ISA-Online-Plattform bereitgestellt, über die sich Berichte zu den Bereichen Haushalt (inkl. Länder-Vergleich) und Personal abrufen lassen.


Für das System wurde der fortlaufende Betrieb sichergestellt, wobei die Dateninhalte regelmäßig aktualisiert (Ladeläufe) und die Datenstrukturen an geänderte Rahmenbedingungen (z.B. Haushaltsgesetze) angepasst wurden.  

Cubeware Microsoft SQL Server Microsoft SQL Server Analysis Services (SSAS) Microsoft SQL Server Integration Services (SSIS)
Anforderungsanalyse Datenanalyse Requirements-Engineering Dokumentation Support SQL Sternschema/Kimball
Öffentliche Verwaltung
3 Monate
2020-03 - 2020-05

Internes PoC für eine automatisierte Verarbeitung von analogen und digitalen Rechnungen

Senior Consultant, Data Scientist Anforderungsanalyse Design Prozessmodellierung ...
Senior Consultant, Data Scientist

Ziel des PoC: Workflow in Power Automate erstellen, der Rechnungsinformationen automatisiert aus PDF-Dateien ausliest und in das interne ERP-System schreibt.
Ergebnis des PoC: technische Möglichkeiten und Herausforderungen dargestellt  

Common Data Service/Dataverse Microsoft 365 Microsoft Dynamics NAV Microsoft Power Automate Microsoft Power Automate AI Builder
Anforderungsanalyse Design Prozessmodellierung Entwicklung Testing
4 Monate
2020-02 - 2020-05

Prozessautomatisierung für einen mittelständischen Großhändler im süddeutschen Raum

Consultant, Entwickler Prozessmodellierung Entwicklung Testing
Consultant, Entwickler

Bestehende Basis-Flows sollten verbessert und um komplexe Funktionen erweitert werden. Ziel war es, dass Dokumente, die per E-Mail beim Kunden ankommen, mit Power Automate automatisiert verarbeitet werden. Die Dokumente sollten archiviert und in deren Inhalte in die entsprechenden Kundensysteme geleitet werden.  

Common Data Service/Dataverse Microsoft Power Automate
Prozessmodellierung Entwicklung Testing
Handel
5 Monate
2020-01 - 2020-05

Entwicklung einer Projektplanungs-Optimierungslösung

Data Scientist Anforderungsanalyse Design Entwicklung ...
Data Scientist

Die Projektplanung des Kunden sollte automatisiert werden, da durch die Vielzahl an zu planenden Projekten bei begrenzten Kapazitäten die Projektplanung nicht mehr manuell optimiert werden konnte.
Es wurde ein Optimierungstool in MatLab geschrieben, welches die eingeplanten Projekte und deren Startzeitpunkte unter vorgegebenen Nebenbedingungen optimiert. Zudem gibt der Algorithmus bei Nichteinplanung den exakten Grund für das Ausschließen mit aus. Anschließend wurde das Tool in die bestehende Kundenlösung integriert.


Bei Aktualisierung der Projektdaten verbessert das Optimierungstool die Projektplanung und gibt projektspezifisch die eventuellen Ablehnungsgründe an. Damit kann das Controlling auf individueller Basis mit den Fachbereichen verhandeln und erhält direkt ein Feedback über Auswirkungen bei Projektänderungen.  

MATLAB Microsoft Excel Python SAP BEx Analyzer
Anforderungsanalyse Design Entwicklung Testing
Chemische Industrie
3 Monate
2020-01 - 2020-03

Kaggle Data Science Competitions

Data Scientist Data Cleaning Data Exploration Feature Engineering ...
Data Scientist

Mit Hilfe der auf Kaggle zugänglichen Wettbewerbe können Data Science Prozesse und Methoden an spezifischen Case Settings trainiert werden. Der Modus als Wettbewerb ermöglicht es, die eigenen Fähigkeiten durch den Vergleich mit den Konkurrenten einschätzen zu können. Ebenso nützlich ist der Umstand, dass viele User ihr Vorgehen veröffentlichen und die Community so voneinander lernen kann, indem sowohl technische Methoden als auch generelle Denkansätze ausgetauscht und kritisch diskutiert werden.


Unser Berater verfolgt dabei den folgenden Ansatz: Auf eine mehrstufige Datenvorbereitung inkl. Feature Engineering in SQL Server mit Visualisierungen in Python folgte die anschließende Modellierung sowie Evaluierung in Python. Nach Abschluss des ersten Cycle setzt er sich mit den Methoden der Konkurrenten auseinander, ermittelt Verbesserungspotentiale im eigenen Vorgehen und implementiert diese im eigenen Code. Somit kann unser Berater seine Data Science Kompetenzen ganzheitlich ausbauen.  

Jupyter Notebook Microsoft SQL Server
Data Cleaning Data Exploration Feature Engineering Feature Selection Predictive Modeling Modellevaluierung Datenvisualisierung Python SQL Machine Learning
3 Monate
2020-01 - 2020-03

ETL-Entwicklung im SQL Server Stack

Testleitung, Consultant, Entwickler Entwicklung Testkonzeption Testdurchführung/ -leitung ...
Testleitung, Consultant, Entwickler

 Aus dem hoch komplexen Datenmodell eines Legacy-ERP sollten tägliche Ladeläufe in eine Analytics-Lösung erstellt werden. Dabei sollten höchste Performanceanforderungen vollständig in SQL Server 2016 umgesetzt werden. Als leitender Tester hat der Berater dem Team ermöglicht, dieses Ziel zu erreichen.  

Azure DevOps Microsoft SQL Server
Entwicklung Testkonzeption Testdurchführung/ -leitung Git SQL
3 Monate
2020-01 - 2020-03

Cloud Ladeprozess in Python

Data Scientist Anforderungsanalyse Design Schnittstellendesign ...
Data Scientist

Aus einer heterogenen Sharepoint-Landschaft sollte in der Cloud ein zentrales Dokumenten-Repository inklusive Auswertung erstellt werden. Dieses Repository sollte täglich und ad hoc bereit stehen.  

Azure DevOps Microsoft SharePoint Python
Anforderungsanalyse Design Schnittstellendesign Entwicklung Testing Dokumentation APi
3 Monate
2019-10 - 2019-12

2nd Level Support / Digitales Shopfloormanagement

Consultant Kommunikation Problemanalyse Dokumentation ...
Consultant

Aufgabe des Projekts war der 2nd Level Support eines digitalen Shopfloorboards mit automatisierter Anbindung an Datenquellsysteme und ein Data Warehouse aus der Produktion. Hierbei entsteht eine effiziente, standardisierte und transparente Datenverfügbarkeit zu jedem Zeitpunkt und bildet somit eine Basis für eine präzise und wirksame Fabriksteuerung. Das digitale Shopfloorboard ist der erste Schritt zu einer vernetzten Steuerungsplattform. Das digitale Shopfloormanagement gewährleistet die einwandfreie Funktion der Plattform.


Der 2nd Level Support erhält über ein eigenes Ticketsystem Störungsmeldungen aus der Produktionssteuerung. Die Tickets werden direkt bearbeitet oder an die entsprechenden Experten weitergeleitet. Der Weg zur Lösung der Störung wird hierbei ausführlich dokumentiert. Das digitale Shopfloormanagement ist außerdem die direkte Schnittstelle zum Kunden und kommuniziert mit den Kunden alle Schritte zur Problembehebung. Die Anbindung zu den Datenquellsystemen und des Data Warehouses der Produktion wird über Microsoft SQL Server hergestellt. Die Kennzahlen werden hier aufbereitet und der Fabriksteuerung im Shopfloorboard zur Verfügung gestellt. Der 2nd Level Support überwacht diese Datenschnittstelle und führt ggf. entsprechende SQL-Befehle aus, um die Datenbeladung anzustoßen, fehlende Daten nachzuladen oder Datenrecherchen zur Störungsbehebung durchzuführen.
Die korrekte Ausgabe von Daten und Kennzahlen im digitalen Shopfloorboard und somit eine störungsfreie digitale Produktionssteuerung. Durch die nahtlose Abdeckung der Servicezeiten werden Störungen unverzüglich bearbeitet und gelöst. Die korrekte Datenbeladung in das digitale Shopfloorboard über die Microsoft SQL Server-Schnittstelle.  

Microsoft Power BI Microsoft SQL Server Microsoft SQL Server Integration Services (SSIS)
Kommunikation Problemanalyse Dokumentation Support SQL
Automobilbranche
9 Monate
2019-01 - 2019-09

Thanks for your help! - The Added Value of Q&A Websites for Refugees and Helpers

Data Scientist Datenanalyse Data Science Predictive Analytics ...
Data Scientist

 Masterarbeit mit Machine Learning als Methodik. Dabei wurden die folgenden Konzepte verwendet:
Text Klassifikation, Topic Detection/Clustering, Social Media-Analyse, Zeitreihenanalyse, Data Scraping, Data Wrangling, Deskriptive Analysen, Netzwerkanalysen, Modellierung, Modellvalidierung, Visualisierung, Handlungsempfehlungen.


Folgende Themen wurden analysiert: Nutzergruppen und Nutzerverhalten, von der Webseite behandelte Integrationselemente, Entwicklungen über die Zeit, Verbesserungspotentiale auf mehreren Ebenen.  

Gephi R Studio
Datenanalyse Data Science Predictive Analytics Machine Learning R
5 Monate
2017-10 - 2018-02

Augmented-Reality App für Speisekarten

Software Engineer C#
Software Engineer

Programmierung eines AR App Prototypen in Unity für Speisekarten mit anschließender Studie über Usability Vergleich mit analogen Speisekarten.


Ergebnis: Verwendung der AR App wurde als bequemer empfunden und Probanden fanden sich besser über die Gerichte informiert.  

Android Studio Visual Studio
C#
4 Monate
2017-04 - 2017-07

Recommender-Systeme für Restaurants

Data Scientist
Data Scientist

Ergebnis: Präferenzen ähnlicher Nutzer ergeben bessere Vorhersagen als Ähnlichkeiten zwischen den Restaurants  

KNIME
6 Monate
2016-09 - 2017-02

Datenanalysen und Sales Controlling für ein führendes Unternehmen im Gesundheitswesen

BI-Analyst (Internship)
BI-Analyst (Internship)

Aufgaben: Budgetierung, Datenanalysen, Standard und Ad-hoc Reporting, Schulungen zu MicroStrategy halten.  

MS Excel MicroStrategy SAP BEx SAP/R3

Aus- und Weiterbildung

Aus- und Weiterbildung

1 Monat
2022-06 - 2022-06

Introduction to Machine Learning and Causal Inference

4th RUHR School of Modern Epidemiology
4th RUHR School of Modern Epidemiology
2 Jahre 6 Monate
2017-04 - 2019-09

Wirtschaftswissenschaften, Schwerpunkte: Informatik & Economics

M.Sc., Universität Ulm (ECTS A)
M.Sc.
Universität Ulm (ECTS A)

Informatik & Economics

3 Jahre 6 Monate
2013-10 - 2017-03

Wirtschaftswissenschaften, Schwerpunkt: Unternehmensführung und Controlling

B.Sc., Universität Ulm (ECTS A)
B.Sc.
Universität Ulm (ECTS A)

Unternehmensführung und Controlling

Position

Position

Principal Consultant; Data Science; Machine Learning (ML); DWH-Architektur und Datenmodellierung (Datawarehouse); Data Engineering mit Big Data / Databricks, Apache Spark / Azure Synapse;

Kompetenzen

Kompetenzen

Schwerpunkte

Data Analytics
Experte
Datenarchitektur-Konzepte
Fortgeschritten
Datenmodellierung
Experte
Business Intelligence
Experte

Produkte / Standards / Erfahrungen / Methoden

3NF
Fortgeschritten
Agiles Projektmanagement (Scrum)
Fortgeschritten
Apache Spark (PySpark)
Basics
API
Fortgeschritten
Atlassian Jira/Confluence
Fortgeschritten
Azure Databricks
Fortgeschritten
Azure Data Factory
Fortgeschritten
Azure Data Lake
Fortgeschritten
Azure DevOps
Basics
Azure Machine Learning
Fortgeschritten
Azure Synapse Analytics
Fortgeschritten
BI-Architektur
Experte
BPMN
Basics
CI/CD
Basics
Common Data Warehouse Development
Experte
Common ETL Development
Experte
Data Lake
Fortgeschritten
Data Quality
Experte
Data Vault 2.0
Experte
Datenanalyse
Experte
Datenarchitektur-Konzepte
Fortgeschritten
Datenaufbereitung
Experte
Datenbanken
Fortgeschritten
Datenmodellierung
Experte
Datenvisualisierung
Fortgeschritten
Deep Learning
Basics
Delta Lake
Fortgeschritten
Docker
Basics
Geodatenverarbeitung
Basics
Gephi
Fortgeschritten
GIT
Fortgeschritten
Jupyter Notebook
Experte
Kimball
Experte
KNIME
Basics
Machine Learning
Fortgeschritten
MATLAB
Basics
MicroStrategy
Basics
MS Excel
Experte
MS Power Automate
Fortgeschritten
MS Power Automate AI Builder
Fortgeschritten
MS Power Apps
Basics
MS Power BI
Fortgeschritten
MS SQL Server Integration Services (SSIS)
Fortgeschritten
MS Visual Studio
Fortgeschritten
Performance-Tests
Basics
Predictive Analytics
Fortgeschritten
PostGIS
Basics
PostgreSQL
Basics
Prozessmodellierung
Basics
QGIS
Basics
R Studio
Fortgeschritten
Regular Expressions
Fortgeschritten
SAP BEx Analyzer
Basics
SSIS
Fortgeschritten
Systemarchitektur
Basics
Systemdokumentation
Basics
Tableau
Basics
Testing
Fortgeschritten
Textanalyse
Fortgeschritten
TIBICO Spotfire
Basics
TIG Stack (Telegraf, InfluxDB, Grafana)
Basics

Betriebssysteme

Microsoft Windows
Fortgeschritten
Linux
Fortgeschritten

Programmiersprachen

Bash/Shell/PowerShell
Basics
C#
Basics
Java
Basics
JSON
Fortgeschritten
Python
Experte
R
Fortgeschritten
Scala
Basics
SQL
Experte
VBA
Basics

Datenbanken

Common Data Service/Dataverse
Basics
Datenbanken
Fortgeschritten
Exasol
Fortgeschritten
MS SQL Server
Experte
NoSQL
Basics
Oracle Database
Fortgeschritten
Power BI Report Server
Experte
Snowflake
Basics

Branchen

Branchen

Pharma; Versicherungen; Automobil; Forschung; Gesundheits- & Sozialwesen; Öffentliche Verwaltung

Einsatzorte

Einsatzorte

Ulm (Donau) (+50km) Remote (+500km)
Deutschland
möglich

Projekte

Projekte

6 Monate
2024-04 - heute

Datenbankentwicklung im Backend

Principal Consultant, Entwickler SQL Azure Data Factory Azure Devops ...
Principal Consultant, Entwickler
Für ein datenorientiertes Produkt des Kunden unterstützt unser Berater bei der Entwicklung von Datenbankstrukturen in einem komplexen Backend aus vielen Datenbanken. Zu seinen Aufgaben gehören die Entwicklung und Wartung von Datenstrecken ins Backend hinein via Azure Data Factory. Mit Hilfe von Pipelines und Dataflows werden die Daten aus verschiedenen Quellen gelesen, transformiert und anschließend in die Backend-Datenbanken geschrieben. Darüber hinaus entwickelt er Prozeduren mit denen die Frontends die Daten für die vielfältigen Funktionen des Produkt perfomant abfragen können. Auf Grund der Komplexität der Datenstrukturen ist unser Berater ebenfalls für Datenqualitätsanalysen zuständig und führt Anforderungsanalysen zu Backend-Verbesserungen mit den Fachbereichen durch.
Anforderungsanalyse Data Modeling Datenanalyse Entwicklung/Methoden Schnittstellendesign Performanceoptimierung Testing/QS/QM Dokumentation
SQL Azure Data Factory Azure Devops Git MS Azure SQL Database Common ETL Development Data Lake Data Quality Azure Data Lake CI/CD
2 Jahre 3 Monate
2022-07 - heute

Aufbau eines Cloud DWH in Azure mit AdventureWorks Datensatz

Architekt, Entwickler Systemarchitektur Datenmodellierung Entwicklung ...
Architekt, Entwickler
Zur Weiterbildung auf dem Azure-Technologiestack mit den modernsten technischen Möglichkeiten, entwickelt unsere Competence Area Business Intelligence ein Cloud Datawarehouse mit dem bekannten AdventureWorks Datensatz. Ziel dabei ist, die verschiedenen Möglichkeiten der Architektur durchzuspielen und umzusetzen und darauf aufbauend die jeweiligen Vor- und Nachteile aus konzeptioneller sowie aus praktischer Anwendungssicht zu dokumentieren.
Azure Data Factory Azure Data Lake Azure DevOps Azure Synapse Analytics Databricks Delta Lake Microsoft Fabric Microsoft Power BI Sternschema/Kimball
Systemarchitektur Datenmodellierung Entwicklung Testing Dokumentation
Dienstleistungsbranche
3 Jahre 4 Monate
2021-06 - heute

Automatisierung der Kriterienüberprüfung von eingehenden Rechnungen

Principal Data Scientist, Architekt Anforderungsanalyse Konzeption Design ...
Principal Data Scientist, Architekt

Für zentrale Prozesse beim Kunden müssen eingehende Rechnungen auf bestimmte Kriterien hin überprüft werden. Diese Überprüfung erfolgt momentan manuell anhand von Checklisten für jede einzelne Rechnung. Ziel des Projektes ist, diesen Prozessschritt vollständig zu automatisieren, inklusive der Übergabe der Rechnungen an die Softwarelösung und der Weitergabe der Informationen an das nachfolgende Softwaremodul.

Die technische Lösung basiert dabei auf einem mehrstufigen Verfahren. Mit Hilfe von OCR werden alle Rechnungen textuell auswertbar gemacht. Basierend auf den Bilddateien der Rechnungen sowie dem daraus extrahierten Text werden pro Kriterium Features generiert. Diese Features fungieren dann als Inputdaten für KI-Methoden, welche die jeweilige Kriterienerfüllung vorhersagen. Die somit vollautomatisch ausgefüllte Checkliste wird im Anschluss elektronisch direkt an das nachfolgende Softwaremodul weitergesendet.
Azure DevOps GIT Jupyter Notebook
Anforderungsanalyse Konzeption Design Schnittstellendesign Technische Projektleitung Python Textanalyse Machine Learning OCR Bildbearbeitung Predictive Analytics Regular Expression API
3 Jahre 4 Monate
2021-06 - heute

Data Engineering auf halb-strukturierten Daten in einem pharmazeutischen Backendsystem

Principal Consultant, Entwickler Fachliche Anforderungsanalyse Datenmodellierung Datenaufbereitung ...
Principal Consultant, Entwickler

Die verschiedenen Backendsysteme der Laborinformationssysteme (LIMS) des Kunden haben sehr komplexe und unterschiedliche Datenstrukturen, die ungeeignet sind, um Auswertungen auf ihnen vorzunehmen. Eine Analyse-Datenbank besteht nur punktuell. Ziel des Einsatzes ist daher, Datenstrukturen zu erstellen, damit die Daten in strukturierter Form mit hoher Datenqualität vorliegen, um sie für statistische Analysen verwenden zu können. Neben der komplexen Datenstruktur gibt es die weitere Herausforderung, dass die Datenstrukturen plattformunabhängig funktionstüchtig sein müssen.

Unser Entwickler schreibt komplexe SQL-Abfragen und gestaltet diese so modular wie möglich, um Synergien zwischen den Strukturanforderungen nutzen zu können. Um die Anforderung der Plattformunabhängigkeit zu wahren, werden die Statements in ANSI-SQL verfasst. Da die Dateneingabe pro Labor oder pro Prozessschritt unterschiedlich ist (Silobildung), ist viel Kommunikation mit unterschiedlichsten Wissensträgern nötig, um die fachliche Korrektheit der Daten zu wahren und Personen aus der Datengenerierung mit den Personen aus der Datenauswertung zusammenzubringen, um Prozesse so zu verbessern, dass diese für alle Stakeholder Vorteile bringen.
ANSI-SQL Atlassian JIRA / Confluence Bitbucket Exasol LIMS (Labor-Informations-management-System) Microsoft Excel Oracle Database TIBCO Spotfire Snowflake
Fachliche Anforderungsanalyse Datenmodellierung Datenaufbereitung Datenanalyse Testing Performance-Optimierung Dokumentation Regular Expression SQL GIT
Pharma
2 Monate
2024-01 - 2024-02

Airbnb Preisvorhersage basierend auf Geodaten-Features

Data Scientist Datenanalyse Datenaufbereitung Feature Engineering ...
Data Scientist
Basierend auf einem Kaggle-Datensatz zu Airbnb-Zimmern aus Berlin, hat unser
Berater seine in Kursen erlernten Fähigkeiten zu Geodatenverarbeitung an einem
praktischen Beispiel testen und weiter verfeinern können.
Ziel war es, ein Vorhersagemodell für Airbnb-Preise basierend auf Geodaten-Features
zu erstellen. Hierzu hat unser Berater Daten aus externen Quellen (bspw. Open Data
(ODIS) Berlin sowie Openstreetmap) mit den Standortdaten der Zimmer verknüpft,
um neue Features (bspw. Distanzmaße zu Haltestellen oder Anzahl der
unterschiedlichen Tourismusattraktionen in mehreren Umgebungs-Radien) zu
generieren.
Technisch kamen dabei die auf Geodaten zugeschnittende PostgreSQL-Erweiterung
PostGIS als Datenbank, QGIS als GIS, sowie Python mit den Paketen Geopandas und
Folium in Jupyter Notebooks als Hauptwerkzeug für die Datenaufbereitung,
Datenmodellierung, sowie Datenvisualisierung zum Einsatz.
Docker Jupyter Notebook PostGIS Python QGIS SQL
Datenanalyse Datenaufbereitung Feature Engineering Feature Selection Datenvisualiserung Predictive Modeling Geodatenverarbeitung Machine Learning Predictive Analytics
4 Monate
2023-07 - 2023-10

Erweiterung eines DWH und Erstellung von Berichten für operatives und Konzern-Controlling

Principal Consultant, Architekt, Entwickler Fachliche Anforderungsanalyse Technische Anforderungsanalyse Systemarchitektur ...
Principal Consultant, Architekt, Entwickler

Der Konzern benötigt eine zentrale Anlaufstelle für die Auswertung von Daten, die in verschiedenen Quellsystemen erfasst werden. Die Aufgabe besteht darin, die Daten aus verschiedensten Quellsystemen zusammenzuführen und in einem DWH zu harmonisieren. Auf dieser geschaffenen Datenbasis sollen neue Kennzahlen berechnet und anschaulich mit Power BI visualisiert werden.

Hierfür wird ein bestehendes DWH erweitert, in dem zusätzliche Datenquellen zusammengefügt und aufbereitet wurden. Zur Erstellung und Darstellung der Berichte wird Power BI-Service mit einem strikten Rollenkonzept inkl. Rechteverteilung genutzt.
Atlassian JIRA / Confluence Azure Data Factory Azure Data Lake Azure DevOps Microsoft Power BI Microsoft SQL Server
Fachliche Anforderungsanalyse Technische Anforderungsanalyse Systemarchitektur Datenmodellierung Schnittstellendesign Entwicklung Testing Dokumentation SQL GIT
Gesundheits- & Sozialwesen
2 Jahre 4 Monate
2021-06 - 2023-09

Administration und Support für Power BI bei einem größeren Beratungsunternehmen

Senior Consultant, Administrator Kommunikation Problemanalyse Support ...
Senior Consultant, Administrator

Das Projekt umfasst die Betreuung aller Self-Service Power BI-Nutzer in den europäischen Niederlassungen des Kunden und Administration der Berichtsserver.

Unser Berater steht den Power BI-Usern des Kunden für alle technischen Fragen zu Power BI zur Verfügung und unterstützt sie beim Aufbau ihrer Bereiche auf dem Power BI Report Server. Zudem administriert er die Datenbank- und Applikationsserver der verschiedenen Power BI Report Server Umgebungen, sorgt für eine einfach wartbare Rollenstruktur innerhalb der Berichtsbereiche, und pflegt die Wartungsberichte für die Bereichsinhaber.
Power BI Report Server Microsoft Power BI Microsoft SQL Server
Kommunikation Problemanalyse Support Administration Dokumentation SQL
1 Jahr 7 Monate
2020-11 - 2022-05

Prognose von Rechtsfällen und Maklerpotentialen

Data Scientist Problemanalyse Dokumentation Support ...
Data Scientist

Die von einem alphaQuest Kollegen entwickelten monatlichen bzw. quartalsweisen Prognosen von Rechtsfällen und Maklerpotentialen in einem großen Versicherungskonzern werden während der Betriebsphase weiter unterstützt. Zudem wurde die Dokumentation der beiden Projekte nachgeholt.

Zu den Aufgaben gehört unter anderem die regelmäßigen Datenbeladungen durchzuführen, die Power BI-Berichte auf dem Power BI Report Server zu pflegen, bei fehlenden bzw. unplausiblen Daten das Problem zu analysieren und ggf. ETL-Strecken und Modellierung anpassen, sowie die Pflege der (SQL) Server.
Jupyter Notebook Microsoft Power BI Microsoft SQL Server Microsoft SQL Server Integration Services (SSIS) Power BI Report Server
Problemanalyse Dokumentation Support R Python SQL Git Machine Learning
Versicherung
6 Monate
2021-10 - 2022-03

Einführung eines DWH und Erstellung von Berichten für operatives und Konzern-Controlling

Architekt Fachliche Anforderungsanalyse Technische Anforderungsanalyse Systemarchitektur ...
Architekt

Der Konzern benötigt eine zentrale Anlaufstelle für die Auswertung von Daten, die in verschiedenen Quellsystemen erfasst werden. Die Aufgabe besteht darin, die Daten aus verschiedensten Quellsystemen zusammenzuführen und in einem DWH zu harmonisieren. Auf dieser geschaffenen Datenbasis sollen neue Kennzahlen berechnet und anschaulich mit Power BI visualisiert werden.

Hierfür wurde ein DWH mit Historisierung konzipiert, in dem die verschiedenen Datenquellen zusammengefügt und aufbereitet wurden. Zur Erstellung und Darstellung der Berichte wird Power BI-Service mit einem strikten Rollenkonzept inkl. Rechteverteilung genutzt.

Die Daten sind im DWH zusammengeführt und die gewünschten Berichte werden über Power BI-Service zur Verfügung gestellt. Schulungen für die Nutzung von Power BI-Desktop für zukünftiges Self-Service-BI sind angedacht.
Atlassian JIRA / Confluence Azure Data Factory Azure Data Lake Azure DevOps Data Vault 2.0 Microsoft Power BI Microsoft SQL Server
Fachliche Anforderungsanalyse Technische Anforderungsanalyse Systemarchitektur Datenmodellierung Schnittstellendesign Git SQL Sternschema/Kimball API
Gesundheits- & Sozialwesen
1 Jahr
2020-07 - 2021-06

DWH-Einführung für Gesundheitskonzern

Senior Consultant, Entwickler Anforderungsanalysen Datenmodellierung Entwicklung ...
Senior Consultant, Entwickler

 Für einen großen Kunden aus dem Gesundheitssektor sollte ein Data Warehouse System eingerichtet werden, das Daten aus diversen Datenquellen (Informationssystemen) integriert und zentral zwecks Lösung fachlicher Fragestellungen bereitstellt. Das DWH sollte in mehrere logische Schichten unterteilt sein: Staging Area, Core-DWH, Data Mart. Außerdem sollte eine Repository-Software mit einem Remote-Zugriff entwickelt werden.


Es wurde das DWH erschaffen, womit konsistentes Reporting auf Grundlage der tagesaktuellen Datenbasis ermöglicht wurde. Hierbei wurde Skalierbarkeit und Beschleunigung sowie eine bessere Steuerung des Betriebes von medizinischen Einrichtungen erreicht. Außerdem wurde das Wissen an das interne IT-Team des Auftraggebers im Zuge des Auftrags und mithilfe von Workshops übertragen. Der Kunde ist daher in der Lage, u.a. das DWH eigenständig zu betreiben, zu warten, darin Daten zu ändern und zu aktualisieren, bestehende Prozeduren zu erweitern und Kennzahlenbäume zu implementieren.  

Atlassian JIRA / Confluence Azure DevOps Data Vault 2.0 Microsoft Power BI Microsoft SQL Server Microsoft SQL Server Integration Services (SSIS) Oracle Database
Anforderungsanalysen Datenmodellierung Entwicklung Testing Datenvisualisierung Dokumentation Git DAX SQL Scrum Sternschema/Kimball
Gesundheits- & Sozialwesen
2 Monate
2020-11 - 2020-12

Digitalisierung von Antragsformularen

Data Scientist Entwicklung Testing Datenvisualisierung ...
Data Scientist

 Die eingescannten Antragsformulare eines großen Versicherungskonzerns werden digitalisiert. Dabei werden Herausforderungen gemeistert wie die Auswahl des richtigen Dokuments aus einer Vielzahl von Vertragsdokumenten, das Klassifizieren von sehr verschiedenen Antragsformularversionen, sowie das Klassifizieren der händischen Antworten der Antragsteller.


Bildklassifizierung mit neuronalen Netzen
Die Modelle können mit nahezu 100-prozentiger Wahrscheinlichkeit Formulare und Antworten erkennen. Somit wird die Datenbasis des Kunden fortwährend um bisher nicht auswertbare Informationen erweitert.  

Jupyter Notebook Microsoft Power BI Microsoft SQL Server Microsoft SQL Server SSIS Power BI Report Server
Entwicklung Testing Datenvisualisierung Dokumentation Bildbearbeitung Deep Learning GIT Machine Learning Microsoft Power BI Predictive Analytics Python SQL
Versicherung
3 Monate
2020-04 - 2020-06

Pflege des zentralen Finanz- und Personal-Reporting von Sachsen-Anhalt

Senior Consultant Anforderungsanalyse Datenanalyse Requirements-Engineering ...
Senior Consultant

Das Land Sachsen-Anhalt erhebt und speichert erhebliche Mengen an Daten, die im ISA-Data Warehouse nutzbar gemacht werden. Gestaffelt nach den Adressaten Bürger, Abgeordnete sowie Ressorts wurde eine einheitliche ISA-Online-Plattform bereitgestellt, über die sich Berichte zu den Bereichen Haushalt (inkl. Länder-Vergleich) und Personal abrufen lassen.


Für das System wurde der fortlaufende Betrieb sichergestellt, wobei die Dateninhalte regelmäßig aktualisiert (Ladeläufe) und die Datenstrukturen an geänderte Rahmenbedingungen (z.B. Haushaltsgesetze) angepasst wurden.  

Cubeware Microsoft SQL Server Microsoft SQL Server Analysis Services (SSAS) Microsoft SQL Server Integration Services (SSIS)
Anforderungsanalyse Datenanalyse Requirements-Engineering Dokumentation Support SQL Sternschema/Kimball
Öffentliche Verwaltung
3 Monate
2020-03 - 2020-05

Internes PoC für eine automatisierte Verarbeitung von analogen und digitalen Rechnungen

Senior Consultant, Data Scientist Anforderungsanalyse Design Prozessmodellierung ...
Senior Consultant, Data Scientist

Ziel des PoC: Workflow in Power Automate erstellen, der Rechnungsinformationen automatisiert aus PDF-Dateien ausliest und in das interne ERP-System schreibt.
Ergebnis des PoC: technische Möglichkeiten und Herausforderungen dargestellt  

Common Data Service/Dataverse Microsoft 365 Microsoft Dynamics NAV Microsoft Power Automate Microsoft Power Automate AI Builder
Anforderungsanalyse Design Prozessmodellierung Entwicklung Testing
4 Monate
2020-02 - 2020-05

Prozessautomatisierung für einen mittelständischen Großhändler im süddeutschen Raum

Consultant, Entwickler Prozessmodellierung Entwicklung Testing
Consultant, Entwickler

Bestehende Basis-Flows sollten verbessert und um komplexe Funktionen erweitert werden. Ziel war es, dass Dokumente, die per E-Mail beim Kunden ankommen, mit Power Automate automatisiert verarbeitet werden. Die Dokumente sollten archiviert und in deren Inhalte in die entsprechenden Kundensysteme geleitet werden.  

Common Data Service/Dataverse Microsoft Power Automate
Prozessmodellierung Entwicklung Testing
Handel
5 Monate
2020-01 - 2020-05

Entwicklung einer Projektplanungs-Optimierungslösung

Data Scientist Anforderungsanalyse Design Entwicklung ...
Data Scientist

Die Projektplanung des Kunden sollte automatisiert werden, da durch die Vielzahl an zu planenden Projekten bei begrenzten Kapazitäten die Projektplanung nicht mehr manuell optimiert werden konnte.
Es wurde ein Optimierungstool in MatLab geschrieben, welches die eingeplanten Projekte und deren Startzeitpunkte unter vorgegebenen Nebenbedingungen optimiert. Zudem gibt der Algorithmus bei Nichteinplanung den exakten Grund für das Ausschließen mit aus. Anschließend wurde das Tool in die bestehende Kundenlösung integriert.


Bei Aktualisierung der Projektdaten verbessert das Optimierungstool die Projektplanung und gibt projektspezifisch die eventuellen Ablehnungsgründe an. Damit kann das Controlling auf individueller Basis mit den Fachbereichen verhandeln und erhält direkt ein Feedback über Auswirkungen bei Projektänderungen.  

MATLAB Microsoft Excel Python SAP BEx Analyzer
Anforderungsanalyse Design Entwicklung Testing
Chemische Industrie
3 Monate
2020-01 - 2020-03

Kaggle Data Science Competitions

Data Scientist Data Cleaning Data Exploration Feature Engineering ...
Data Scientist

Mit Hilfe der auf Kaggle zugänglichen Wettbewerbe können Data Science Prozesse und Methoden an spezifischen Case Settings trainiert werden. Der Modus als Wettbewerb ermöglicht es, die eigenen Fähigkeiten durch den Vergleich mit den Konkurrenten einschätzen zu können. Ebenso nützlich ist der Umstand, dass viele User ihr Vorgehen veröffentlichen und die Community so voneinander lernen kann, indem sowohl technische Methoden als auch generelle Denkansätze ausgetauscht und kritisch diskutiert werden.


Unser Berater verfolgt dabei den folgenden Ansatz: Auf eine mehrstufige Datenvorbereitung inkl. Feature Engineering in SQL Server mit Visualisierungen in Python folgte die anschließende Modellierung sowie Evaluierung in Python. Nach Abschluss des ersten Cycle setzt er sich mit den Methoden der Konkurrenten auseinander, ermittelt Verbesserungspotentiale im eigenen Vorgehen und implementiert diese im eigenen Code. Somit kann unser Berater seine Data Science Kompetenzen ganzheitlich ausbauen.  

Jupyter Notebook Microsoft SQL Server
Data Cleaning Data Exploration Feature Engineering Feature Selection Predictive Modeling Modellevaluierung Datenvisualisierung Python SQL Machine Learning
3 Monate
2020-01 - 2020-03

ETL-Entwicklung im SQL Server Stack

Testleitung, Consultant, Entwickler Entwicklung Testkonzeption Testdurchführung/ -leitung ...
Testleitung, Consultant, Entwickler

 Aus dem hoch komplexen Datenmodell eines Legacy-ERP sollten tägliche Ladeläufe in eine Analytics-Lösung erstellt werden. Dabei sollten höchste Performanceanforderungen vollständig in SQL Server 2016 umgesetzt werden. Als leitender Tester hat der Berater dem Team ermöglicht, dieses Ziel zu erreichen.  

Azure DevOps Microsoft SQL Server
Entwicklung Testkonzeption Testdurchführung/ -leitung Git SQL
3 Monate
2020-01 - 2020-03

Cloud Ladeprozess in Python

Data Scientist Anforderungsanalyse Design Schnittstellendesign ...
Data Scientist

Aus einer heterogenen Sharepoint-Landschaft sollte in der Cloud ein zentrales Dokumenten-Repository inklusive Auswertung erstellt werden. Dieses Repository sollte täglich und ad hoc bereit stehen.  

Azure DevOps Microsoft SharePoint Python
Anforderungsanalyse Design Schnittstellendesign Entwicklung Testing Dokumentation APi
3 Monate
2019-10 - 2019-12

2nd Level Support / Digitales Shopfloormanagement

Consultant Kommunikation Problemanalyse Dokumentation ...
Consultant

Aufgabe des Projekts war der 2nd Level Support eines digitalen Shopfloorboards mit automatisierter Anbindung an Datenquellsysteme und ein Data Warehouse aus der Produktion. Hierbei entsteht eine effiziente, standardisierte und transparente Datenverfügbarkeit zu jedem Zeitpunkt und bildet somit eine Basis für eine präzise und wirksame Fabriksteuerung. Das digitale Shopfloorboard ist der erste Schritt zu einer vernetzten Steuerungsplattform. Das digitale Shopfloormanagement gewährleistet die einwandfreie Funktion der Plattform.


Der 2nd Level Support erhält über ein eigenes Ticketsystem Störungsmeldungen aus der Produktionssteuerung. Die Tickets werden direkt bearbeitet oder an die entsprechenden Experten weitergeleitet. Der Weg zur Lösung der Störung wird hierbei ausführlich dokumentiert. Das digitale Shopfloormanagement ist außerdem die direkte Schnittstelle zum Kunden und kommuniziert mit den Kunden alle Schritte zur Problembehebung. Die Anbindung zu den Datenquellsystemen und des Data Warehouses der Produktion wird über Microsoft SQL Server hergestellt. Die Kennzahlen werden hier aufbereitet und der Fabriksteuerung im Shopfloorboard zur Verfügung gestellt. Der 2nd Level Support überwacht diese Datenschnittstelle und führt ggf. entsprechende SQL-Befehle aus, um die Datenbeladung anzustoßen, fehlende Daten nachzuladen oder Datenrecherchen zur Störungsbehebung durchzuführen.
Die korrekte Ausgabe von Daten und Kennzahlen im digitalen Shopfloorboard und somit eine störungsfreie digitale Produktionssteuerung. Durch die nahtlose Abdeckung der Servicezeiten werden Störungen unverzüglich bearbeitet und gelöst. Die korrekte Datenbeladung in das digitale Shopfloorboard über die Microsoft SQL Server-Schnittstelle.  

Microsoft Power BI Microsoft SQL Server Microsoft SQL Server Integration Services (SSIS)
Kommunikation Problemanalyse Dokumentation Support SQL
Automobilbranche
9 Monate
2019-01 - 2019-09

Thanks for your help! - The Added Value of Q&A Websites for Refugees and Helpers

Data Scientist Datenanalyse Data Science Predictive Analytics ...
Data Scientist

 Masterarbeit mit Machine Learning als Methodik. Dabei wurden die folgenden Konzepte verwendet:
Text Klassifikation, Topic Detection/Clustering, Social Media-Analyse, Zeitreihenanalyse, Data Scraping, Data Wrangling, Deskriptive Analysen, Netzwerkanalysen, Modellierung, Modellvalidierung, Visualisierung, Handlungsempfehlungen.


Folgende Themen wurden analysiert: Nutzergruppen und Nutzerverhalten, von der Webseite behandelte Integrationselemente, Entwicklungen über die Zeit, Verbesserungspotentiale auf mehreren Ebenen.  

Gephi R Studio
Datenanalyse Data Science Predictive Analytics Machine Learning R
5 Monate
2017-10 - 2018-02

Augmented-Reality App für Speisekarten

Software Engineer C#
Software Engineer

Programmierung eines AR App Prototypen in Unity für Speisekarten mit anschließender Studie über Usability Vergleich mit analogen Speisekarten.


Ergebnis: Verwendung der AR App wurde als bequemer empfunden und Probanden fanden sich besser über die Gerichte informiert.  

Android Studio Visual Studio
C#
4 Monate
2017-04 - 2017-07

Recommender-Systeme für Restaurants

Data Scientist
Data Scientist

Ergebnis: Präferenzen ähnlicher Nutzer ergeben bessere Vorhersagen als Ähnlichkeiten zwischen den Restaurants  

KNIME
6 Monate
2016-09 - 2017-02

Datenanalysen und Sales Controlling für ein führendes Unternehmen im Gesundheitswesen

BI-Analyst (Internship)
BI-Analyst (Internship)

Aufgaben: Budgetierung, Datenanalysen, Standard und Ad-hoc Reporting, Schulungen zu MicroStrategy halten.  

MS Excel MicroStrategy SAP BEx SAP/R3

Aus- und Weiterbildung

Aus- und Weiterbildung

1 Monat
2022-06 - 2022-06

Introduction to Machine Learning and Causal Inference

4th RUHR School of Modern Epidemiology
4th RUHR School of Modern Epidemiology
2 Jahre 6 Monate
2017-04 - 2019-09

Wirtschaftswissenschaften, Schwerpunkte: Informatik & Economics

M.Sc., Universität Ulm (ECTS A)
M.Sc.
Universität Ulm (ECTS A)

Informatik & Economics

3 Jahre 6 Monate
2013-10 - 2017-03

Wirtschaftswissenschaften, Schwerpunkt: Unternehmensführung und Controlling

B.Sc., Universität Ulm (ECTS A)
B.Sc.
Universität Ulm (ECTS A)

Unternehmensführung und Controlling

Position

Position

Principal Consultant; Data Science; Machine Learning (ML); DWH-Architektur und Datenmodellierung (Datawarehouse); Data Engineering mit Big Data / Databricks, Apache Spark / Azure Synapse;

Kompetenzen

Kompetenzen

Schwerpunkte

Data Analytics
Experte
Datenarchitektur-Konzepte
Fortgeschritten
Datenmodellierung
Experte
Business Intelligence
Experte

Produkte / Standards / Erfahrungen / Methoden

3NF
Fortgeschritten
Agiles Projektmanagement (Scrum)
Fortgeschritten
Apache Spark (PySpark)
Basics
API
Fortgeschritten
Atlassian Jira/Confluence
Fortgeschritten
Azure Databricks
Fortgeschritten
Azure Data Factory
Fortgeschritten
Azure Data Lake
Fortgeschritten
Azure DevOps
Basics
Azure Machine Learning
Fortgeschritten
Azure Synapse Analytics
Fortgeschritten
BI-Architektur
Experte
BPMN
Basics
CI/CD
Basics
Common Data Warehouse Development
Experte
Common ETL Development
Experte
Data Lake
Fortgeschritten
Data Quality
Experte
Data Vault 2.0
Experte
Datenanalyse
Experte
Datenarchitektur-Konzepte
Fortgeschritten
Datenaufbereitung
Experte
Datenbanken
Fortgeschritten
Datenmodellierung
Experte
Datenvisualisierung
Fortgeschritten
Deep Learning
Basics
Delta Lake
Fortgeschritten
Docker
Basics
Geodatenverarbeitung
Basics
Gephi
Fortgeschritten
GIT
Fortgeschritten
Jupyter Notebook
Experte
Kimball
Experte
KNIME
Basics
Machine Learning
Fortgeschritten
MATLAB
Basics
MicroStrategy
Basics
MS Excel
Experte
MS Power Automate
Fortgeschritten
MS Power Automate AI Builder
Fortgeschritten
MS Power Apps
Basics
MS Power BI
Fortgeschritten
MS SQL Server Integration Services (SSIS)
Fortgeschritten
MS Visual Studio
Fortgeschritten
Performance-Tests
Basics
Predictive Analytics
Fortgeschritten
PostGIS
Basics
PostgreSQL
Basics
Prozessmodellierung
Basics
QGIS
Basics
R Studio
Fortgeschritten
Regular Expressions
Fortgeschritten
SAP BEx Analyzer
Basics
SSIS
Fortgeschritten
Systemarchitektur
Basics
Systemdokumentation
Basics
Tableau
Basics
Testing
Fortgeschritten
Textanalyse
Fortgeschritten
TIBICO Spotfire
Basics
TIG Stack (Telegraf, InfluxDB, Grafana)
Basics

Betriebssysteme

Microsoft Windows
Fortgeschritten
Linux
Fortgeschritten

Programmiersprachen

Bash/Shell/PowerShell
Basics
C#
Basics
Java
Basics
JSON
Fortgeschritten
Python
Experte
R
Fortgeschritten
Scala
Basics
SQL
Experte
VBA
Basics

Datenbanken

Common Data Service/Dataverse
Basics
Datenbanken
Fortgeschritten
Exasol
Fortgeschritten
MS SQL Server
Experte
NoSQL
Basics
Oracle Database
Fortgeschritten
Power BI Report Server
Experte
Snowflake
Basics

Branchen

Branchen

Pharma; Versicherungen; Automobil; Forschung; Gesundheits- & Sozialwesen; Öffentliche Verwaltung

Vertrauen Sie auf Randstad

Im Bereich Freelancing
Im Bereich Arbeitnehmerüberlassung / Personalvermittlung

Fragen?

Rufen Sie uns an +49 89 500316-300 oder schreiben Sie uns:

Das Freelancer-Portal

Direktester geht's nicht! Ganz einfach Freelancer finden und direkt Kontakt aufnehmen.