Data Engineering – Grundlagen

Modulstudium

Eine der zentralen Herausforderungen im Kontext von „Big Data“ ist die Harmonisierung und Strukturierung vorhandener Daten. In den letzten 20 Jahren sind in Unternehmen in nahezu allen Branchen riesige Datensilos entstanden. Häufig wurden Daten dabei dezentral in einzelnen Fachabteilung und zum Teil sogar individuell gesammelt. Dies hat zur Folge, dass Unternehmen wegen der mangelhaften Struktur keinen Mehrwert daraus generieren können.

Dieses Modul bietet einen praxisnahen Einstieg in das Data Engineering und stellt Methoden und Technologien der Datenhaltung vor. Die Teilnehmenden erfahren, wie sie unterschiedliche Speichertechnologien auslesen und auswertbar strukturieren können. Im Fokus stehen dabei die Structured Query Language (SQL) sowie relationale Datenbanktechnologien.

Ihr Nutzen

Nach der Teilnahme an dem Modul sind Sie in der Lage,

  • grundlegende Mechanismen und Strukturen von und in relationalen Datenbanken zu beschreiben
  • Daten via SQL abzufragen
  • Unternehmensdaten zu harmonisieren und systematisch auswertbar aufzubereiten
  • einfache Bereinigungslogiken anzuwenden
  • Datenbedarfe für gewünschte Applikationen zu erkennen und Erfordernisse an die Charakteristik der Daten gegenüber Dritten oder Fachvorgesetzten zu kommunizieren
  • die Basis für unternehmenseigene Datenanalyse-Applikationen zu schaffen
  • die Herausforderungen der Datenaufbereitung zu verstehen.

Inhalte

  • Grundlegende Datenbankkenntnisse: Datenspeicherparadigmen (relational vs. multidimensional), Konzeption der Datenhistorisierung, Sternschema und 3-Layer-Architektur
  • Vergleich unterschiedlicher relationaler Datenbanktechnologien: Oracle DB vs. Microsoft SQL vs. SAP Hana und andere
  • Möglichkeiten und Grenzen relationaler Datenbanken: Datentypen, Berechtigungskonzepte und Grundlagen der Datenindizierung
  • Einführung in die MySQL-Datenbank (frei verfügbar)
  • Grundlagen der Datenmodellierung
  • Strukturierung und Normalformen von Daten
  • Datenabfrage: Syntax des Select-Befehls
  • Einfügen, Verändern und Löschen von Informationen
  • Datenverknüpfung durch Joins: Left Join, Right Join, Inner Join, Outer Join
  • Indizierung und Strategien zur Beschleunigung von Abfragen

Zielgruppe

Fach- und Führungskräfte sämtlicher Branchen, die sich mit der Strukturierung und Harmonisierung von unterschiedlichsten Datenquellen beschäftigen, um durch das Heben bislang unerschlossener Informationen einen wirtschaftlichen Mehrwert zu erzielen.

Lehrende

Dr. Andreas Varwig
Selbstständiger Data Scientist, Osnabrück

Online

Diese Weiterbildung findet 100% online statt.

Termine

Kurs 1/2022

Startdatum: 28.01.2022

Enddatum: 25.03.2022

Details

Kurs 2/2022

Startdatum: 09.09.2022

Enddatum: 18.11.2022

Details

Preis

1.390,00 €

Ort

Professional School
Online

Kontakt

Marlene Schwegmann
Teamleitung HSB Professional School
Tel. 0421 / 5905-4798
E-Mail

Fakten

Teilnahmevoraussetzungen
• Erster berufsqualifizierender Abschluss (Berufsausbildung/Studium)
• Mind. einjährige Berufserfahrung
• Fortgeschrittene Excel-Kenntnisse (S-Verweis) vorteilhaft
• MS-Access-Kenntnisse vorteilhaft
• Zahlenaffinität und Interesse an statistischen Fragestellungen
Maximale Teilnehmendenzahl
20
Art
Modulstudium
• gleichzeitig Modul 1 des CAS-Zertifikatsstudiums "Data Engineer"
• gleichzeitig Modul 1 des CAS-Zertifikatsstudiums "Data Scientist"
Format
Das Modulstudium wird online durchgeführt. Die Inhalte werden selbstständig anhand angeleiteter Online-Lerneinheiten auf der Lernplattform der HSB erarbeitet. Dazu finden die begleitenden Live-Online-Seminare statt, welche die virtuelle Anwesenheit der Teilnehmenden erfordern. Die Online-Seminare dienen der thematischen Einführung, der Vermittlung erklärungsbedürftiger Inhalte sowie der Besprechung der Fallstudien, an denen während der Weiterbildung gearbeitet wird.
Methoden
Kombination aus Online-Lerneinheiten, Online-Seminar, Übungen und Fallstudienarbeit
Aufwand
60 Kontaktstunden plus ca. 120 Std. Selbststudium (nach individuellem Bedarf)
Dauer
5 Online-Seminare à 4 Unterrichtseinheiten, ca. 2 Monate insgesamt
Prüfung
Hausarbeit in Form einer Fallstudie, die den Aufbau einer a) analysierbaren, b) speicherplatz- und c) abfragegeschwindigkeitsoptimierten Datenbank samt Beleg durch die Demonstration verschiedener SQL-Abfragen zur Verknüpfung unterschiedlicher Quelltabellen beinhaltet
Abschluss
• Hochschulzertifikat nach erfolgreich abgelegter Prüfung
• 6 ECTS-Leistungspunkte für Teilnehmende mit Hochschulzugangsberechtigung
• Teilnahmebescheinigung, sofern keine Prüfung abgelegt wird
Preis
1.390,00 €

Weitere Empfehlungen für Sie

Modulstudium

Data Engineering – Angewandte Datenanalyse

Mehr Info
Modulstudium

Data Science – Grundlagen für die Praxis

Mehr Info