Praktikum Data Science und Grundlagen zum Maschinellen Lernen

Vortragende/r (Mitwirkende/r)
Nummer0000003218
ArtPraktikum
Umfang6 SWS
SemesterSommersemester 2021
UnterrichtsspracheDeutsch
Stellung in StudienplänenSiehe TUMonline
TermineSiehe TUMonline

Termine

Teilnahmekriterien

Lernziele

Nach dem erfolgreichen Abschluss des Moduls ist der Studierende in der Lage: - die grundlegenden Konzepte von Data Science und maschinellem Lernen zu verstehen und zu erklären; - einfache Aufgabenstellungen zu grundlegenden Auswertungen in der Wissenschaft mithilfe der in der Lehrveranstaltung verwendeten Softwaretools selbständig bearbeiten und programmieren zu können; - die Auswertungen wissenschaftlicher Arbeiten nachvollziehen und beurteilen zu können; - die erlernten Data Science Methoden und Methoden des maschinellen Lernens an praktischen Aufgabenstellungen anzuwenden.

Beschreibung

- Kurze Wiederholung der Grundlagen der Statistik (Mittelwert, Varianz, Standardabweichung, Median, Perzentile, Verteilungen, Konfidenzintervalle, diskrete und kontinuierliche Daten, Korrelation, ...); - Grundlagen der Datenvisualisierung (Lineplots, Barplots, Boxplots, Violinplots, Beanplots, Heatmaps, Scatter Plots); - Grundlagen der Datenakquisition (Messungen und Simulationen, öffentliche Datenrepositories); - Grundlagen der Datenhaltung und -verarbeitung (Datenbanken, MySQL, Pandas, Numpy etc.); - Grundlegende Methoden des maschinellen Lernens (Lineare Regression, Random Forrest, TSNE).

Inhaltliche Voraussetzungen

- Grundlagen der Stochastik d.h. Statistik aus Stochastische Signale (EI0205) - Ein Kurs in Programmierung und/oder Algorithmen wird empfohlen (siehe IN8009) - Englische Literature lesen und verstehen können

Lehr- und Lernmethoden

Im Rahmen der Lehrveranstaltung wird die Programmiersprache Python und verschiedene Bibliotheken eingesetzt. In der ersten Phase werden die Studierenden Gelegenheit haben, die in der Vorlesung vorgestellten Konzepte anhand von betreuten Programmieraufgaben zu üben. In der zweiten Phase wenden die Studierenden ihr Wissen zur Implementierung einer größeren Beispielaufgabe an. Hierbei werden den Studierenden Daten vorgegeben, welche ausgewertet werden müssen. Als Lernmethode wird zusätzlich zu den individuellen Methoden des Studierenden eine vertiefende Wissensbildung durch eigenständiges Programmieren in den Übungen und dem Projekt angestrebt.

Studien-, Prüfungsleistung

Die Endnote setzt sich aus folgenden Prüfungselementen zusammen: - 30% bewertete Programmierübungen; - 30% Zwischenprüfung (mündlich oder schriftlich); - 40% benotetes Projekt (Abschlusspräsentation und -bericht)

Empfohlene Literatur

Ausgewählte Kapitel aus der nachfolgenden Literatur werden empfohlen: - Introduction to Computation and Programming Using Python, John V. Guttag, second edition - The Art of Statistics - Learning from Data, David Spiegelhalter - Statistics Done Wrong - The Woefully Complete Guide, Alex Reinhart

Links