Data Science Grundlagen und Anwendung

Vortragende/r (Mitwirkende/r)
Nummer0000001368
ArtPraktikum
Umfang6 SWS
SemesterWintersemester 2021/22
UnterrichtsspracheDeutsch
Stellung in StudienplänenSiehe TUMonline
TermineSiehe TUMonline

Termine

Teilnahmekriterien

Lernziele

Nach dem erfolgreichen Abschluss des Moduls ist der Studierende in der Lage: - die grundlegenden Konzepte von Data Statistics zu verstehen und zu erklären; - einfache Aufgabenstellungen zu grundlegenden Auswertungen in der Wissenschaft mithilfe der in der Lehrveranstaltung verwendeten Softwaretools selbständig bearbeiten und programmieren zu können; - die Auswertungen wissenschaftlicher Arbeiten nachvollziehen und beurteilen zu können; - die erlernten Data Science Methoden an praktischen Aufgabenstellungen anzuwenden.

Beschreibung

- Kurze Wiederholung der Grundlagen der Statistik (Mittelwert, Varianz, Standardabweichung, Median, Perzentile, Verteilungen, Konfidenzintervalle, diskrete und kontinuierliche Daten, Korrelation, ...); - Grundlagen Hypothesentests; - Grundlagen der Datenvisualisierung (Lineplots, Barplots, Boxplots, Violinplots, Beanplots, Heatmaps, Scatter Plots, ...); - Grundlagen der Datenakquisition (Messungen und Simulationen, öffentliche Datenrepositories); - Grundlagen der Datenhaltung und -verarbeitung (Datenbanken, MySQL, Pandas, Numpy, ...); - Grundlegende Methoden der linearen, multiplen linearen und logistic Regression.

Inhaltliche Voraussetzungen

- Grundlagen der Stochastik d.h. Statistik aus Stochastische Signale (EI0205) - Ein Kurs in Programmierung und/oder Algorithmen wird empfohlen (siehe IN8009) - Englische Literature lesen und verstehen können

Lehr- und Lernmethoden

Im Rahmen der Lehrveranstaltung wird die Programmiersprache Python und verschiedene Bibliotheken eingesetzt. In der ersten Phase werden die Studierenden Gelegenheit haben, die in der Vorlesung vorgestellten Konzepte anhand von betreuten Programmieraufgaben zu üben. In der zweiten Phase wenden die Studierenden ihr Wissen zur Implementierung einer größeren Beispielaufgabe an. Hierbei werden den Studierenden Daten vorgegeben, welche ausgewertet werden müssen. Als Lernmethode wird zusätzlich zu den individuellen Methoden des Studierenden eine vertiefende Wissensbildung durch eigenständiges Programmieren in den Übungen und dem Projekt angestrebt. Lehrmethoden: Die Lehrmethode in der Vorlesung ist Frontalunterricht, in den Übungen Arbeits- und Programmierunterricht.

Studien-, Prüfungsleistung

Die Endnote setzt sich aus folgenden Prüfungselementen zusammen: - 30% bewertete Programmierübungen (zwischen 2 und 4 Programmieraufgaben); - 30% Zwischenprüfung (schriftlich, 45 Minuten); - 40% benotetes Projekt (Abschlusspräsentation und -bericht, Dauer der Abschlusspräsentation 10-15 Minuten mit 5-10 Minuten Fragen; Umfang des Berichts ca. 4-5 Seiten ACM Conference Template (https://www.acm.org/publications/proceedings-template) Format mit Fontgröße 9-10pt (double column) je nach Gruppengröße, 1 Seite Contribution Statement je Student ACM Conference Template Single Column (https://www.acm.org/publications/proceedings-template), funktionierender und dokumentierter Programmcode.

Empfohlene Literatur

OpenIntro Statistcs by David Diez, Mine Cetinkaya-Rundel, Christopher Barr, and OpenIntro (https://leanpub.com/openintro-statistics)

Links