Bachelor: Geodata Science
334 - Machine Learning 1
Empfohlenes Studiensemester: 3
Turnus: Wintersemester
Sprachen: Deutsch
ECTS: 5
Prüfungsform: schrP oder ModA, weitere Angaben siehe SPO und Studienplan
Lehrform und SWS: SU (2SWS), Ü (2SWS)
Gesamter Workload: 150 Stunden
Präsenzzeit: 30 Stunden Seminaristischer Unterricht, 30 Stunden Übung
Selbststudium: 90 Stunden
Modulverantwortung: Prof. Dr. David Spieler (FK07)
Empfohlene Voraussetzung für die Teilnahme
Kenntnisse in Linearer Algebra, Analysis, Wahrscheinlichkeitsrechnung und grundlegende Programmierkenntnisse (Python)
Lernziele
Die Studierenden lernen verschiedene Modelltypen und passende Lernverfahren aus dem Bereich des maschinellen Lernen kennen und anwenden, um sie in ihrer späteren beruflichen Tätigkeit bei der Analyse von Daten verschiedenster Modalitäten hinsichtlich Erkenntnisgewinn und Vorhersage sinnvoll einsetzen zu können.
Fach- und Methodenkompetenz
Die Studierenden sind in der Lage
- die grundlegenden Konzepte hinter maschinellen Lernverfahren zu erläutern,
- einfachere maschinelle Lernverfahren selbst zu implementieren,
- grundlegende Machine-Learning-Modelle in verschiedenen Problemstellungen mit Hilfe moderner Frameworks anzuwenden und zu evaluieren
Überfachliche Kompetenz
Teamarbeit: Die Studierenden bearbeiten Problemstellungen in Kleingruppen
Inhalt
Einführung in die mathematischen Grundlagen des maschinellen Lernens (Lineare Algebra und Multivariate Analysis)
Grundbegriffe des maschinellen Lernens
- Modellbegriff
- Abgrenzung überwachtes, unüberwachtes und bestärkendes Lernen
- Abgrenzung Klassifikation und Regression
- Leistungmetriken
- Über- und Unteranpassung
- Trennung von Training* und Testdatensatz
- Nichtlineare Optimierung mit Hilfe des Gradientenabstiegverfahrens
- Einführung in die Hyperparameteroptimierung
Grundlagen der Regression anhand der Linearen Regression
Grundlagen der Klassifikation anhand der Logistischen Regression
Grundlagen Nichtparametrische Methoden: K*Nearest Neighbors und Entscheidungsbäume
Einführung in die Feature-Extraction: Anwendung der Hauptkomponentenanalyse
Grundlagen des Clusterings: K-Means und Hierarchisches Clustering
Lehrmethoden und Lernformen
Beamer, Tafel, Jupyter Notebooks
Verwendbarkeit des Moduls
Bachelor Geodata Science
Literatur
- Richard O. Duda, Peter E. Hart, and David G. Stork, Pattern classification (2nd edition), Wiley-Interscience, New York, NY, USA, 2000.
- Géron A., Hands-on machine learning with scikit-learn and tensorflow: Concepts, tools, and techniques to build intelligent systems, 1st ed., O'Reilly Media, Inc., 2017.
- James G., Witten D., Hastie T., and Tibshirani R., An introduction to statistical learning: With applications in R, Springer Publishing Company, Incorporated, 2014.