Bachelor: Geodata Science

334 - Machine Learning 1

Empfohlenes Studiensemester: 3

Turnus: Wintersemester

Sprachen: Deutsch

ECTS: 5

Prüfungsform: schrP oder ModA, weitere Angaben siehe SPO und Studienplan

Lehrform und SWS: SU (2SWS), Ü (2SWS)

Gesamter Workload: 150 Stunden

Präsenzzeit: 30 Stunden Seminaristischer Unterricht, 30 Stunden Übung

Selbststudium: 90 Stunden

Modulverantwortung: Prof. Dr. David Spieler (FK07)

Empfohlene Voraussetzung für die Teilnahme

Kenntnisse in Linearer Algebra, Analysis, Wahrscheinlichkeitsrechnung und grundlegende Programmierkenntnisse (Python)

Lernziele

Die Studierenden lernen verschiedene Modelltypen und passende Lernverfahren aus dem Bereich des maschinellen Lernen kennen und anwenden, um sie in ihrer späteren beruflichen Tätigkeit bei der Analyse von Daten verschiedenster Modalitäten hinsichtlich Erkenntnisgewinn und Vorhersage sinnvoll einsetzen zu können.

Fach- und Methodenkompetenz

Die Studierenden sind in der Lage

  • die grundlegenden Konzepte hinter maschinellen Lernverfahren zu erläutern,
  • einfachere maschinelle Lernverfahren selbst zu implementieren,
  • grundlegende Machine-Learning-Modelle in verschiedenen Problemstellungen mit Hilfe moderner Frameworks anzuwenden und zu evaluieren

Überfachliche Kompetenz

Teamarbeit: Die Studierenden bearbeiten Problemstellungen in Kleingruppen

Inhalt

  • Einführung in die mathematischen Grundlagen des maschinellen Lernens (Lineare Algebra und Multivariate Analysis)

  • Grundbegriffe des maschinellen Lernens

    • Modellbegriff
    • Abgrenzung überwachtes, unüberwachtes und bestärkendes Lernen
    • Abgrenzung Klassifikation und Regression
    • Leistungmetriken
    • Über- und Unteranpassung
    • Trennung von Training* und Testdatensatz
    • Nichtlineare Optimierung mit Hilfe des Gradientenabstiegverfahrens
    • Einführung in die Hyperparameteroptimierung
  • Grundlagen der Regression anhand der Linearen Regression

  • Grundlagen der Klassifikation anhand der Logistischen Regression

  • Grundlagen Nichtparametrische Methoden: K*Nearest Neighbors und Entscheidungsbäume

  • Einführung in die Feature-Extraction: Anwendung der Hauptkomponentenanalyse

  • Grundlagen des Clusterings: K-Means und Hierarchisches Clustering

Lehrmethoden und Lernformen

Beamer, Tafel, Jupyter Notebooks

Verwendbarkeit des Moduls

Bachelor Geodata Science

Literatur

  • Richard O. Duda, Peter E. Hart, and David G. Stork, Pattern classification (2nd edition), Wiley-Interscience, New York, NY, USA, 2000.
  • Géron A., Hands-on machine learning with scikit-learn and tensorflow: Concepts, tools, and techniques to build intelligent systems, 1st ed., O'Reilly Media, Inc., 2017.
  • James G., Witten D., Hastie T., and Tibshirani R., An introduction to statistical learning: With applications in R, Springer Publishing Company, Incorporated, 2014.