Hauptinhalt
CS 539 — Einführung in die natürliche Sprachverarbeitung (NLP)
(engl. Introduction to Natural Language Processing)
Niveaustufe, Verpflichtungsgrad | Vertiefungsmodul, abhängig vom importierenden Studiengang |
Lehr- und Lernformen, Arbeitsaufwand |
Vorlesung (2 SWS), Übung (2 SWS) oder Praktikum mit hohem Informatikanteil (insg. 180 Std), 180 Stunden (60 Std. Präsenzzeit, 120 Std. Selbststudium) |
Leistungspunkte, Voraussetzungen zum Erwerb |
6 LP Studienleistung(en): Erreichen von mindestens 50 Prozent der Punkte aus den wöchentlich zu bearbeitenden Übungsaufgaben und mündliche Präsentation der Lösung von mindestens zwei der Übungsaufgaben. Prüfungsleistung: Zwei Teilprüfungen: Klausur (3 LP) und schriftliche Ausarbeitung (3LP) |
Sprache, Benotung |
Englisch,Die Benotung erfolgt mit 0 bis 15 Punkten gemäß der Prüfungsordnung für den Studiengang M.Sc. Data Science. |
Ursprung | M.Sc. Data Science, M.Sc. Data Science |
Dauer des Moduls, Häufigkeit |
Ein Semester, Jedes Sommersemester |
Modulverantwortliche(r) | Prof. Dr. Lucie Flek |
Inhalt
- ein Überblick über die Ziele, Herausforderungen und Anwendungen von NLP
- Webdatenverarbeitung, Umwandlung von Wörtern in ihre Grundformen (Tokenisierung, Stemming, Lemmatisierung)
- Textdarstellung (Wörter, Sätze, Absätze, Dokumente), Worteinbettungen, Wortähnlichkeit
- Algorithmen zur Textklassifizierung und Methoden zur Messung und Bewertung der Leistung dieser Algorithmen
- Verwendung lexikalischer Ressourcen im NLP
- Syntaktische Analyse (Part of Speech Tagging, Chunking und Parsing)
- Techniken zur Extraktion von Bedeutung aus Text (semantische Analyse)
- NLP-Anwendungen (z. B. Ähnlichkeit von Dokumenten, Stimmungsanalyse,
- Erkennung von benannten Entitäten, Beantwortung von Fragen, Zusammenfassungen, Erkennung von Fake News, Erkennung von Plagiaten,
- Erkennung von missbräuchlicher Sprache, Meinungsforschung...)
Qualifikationsziele
Die Studierenden
- kennen die technische Perspektive auf Natural Language Processing (NLP), also den Bereich der Künstlichen Intelligenz, der sich mit der Verarbeitung und dem Verständnis menschlicher Sprache beschäftigt.
- kennen Methoden zur Entwicklung von Computersoftware, die menschliche Sprache versteht und verarbeitet.
- kennen moderne datengesteuerte Ansätzen, wobei der Schwerpunkt auf Techniken des maschinellen Lernens liegt.
- können ihre Kenntnisse in Gruppenarbeit an realen NLP-Projekten anwenden.
- sind in der Lage sein, ihre eigenen Systeme zu entwickeln, die geschriebene Sprache interpretieren. Die behandelten Anwendungen variieren in ihrer Komplexität und umfassen zum Beispiel Entity Recognition, Sentiment Analysis, Semantic Similarity und Question Answering.
Voraussetzungen
Keine. Empfohlen werden Kompetenzen, wie sie in den Modulen Maschinelles Lernen und entweder Grundlagen der Statistik oder Elementare Stochastik vermittelt werden.
Verwendbarkeit
Das Modul kann im FB12 verwendet werden im Studiengang bzw. in den Studiengängen
- B.Sc. Data Science
- B.Sc. Informatik
- M.Sc. Data Science
- M.Sc. Informatik
- M.Sc. Wirtschaftsinformatik
Im Studiengang M.Sc. Data Science kann das Modul im Studienbereich Freie Wahlpflichtmodule absolviert werden.
Das Modul kann auch in anderen Studiengängen absolviert werden (Exportmodul).
Das Modul ist der Informatik zugeordnet. Weitere Informationen zur Wählbarkeit sind der Bereichsbeschreibung zu entnehmen.
Literatur
- Eisenstein, Jacob. "Introduction to natural language processing. MIT press", (2019).
- Jurafsky, Daniel, and James H. Martin. "Speech and Language Processing: An Introduction to Natural Language Processing, Computational Linguistics, and Speech Recognition." (2000).
Bitte beachten Sie:
Diese Seite beschreibt ein Modul gemäß dem im Wintersemester 2023/24 aktuellsten gültigen Modulhandbuch. Die meisten für ein Modul gültigen Regeln werden nicht durch die Prüfungsordnung festgelegt, und können daher von Semester zu Semester aktualisiert werden. Folgende Versionen liegen im Online-Modulhandbuch vor:
- WiSe 2016/17 (kein Äquivalent)
- SoSe 2018 (kein Äquivalent)
- WiSe 2018/19 (kein Äquivalent)
- WiSe 2019/20 (kein Äquivalent)
- WiSe 2020/21 (kein Äquivalent)
- SoSe 2021 (kein Äquivalent)
- WiSe 2021/22 (kein Äquivalent)
- WiSe 2022/23 (kein Äquivalent)
- WiSe 2023/24
Das Modulhandbuch enthält alle Module, unabhängig vom aktuellen Veranstaltungsangebot, vergleichen Sie dazu bitte das aktuelle Vorlesungsverzeichnis in Marvin.
Die Angaben im Online-Modulhandbuch wurden automatisch erstellt. Rechtsverbindlich sind die Angaben der Prüfungsordnung. Wenn Ihnen Unstimmigkeiten oder Fehler auffallen, sind wir für Hinweise dankbar.