phy708 - Wahlpflicht Natur- und Ingenieurwissenschaften (Veranstaltungsübersicht)

phy708 - Wahlpflicht Natur- und Ingenieurwissenschaften (Veranstaltungsübersicht)

Institut für Physik 9 KP
Modulteile Semesterveranstaltungen Sommersemester 2024 Prüfungsleistung
Vorlesung
  • Uneingeschränkter Zugang 5.04.313 - Modern Speech Technology / Sprachtechnologie Lehrende anzeigen
    • Prof. Dr. Gerald Enzner
    • Dr.-Ing. Aleksej Chinaev

    Dienstag: 14:00 - 16:00, wöchentlich (ab 02.04.2024)

    Der Kurs vermittelt die ingenieurmäßigen Werkzeuge für die moderne Sprachsignalverarbeitung. Die vermittelten Grundlagen ergänzen die physiologischen Aspekte der Spracherzeugung und die psychoakustischen Aspekte der Sprachwahrnehmung aus dem "Einführungskurs" um die technische Repräsentation von Sprache in Algorithmen, Hardware und Software. Dabei wird ein besonderes Augenmerk auf die Aufgabenstellung der Sprachsignalverbesserung in mehreren Facetten gelegt, wie etwa Geräuschfilterung, Hallreduktion und Echokompensation. Die benötigten Werkzeuge der modernen Sprachverarbeitung werden hier elementar und intuitiv vermittelt. Die mathematischen Anforderungen sind moderat bis gering. Die Übungen werden von den Studierenden selbst oder im Team und ggfs. mit komponentenweiser Unterstützung durch die Lehrenden in Software oder an der Tafel implementiert. Die Studierenden gewinnen so einen Voreinblick in die wissenschaftliche Arbeitsweise bei studentischen Qualifikationsarbeiten, wie etwa der Bachelorarbeit, sowie die ingenieurmäßige Arbeitsweise im industriellen Umfeld von Sprachverarbeitung. 1. Technische Repräsentation von Sprachsignalen - Bandbreite und Abtastrate, Abtastratenfehler, Digitale Auflösung - Einkanal-, Mehrkanal-, Binauralsignale - Akustisches Sensornetzwerk - Datenbanken für Sprache und Störung - Raumsimulation mit Spiegelquellen-Methode 2. Aufgabenstellung der Sprachsignalverbesserung - Organisationform wissenschaftlicher Signalverarbeitungswettbewerbe - Problemstellungen mit Störsignal, Raumhall oder Interferenz - Evaluationsmetriken: PESQ, STOI, SegSNR, POLQA und ViSQOL - Modellbasierte Verarbeitungsweise: Wiener-Filter, adaptive Methoden - DNN-basierte Verarbeitungsweise: FNN, CNN, RNN, LSTM 3. Hardware- und Softwarewerkzeuge für die Sprachverarbeitung - Entwicklungsumgebungen: Matlab, Python, TensorFlow - Kommerzielle Lösungen und Analyse: Nvidia, Krisp, Solicall, etc. - Geräte für die Sprachsignalerfassung und Verarbeitung: PC, Handy, R-Pi, Hearing Aid 4. Sprachkommunikation - Systeme zur Sprachkommunikation: Voice over IP, Telekonferenzen - Prinzipielle Funktion von Sprachcodecs: Quellen- und Kanal-Kodierung - Aktuelle Entwicklungen für die Sprachübertragung: WebRTC, Speex, EVS - Eigenschaften der Codecs: Abtastrate, Bitrate, Latenz, SNR, Komplexität im Vergleich - Übertragungsverluste und ihre Kompensation: Statistische Modellierung und Verschleierung

  • Uneingeschränkter Zugang 5.04.4698 - Abteilungsseminar Fraunhofer Hör-, Sprach- und Audiotechnologie Lehrende anzeigen
    • Dr. Jens Ekkehart Appell

    Donnerstag: 10:00 - 12:00, wöchentlich (ab 04.04.2024)

    Im Seminar werden aktuelle Forschungsfragen und -Ergebnisse der Abteilung Hör-, Sprach- und Audiotechnologie des Fraunhofer-Institut für Digitale Medientechnologie vorgestellt und diskutiert. Dabei werden neben den im Rahmen von PhD- und Masterarbeiten erzielten Ergebnisse auch die in verschiedenen anwendungsorientierten Projekten eingesetzten Technologien und deren Anwendung vorgestellt. Beiträge von Partnern aus dem Netzwerk der Fraunhofer Abreitsgruppe erfolgen auf Einladung. Inhaltliche Themen kommen aus den Bereichen der Hör- und Audioforschung, der Sprachtechnologie, der Neurotechnologie sowie der KI / machine Learning. Studierenden wird somit ein interessanter Einblick in die Anwendungsfroschung und den Forschungstransfer bei Fraunhofer HSA gegeben. Studierende haben die Gelegenheit, eigene Seminarbeitrag aus dem Themenspektrum der Abteilung zu erarbeiten und vorzustellen.

Übung
Hinweise zum Modul
Teilnahmevoraussetzungen
Signal- und Systemtheorie, Biomedizinische Physik und Neurophysik, Physikalische Messtechnik
Hinweise
Lehrveranstaltungen:
Wahlveranstaltungen aus Natur- und Ingenieurwissenschaften, z.B.:
- pb171 Angewandte und medizinische Akustik (VL/Ü, 4 SWS, 6 KP);
- pb185 Einführung in die Sprachverarbeitung (VL/Ü, 4 SWS, 6 KP));
- pb241 Ausgewählte Aspekte der modernen Physik (VL/SE, 4 SWS, 6 KP);
- pb260 Einführung in die Kern- und Elementarteilchenphysik (VL, 2 SWS, 3 KP)
- pb425  Modern Speech Technology / Sprachtechnologie (VL, 2 SWS, 3KP)
Prüfungsleistung Modul

1 Prüfungsleistung:
1 Klausur (max. 180 Min.) oder
1 mündliche Prüfung (max. 45 Min.)
(100%)
oder
2 Prüfungsleistungen:
1 Klausur (max. 90 Min.) oder 1
mündliche Prüfung (max. 30 Min.) (2/3)
und
1 Klausur (max. 60 Min.) oder 1 Referat (max. 30 Min) oder 1 Poster (Fussnote 1 siehe PO) (1/3)

Kompetenzziele
Vertiefung der bereits erworbenen Kenntnisse und Kompetenzen in den Bereichen durch Veranstaltungen aus dem Lehrangebot für höhere Semester der BSc-Studiengänge aus den Natur- und Ingenieurwissenschaften entsprechend ihrer jeweiligen Vertiefungsrichtung.