Einschreibeoptionen

Einführung – Teilgebiete & Anwendungsfelder: Spracherkennung, Sprechererkennung, Sprecherseparierung, Störgeräuschreduktion, Enthallung bspw. für Hörgeräte, etc.

Sprachsignal und Spracherzeugung – Eigenschaften des Sprachsignals im Zeit- & Spektralbereich, Phonetische Grundelemente der Sprache, Spracherzeugung beim Menschen, Quelle-Filter-Modell

Ohr und Hören – Aufbau & Funktionsweise des Ohrs, Wahrnehmungseffekte und -maße 

Merkmalsextraktion – Kurzzeitspektralanalyse, Spektrogramme, Stimmgrundfrequenz, Formanten, Mel-Cepstrum;  Labor zur Sprachsignalanalyse

Einige Grundlagen des maschinellen Lernens – Überwachtes vs. unüberwachtes Lernen, Modellbasierte vs. nicht-parameterische Ansätze; k-Means-Clustering, GMM; Abstandsklassifikation, SVM; Statistische Klassifikation (MAP, ML), Expectation-Maximisation-Prinzip, Evaluationsmetriken;  Dimensionsreduktionsverfahren (PCA, LDA);  Labore zur Sprechererkennung, etc.

Algorithmen zur Spracherkennung und Sprachverbesserung –  Spracherkennung als Maschineller Lernvorgang, Dynamic Time Warping; Hidden-Markov-Modelle, Viterbi-Decodierung; Phonetisch-akustische Modellierung, Kontextfreie Grammatiken, Statistische Language Models;  Deep Neural Networks, Diskriminatives Training;  Labore zu Spracherkennung, Sprachverbesserung

Selbsteinschreibung (Student)
Selbsteinschreibung (Student)