SPV_FES | moodle

Einschreibeoptionen

SPV - Sprachverarbeitung mit Verfahren des Maschinellen Lernens

Einführung – Teilgebiete & Anwendungsfelder: Spracherkennung, Sprechererkennung, Sprecherseparierung, Störgeräuschreduktion, Enthallung bspw. für Hörgeräte, etc.

Sprachsignal und Spracherzeugung – Eigenschaften des Sprachsignals im Zeit- & Spektralbereich, Phonetische Grundelemente der Sprache, Spracherzeugung beim Menschen, Quelle-Filter-Modell

Ohr und Hören – Aufbau & Funktionsweise des Ohrs, Wahrnehmungseffekte und -maße

Merkmalsextraktion – Kurzzeitspektralanalyse, Spektrogramme, Stimmgrundfrequenz, Formanten, Mel-Cepstrum; Labor zur Sprachsignalanalyse

Einige Grundlagen des maschinellen Lernens – Überwachtes vs. unüberwachtes Lernen, Modellbasierte vs. nicht-parameterische Ansätze; k-Means-Clustering, GMM; Abstandsklassifikation, SVM; Statistische Klassifikation (MAP, ML), Expectation-Maximisation-Prinzip, Evaluationsmetriken; Dimensionsreduktionsverfahren (PCA, LDA); Labore zur Sprechererkennung, etc.

Algorithmen zur Spracherkennung und Sprachverbesserung – Spracherkennung als Maschineller Lernvorgang, Dynamic Time Warping; Hidden-Markov-Modelle, Viterbi-Decodierung; Phonetisch-akustische Modellierung, Kontextfreie Grammatiken, Statistische Language Models; Deep Neural Networks, Diskriminatives Training; Labore zu Spracherkennung, Sprachverbesserung

Dozent(in): Stefan Feldes

Einschreibeoptionen

SPV - Sprachverarbeitung mit Verfahren des Maschinellen Lernens

Selbsteinschreibung (Student)