Einschreibeoptionen
Sprachsignal und Spracherzeugung – Eigenschaften des Sprachsignals im Zeit- & Spektralbereich, Phonetische Grundelemente der Sprache, Spracherzeugung beim Menschen, Quelle-Filter-Modell
Ohr und Hören – Aufbau & Funktionsweise des Ohrs, Wahrnehmungseffekte und -maße
Merkmalsextraktion – Kurzzeitspektralanalyse, Spektrogramme, Stimmgrundfrequenz, Formanten, Mel-Cepstrum; Labor zur Sprachsignalanalyse
Einige Grundlagen des maschinellen Lernens – Überwachtes vs. unüberwachtes Lernen, Modellbasierte vs. nicht-parameterische Ansätze; k-Means-Clustering, GMM; Abstandsklassifikation, SVM; Statistische Klassifikation (MAP, ML), Expectation-Maximisation-Prinzip, Evaluationsmetriken; Dimensionsreduktionsverfahren (PCA, LDA); Labore zur Sprechererkennung, etc.
Algorithmen zur Spracherkennung und Sprachverbesserung – Spracherkennung als Maschineller Lernvorgang, Dynamic Time Warping; Hidden-Markov-Modelle, Viterbi-Decodierung; Phonetisch-akustische Modellierung, Kontextfreie Grammatiken, Statistische Language Models; Deep Neural Networks, Diskriminatives Training; Labore zu Spracherkennung, Sprachverbesserung
- Dozent(in): Stefan Feldes