Μάθημα Κωδικός  Εξάμηνο Τύπος Ώρες Εργαστήριο /
Φροντιστήριο
ECTS Διδάσκοντες
Επεξεργασία Ομιλίας και Ήχου  Η Κατεύθυνσης ανθρωπιστικών επιστημών  4 5 Ι. Καρύδης

 

Μαθησιακά Αποτελέσματα

Το μάθημα αποτελεί εισαγωγικό μάθημα στις έννοιες Επεξεργασία Ομιλίας και Ήχου.

Η ύλη του μαθήματος στοχεύει στην εισαγωγή των σπουδαστών στις βασικές έννοιες της Επεξεργασία Ομιλίας και Ήχου και εννοιών όπως (1) του μηχανισμού παραγωγής ομιλίας από τον άνθρωπο, (2) της καταγραφής, βελτίωσης και αναπαραγωγής της ομιλίας μέσω υπολογιστή, (3) της μετατροπής ομιλίας σε μορφή αναγνωρίσιμη από το υπολογιστή, (4) της αναγνώρισης του ομιλητή, (5) της σύνθεσης ομιλίας με τον υπολογιστή και (6) της επιβεβαίωσης όλων των προαναφερθέντων δράσεων μέσω του αντίκτυπου όλων των εφαρμογών Επεξεργασίας Ομιλίας και Ήχου στην καθημερινή ζωή.

Με την επιτυχή ολοκλήρωση του μαθήματος ο φοιτητής / τρια θα είναι σε θέση να:

  • Έχει κατανόηση τα βασικά και κρίσιμα χαρακτηριστικά των δράσεων Επεξεργασία Ομιλίας και Ήχου.
  • Έχει γνώση των εργαλείων και των τεχνικών της Επεξεργασίας Ομιλίας και Ήχου και πως αυτά χρησιμοποιούνται για να επιτύχουν τους στόχους της.
  • Αντιλαμβάνεται και να υλοποιεί τις μεθοδολογίες Επεξεργασίας Ομιλίας και Ήχου με βέλτιστες προγραμματιστικές λύσεις.
  • Συνεργαστεί με τους συμφοιτητές του για να δημιουργήσουν και να παρουσιάσουν ένα σχέδιο και υλοποίηση ενός συστήματος Επεξεργασίας Ομιλίας και Ήχου.

Περιγραφή Μαθήματος

Μοντελοποίηση του μηχανισμού παραγωγής ομιλίας: Μηχανισμός παραγωγής ομιλίας, Ήχοι ομιλίας. Ψηφιακή προεπεξεργασία κειμένου ομιλίας: Επιλογή της συχνότητας δειγματοληψίας, Ψηφιοποίηση, Βραχύχρονη ανάλυση σήματος ομιλίας, Επιλογή μήκους πλαισίου, Προέμφαση, Επιλογή φίλτρου «παραθύρου», Ρυθμός μετακίνησης πλαισίων. Ακουστικές παράμετροι: Εξαγωγή παραμέτρων, Ακουστικές πληροφορίες διάκρισης ομιλητών, Ενέργεια και μηδενικές διελεύσεις, Θεμελιώδης συχνότητα, Μέθοδοι υπολογισμού τονικότητας, Φασματογράφημα, Συντονισμοί φωνητικού καναλιού (FORMANTS), Συντελεστές γραμμικής πρόγνωσης (LPC), τράπεζα φίλτρων, συντελεστές ανάκλασης, Cepstral Συντελεστές. Βασικές Τεχνικές Επεξεργασίας ομιλίας. Κρυμμένα Μοντέλα Μarkov: Ορισμός και θεμελιώδεις αλγόριθμοι. Συστήματα αναγνώρισης/κατανόησης ομιλίας, Συστήματα Αναγνώρισης Ομιλητή. Σύνθεση ομιλίας. Ψηφιακές τεχνικές αφαίρεσης θορύβου.

Υλικό Μαθήματος

https://opencourses.ionio.gr/courses/DDI119/

Προτεινόμενη βιβλιογραφία

  • «ΨΗΦΙΑΚΗ ΕΠΕΞΕΡΓΑΣΙΑ ΣΗΜΑΤΟΣ», ANTONIOU A, Α. ΤΖΙΟΛΑ & ΥΙΟΙ Ο.Ε., 2009

  • «ΨΗΦΙΑΚΗ ΕΠΕΞΕΡΓΑΣΙΑ ΦΩΝΗΣ: ΘΕΩΡΙΑ ΚΑΙ ΕΦΑΡΜΟΓΕΣ», RABINER L., Π.Χ. ΠΑΣΧΑΛΙΔΗΣ, 2011