Γλωσσική Τεχνολογία
Διδάσκων/ουσα: Κερμανίδου Κάτια - Λήδα
Κωδικός: MO210
Τύπος Μαθήματος: Κατεύθυνση ΒΥΝ - Υποχρεωτικά
Επίπεδο Μαθήματος: Προπτυχιακό
Γλώσσα Μαθήματος: Ελληνικά
Τρόπος Παράδοσης: Στην τάξη
Εξάμηνο: Ζ΄
ECTS: 5
Διδακτικές Μονάδες: 3
Ώρες Διάλεξης: 2
Ώρες Εργαστηρίου/Φροντιστηρίου: 2Ε
Σύνολο Ωρών: 4
Σελίδα E Class: https://opencourses.ionio.gr/courses/DDI211/
Προγράμματα Σπουδών: Αναμορφωμένο ΠΠΣ Πληροφορικής από 2025
Υπολογιστική Γλωσσολογία και Επεξεργασία Φυσικής Γλώσσας. Τα χαρακτηριστικά της φυσικής γλώσσας. Μορφολογική επεξεργασία. Κανονικές Εκφράσεις. Αυτόματα και Μετατροπείς Πεπερασμένων Καταστάσεων. Σύνταξη. Ανάπτυξη Γραμματικών. Τύποι Γραμματικών και φορμαλισμοί. Iεραρχία Chomsky. Συντακτική Ανάλυση. Σημασιολογική Επεξεργασία. Ερμηνεία. Λογική Φόρμα. Επιλεκτικοί περιορισμοί. Σημασιολογικά δίκτυα. Οντολογίες. Πραγματολογία. Ανάλυση Λόγου. Επίλυση αναφορών. Στατιστική Αναγνώριση μερών του λόγου. Στοχαστική σύνταξη. Επαγωγή γραμματικής. Στατιστική Άρση Αμφισημίας Λέξεων. Λίστες Αποφάσεων στην Άρση Αμφισημίας Λέξεων. Σύνθεση Φυσικής Γλώσσας. Διαλογικά Συστήματα. Αυτόματη Μετάφραση. Στατιστική Μετάφραση. Νευρωνική Μετάφραση. Μοντελοποίηση Γλώσσας. Μεγάλα Μοντέλα Γλώσσας. Εξαγωγή Πληροφορίας. Το πακέτο εργαλείων επεξεργασίας φυσικής γλώσσας NLTK. Διανυσματικές Αναπαραστάσεις Λέξεων. Εφαρμογές μηχανικής μάθησης και νευρωνικών δικτύων στην επεξεργασία φυσικής γλώσσας. Εργαστηριακές ασκήσεις σε Εφαρμογές μηχανικής μάθησης και νευρωνικών δικτύων στην επεξεργασία φυσικής γλώσσας. |
Στόχοι του μαθήματος αποτελούν - η εξοικείωση των φοιτητών με βασικές αρχές, όρους, τεχνολογίες, τεχνικές της Υπολογιστικής Γλωσσολογίας - η εξοικείωση με εφαρμογές των νέων τεχνολογιών στην Γλωσσολογία - η εξοικείωση με εργαλεία επεξεργασίας γλώσσας - η εξοικείωση με την χρήση θησαυρών για την επεξεργασία της γλώσσας - η εξοικείωση με σύγχρονες τεχνολογίες αυτόματης μετάφρασης, μεγάλων μοντέλων γλώσσας, διαλογικών συστημάτων, αναπαράστασης γνώσης - η εξοικείωση με τεχνολογίες και εφαρμογές γλωσσολογικής ανάλυσης και παραγωγής σε όλα τα επίπεδα γλωσσολογικής γνώσης: μορφολογικό, συντακτικό, σημασιολογικό, πραγματολογικό - η εκπόνηση και σύνταξη δημοσιεύσιμης ερευνητικής εργασίας
Πιο συγκεκριμένα, με την επιτυχή ολοκλήρωση του μαθήματος, οι φοιτητές είναι σε θέση - να γνωρίζουν βασικούς όρους, έννοιες, τεχνικές, αλγορίθμους, θησαυρούς, εφαρμογές και εργαλεία γλωσσικής τεχνολογίας - να εφαρμόζουν τεχνικές και αλγορίθμους επεξεργασίας της γλώσσας για την επίλυση προβλημάτων - να εφαρμόζουν στην πράξη εργαλεία επεξεργασίας γλώσσας - να χρησιμοποιούν θησαυρούς επεξεργασίας γλώσσας - να σχεδιάζουν και να υλοποιούν μια ερευνητική εργασία - να συντάσσουν δημοσιεύσιμη ερευνητική εργασία |
Εβδομάδα 1η: Εισαγωγή στην Γλωσσική Τεχνολογία. Εφαρμογές. Προκλήσεις στην Γλωσσική Τεχνολογία. Αμφισημία. Ιστορικά Στοιχεία. ΓΤ βασισμένη σε κανόνες. ΓΤ οδηγούμενη από δεδομένα. Επίπεδα Γλωσσολογικής Γνώσης. Μορφολογικό Επίπεδο. Κατηγορίες γλωσσών βάσει μορφολογίας. Μορφολογική Ανάλυση. Μορφολογική Σύνθεση. Μοντέλο δυο επιπέδων. Αυτόματα και Μετατροπείς Πεπερασμένων Καταστάσεων στην Υπολογιστική Μορφολογία. Εβδομάδα 2η: Σώματα κειμένων. Στατιστική Αναγνώριση Μερών του Λόγου. Μοντέλα ν-γραμμων. Μοντέλο Naïve Bayes. Κρυμμένα Μοντέλα Markov. Εργαστήριο με το Natural Language Toolkit (ΝLTK). Εβδομάδα 3η: Σύνταξη. Συντακτική Ανάλυση. Γραμματικές. Ιεραρχία του Chomsky. Κανονικές Γραμματικές. Γραμματικές Ελεύθερης Σύνταξης. Top-down και bottom-up Ανάλυση. Μερική Ανάλυση. Επαγωγή Γραμματικής. Πιθανοτικές Γραμματικές. Αναγνώριση φράσεων. Σχήμα επισημείωσης ΙΟΒ. Εβδομάδα 4η: Σημασιολογία. Αναπαράσταση νοήματος. Σημασιολογικά λεξικά. Ανάλυση Lambda. Ερμηνεία. Οντολογίες. Σημασιολογικοί Ρόλοι. Λογική Φόρμα. Κανόνες μερικών περιγραφών. Εργαστήριο με το Natural Language Toolkit (ΝLTK). Εβδομάδα 5η: Στατιστική Άρση της Αμφισημίας της Έννοιας Λέξεων. Λίστες αποφάσεων στην άρση της αμφισημίας. Εργαστήριο με το Natural Language Toolkit (ΝLTK). WordNet. Σημασιολογική ομοιότητα εννοιών. Εβδομάδα 6η: Πραγματολογία. Ανάλυση Λόγου. Άρση αναφορικής ασάφειας. Λίστα Ιστορίας. Θεωρία Επικέντρου. Έλλειψη. Σημασιολογική σύνδεση προτάσεων. Συνοχή. Discourse markers. Συζήτηση για την εργασία του εξαμήνου. Εβδομάδα 7η: Αυτόματη Μετάφραση. Κλασσικές προσεγγίσεις στην Μετάφραση. Παράλληλα σώματα κειμένων. Στατιστική Μηχανική Μετάφραση. Μοντέλο Γλώσσας. Μοντέλο Μετάφρασης. Εβδομάδα 8η: Χειρωνακτική αξιολόγηση της μετάφρασης. Αυτόματη αξιολόγηση της μετάφρασης. Αυτόματα μέτρα αξιολόγησης (WER, TER, BLEU, NIST). Παρουσιάσεις προόδου των εργασιών εξαμήνου. Εβδομάδα 9η: Mηχανική Μάθηση στην Γλωσσική Τεχνολογία. Νευρωνικά Δίκτυα. Διανυσματικές Αναπαραστάσεις Λέξεων. Εργαστήριο με τον πάγκο εργασίας WEKA. Εβδομάδα 10η: Βαθιά Μάθηση και Γλωσσική Τεχνολογία. Μοντέλα Seq2Seq στην Μηχανική Μετάφραση. Εργαστήριο με τον πάγκο εργασίας WEKA. Εβδομάδα 11η: Σύνθεση Φυσικής Γλώσσας. Διαλογικά Συστήματα. Παραγωγική Τεχνητή Νοημοσύνη και Γλωσσική Τεχνολογία. Μεγάλα Μοντέλα Γλώσσας. Εβδομάδα 12η: Παρουσιάσεις προόδου των εργασιών εξαμήνου. Εργαστήριο με τον πάγκο εργασίας WEKA. Εβδομάδα 13η: Επανάληψη και Προετοιμασία για τις Εξετάσεις. |
- “Η μηχανική μετάφραση και η ελληνική γλώσσα”, Σταύρου Μ., Τζεβελέκου Μ., Ινστιτούτο Επεξεργασίας του Λόγου, Εκδόσεις Καστανιώτη, ISBN 960-03-2718-1, 2001
- “Επίπεδα γλωσσικής ανάλυσης”, Παυλίδου Θ. Σ., Εκδόσεις ΙΝΣΤΙΤΟΥΤΟ ΝΕΟΕΛΛΗΝΙΚΩΝ ΣΠΟΥΔΩΝ, ISBN 978-960-231-132-5, 2008
- «Υπολογιστική Γλωσσολογία», Τάντος Αλέξανδρος, Ελληνικά Ακαδημαϊκά Ηλεκτρονικά Συγγράμματα και Βοηθήματα - Αποθετήριο "Κάλλιπος", 2016.
- “Speech and Language Processing”, Jurafsky D., Martin J., Pearson Prentice Hall, ISBN 978-0131873216, 2008
- “Statistical Natural Language Processing”, Manning C., Schuetze H., MIT Press, ISBN 978-0262133609, 1999
- “Introduction to Deep Learning”, Eugene Charniak, MIT Press, ISBN: 9780262039512, 2019.
Πρόσωπο με πρόσωπο Διδασκαλία
Χρήση ηλεκτρονικών σημειώσεων Υποστήριξη διδασκαλίας μέσω της ηλεκτρονικής πλατφόρμας opencourses. Χρήση εργαλείων επεξεργασίας γλώσσας και μηχανικής μάθησης στις εργαστηριακές ασκήσεις. |
Γραπτή τελική εξέταση (50%), με ερωτήσεις ελεύθερης ανάπτυξης και πολλαπλών επιλογών, επίλυσης προβλημάτων στην ελληνική γλώσσα.
Γραπτή ομαδική εργασία (50%) με αναφορά.
Δημόσια παρουσίαση μέσω διαφανειών της εργασίας.
Επιστροφή
Σπουδές
e-mail: cs@ionio.gr
<< | < | Οκτώβριος 2025 |
> | >> | ||
Δε | Τρ | Τε | Πε | Πα | Σα | Κυ |
1 |
2 |
3 |
4 |
5 |
||
6 |
7 |
8 |
9 |
10 |
11 |
12 |
13 |
14 |
15 |
16 |
17 |
18 |
19 |
20 |
21 |
22 |
23 |
24 |
25 |
26 |
27 |
28 |
29 |
30 |
31 |