Επιστήμη και Ανάλυση Δεδομένων
Διδάσκων/ουσα: Αυλωνίτης Μάρκος, Πανάρετος Αλέξανδρος
Κωδικός: HY210
Τύπος Μαθήματος: Μάθημα Κορμού
Επίπεδο Μαθήματος: Προπτυχιακό
Γλώσσα Μαθήματος: Ελληνικά
Εξάμηνο: Δ΄
ECTS: 5
Διδακτικές Μονάδες: 5
Ώρες Διάλεξης: 4
Ώρες Εργαστηρίου/Φροντιστηρίου: 2Φ
Σύνολο Ωρών: 6
Σελίδα E Class: https://opencourses.ionio.gr/courses/DDI281/
Προγράμματα Σπουδών: Αναμορφωμένο ΠΠΣ Πληροφορικής από 2025
Το μάθημα «Επιστήμη και Ανάλυση Δεδομένων» εισάγει τους φοιτητές στις θεωρητικές και πρακτικές πτυχές της σύγχρονης επιστήμης των δεδομένων. Εστιάζει στις βασικές αρχές συλλογής, προκαταρκτική επεξεργασία, καθαρισμού και ανάλυσης δεδομένων, καθώς και στις μεθόδους μηχανικής μάθησης για την εξαγωγή γνώσης από μεγάλα και ετερογενή σύνολα δεδομένων. Οι φοιτητές μαθαίνουν πώς να προσεγγίζουν ένα πρόβλημα ανάλυσης δεδομένων από την αρχή ως το τέλος, ξεκινώντας από τη διαμόρφωση υποθέσεων και τη συλλογή δεδομένων, μέχρι την επεξεργασία, την εφαρμογή μοντέλων, την αξιολόγηση της απόδοσης και την τεκμηριωμένη παρουσίαση των αποτελεσμάτων.
Το μάθημα χρησιμοποιεί γλώσσες και εργαλεία όπως η Python και οι βιβλιοθήκες της (pandas, NumPy, scikit-learn, matplotlib) ώστε οι φοιτητές να αποκτήσουν πρακτική εμπειρία σε περιβάλλοντα ανάλυσης δεδομένων. Ιδιαίτερη έμφαση δίνεται στην ικανότητα κατανόησης των περιορισμών και των ερμηνευτικών δυνατοτήτων των μεθόδων, στην ορθολογική χρήση αλγορίθμων και στην ηθική διαχείριση δεδομένων.
Περιεχόμενες Ενότητες
1. Εισαγωγή στην επιστήμη δεδομένων
2. εντοπισμού και διόρθωσης σφαλμάτων ή ασυνέπειας
3. στατιστική ανάλυση δεδομένων
4. Οποιείες τεχνικές ανάλυσης: συσχετικά γραμμικά, συστήματα με κλάδη
δεδομένων, εξαρτήσεις χαρακτηριστικών
5. Μηχανική μάθηση με Python, NumPy, Matplotlib
6. Ανάλυση μεγάλων μάθησης και αρχικής μάθησης
7. Εφαρμογή μηχανικής μάθησης για επίλυση στερεών real-world προβλημάτων
Με την επιτυχή ολοκλήρωση του μαθήματος, οι φοιτητές θα είναι σε θέση να:
• Ορίζουν και εξηγούν βασικές έννοιες της επιστήμης δεδομένων και της ανάλυσης δεδομένων
• Αναγνωρίζουν τα είδη και τα χαρακτηριστικά διαφόρων μορφών δεδομένων (δομημένα, ημιδομημένα, αδόμητα)
• Περιγράφουν βασικές μεθόδους μηχανικής μάθησης και στατιστικής επεξεργασίας δεδομένων
• Κατανοούν τα προβλήματα υπερπροσαρμογής, ανισορροπίας δεδομένων, bias και variance
• Επεξεργάζονται δεδομένα με Python, χρησιμοποιώντας βιβλιοθήκες όπως pandas, NumPy, scikit-learn
•Οπτικοποιούν δεδομένα και αποτελέσματα με χρήση matplotlib
• Επιλέγουν και εφαρμόζουν κατάλληλες τεχνικές μηχανικής μάθησης ανάλογα με τη φύση του προβλήματος
• Αναλύουν την απόδοση μοντέλων με χρήση μετρικών όπως accuracy, precision, recall, F1-score, confusion matrix
• Δημιουργούν pipelines καθαρισμού, μετασχηματισμού και ανάλυσης δεδομένων
Μετά την επιτυχή ολοκλήρωση του μαθήματος, οι φοιτητές θα μπορούν:
• Να εργάζονται αυτόνομα σε εργασίες ανάλυσης δεδομένων από την αρχή ως το τέλος (end-to-end data science projects)
• Να συνδυάζουν θεωρητική γνώση και πρακτική εφαρμογή για την επίλυση πολύπλοκων προβλημάτων
• Να συνεργάζονται αποτελεσματικά σε ομάδες, να τεκμηριώνουν και να παρουσιάζουν τα αποτελέσματα της εργασίας τους
• Να αξιολογούν κριτικά τα αποτελέσματα ανάλυσης και να προτείνουν εναλλακτικές λύσεις
• Provost, F., & Fawcett, T. (2013). Data Science for Business. O'Reilly.
• VanderPlas, J. (2016). Python Data Science Handbook. O'Reilly.
• Grus, J. (2019). Data Science from Scratch. O'Reilly.
• Εκδόσεις Κάλλιπος (π.χ. Συστηματική Εξόρυση Δεδομένων)
Επιστροφή
Σπουδές
e-mail: cs@ionio.gr
<< | < | Οκτώβριος 2025 |
> | >> | ||
Δε | Τρ | Τε | Πε | Πα | Σα | Κυ |
1 |
2 |
3 |
4 |
5 |
||
6 |
7 |
8 |
9 |
10 |
11 |
12 |
13 |
14 |
15 |
16 |
17 |
18 |
19 |
20 |
21 |
22 |
23 |
24 |
25 |
26 |
27 |
28 |
29 |
30 |
31 |