Μάθημα Κωδικός  Εξάμηνο Τύπος Ώρες Εργαστήριο /
Φροντιστήριο
ECTS Διδάσκοντες
Διαχείριση Μεγάλου Όγκου Δεδομένων  ΘΕ700  Ζ Επιλογής  4
4
Τσουμάκος Δ.

Μαθησιακά Αποτελέσματα

Το μάθημα αποτελεί προηγμένο εκπαιδευτικό εργαλείο σχετικό με θεωρητικά και πρακτικά θέματα τεχνολογιών αιχμής για την επεξεργασία δεδομένων κλίμακος.

Η ύλη του μαθήματος στοχεύει στην όσο πιο ουσιαστική εισαγωγή των φοιτητών στις βασικές αρχές, δομή και λειτουργία των τεχνολογιών επεξεργασίας μεγάλου όγκου δεδομένων καθώς και στα μοντέρνα εργαλεία τα οποία προσφέρονται για την υλοποίησή τους.

Ως εκ τούτου, η ύλη αναφέρεται σε προηγμένες έννοιες σχετικές με τη διαχείριση δεδομένων μεγάλου όγκου. Εκτείνεται τόσο σε θεωρητικό (περιγραφή συστημάτων και αρχιτεκτονικών) όσο και πρακτικό (προγραμματιστικές γλώσσες, εργαλεία, βιβλιοθήκες) επίπεδο, προσφέροντας γνώσεις και στους δύο άξονες. Έτσι, ο φοιτητής να έχει μία συνολική αντίληψη των εργαλείων και μεθοδολογιών που βρίσκονται στην αιχμή της τεχνολογίας σχετικά με τα μεγάλου όγκου δεδομένα. Εκτιμώντας τη σημασία που έχει στις μέρες μας η δημιουργία και διαχείριση δεδομένων τόσο σε οικονομικό όσο και κοινωνικό επίπεδο, το μάθημα λειτουργεί τόσο μαθησιακά όσο και καθαρά εμπειρικά σχετικά με τεχνολογίες που χρησιμοποιούνται καθημερινά από εκατομμύρια πολίτες.

Τέλος, στόχο του μαθήματος αποτελεί και η έκθεση των φοιτητών, μέσω των εργαστηριακών ασκήσεων, σε πολλές από τις τεχνολογίες αιχμής (π.χ., NoSQL databases, Hadoop, Spark, κλπ) κυρίως σε πρακτικό επίπεδο, με σκοπό την κατανόηση βασικών αρχών, δυσκολίας αλλά και τριβής με έναν χώρο που αλλάζει ραγδαία.

Με την επιτυχή ολοκλήρωση του μαθήματος ο φοιτητής / τρια θα είναι σε θέση να:

  • Έχει κατανοήσει τα βασικά χαρακτηριστικά των εφαρμογών που επεξεργάζονται μεγάλου όγκου δεδομένα και τις απαιτήσεις τους.
  • Έχει γνώση ανεπτυγμένων τεχνικών και εργαλείων μέσω των οποίων θα μπορούσε να προγραμματίσει/βελτιστοποιήσει μια τέτοια εφαρμογή.
  • Χρησιμοποιεί τις προγραμματιστικές τεχνικές και θεωρία του μαθήματος για αποδοτικό σχεδιασμό, βελτιστοποίση απόδοσης και αποδοτική εκτέλεση/δημιουργία εφαρμογών που διαχειρίζονται μεγάλου όγκου δεδομένα.
  • Χρησιμοποιεί τις γνώσεις του προκειμένου να αναλύσει, να συγκρίνει και να προτείνει εναλλακτικές σχετικά με συγκεκριμένες εφαρμογές και πιθανά προβλήματα απόδοσής τους.
  • Συνεργαστεί με τους συμφοιτητές του στη δημιουργία και εκτέλεση σύνθετων εφαρμογών διαχείρισης μεγάλου όγκου δεδομένων.

Περιγραφή Μαθήματος

Τα Υπολογιστικά Νέφη (Cloud Computing). Βάσεις δεδομένων στο διαδίκτυο: Σχεσιακές, παράλληλες και κατανεμημένες βάσεις, με έμφαση στις τεχνολογίες κατανεμημένων συστημάτων αρχείων (HDFS), ΝοSQL (HBase, Cassandra), graphdatabases(Neo4j). Μοντέλα υπολογισμού μεγάλου όγκου δεδομένων (MapReduce, BSP) και πλατφόρμες που τις εφαρμόζουν (Hadoop, Hama, Spark, κλπ). Modern Data Science και η γλώσσα R. Εφαρμογές των παραπάνω και υλοποίηση αλγορίθμων με κατανεμημένο τρόπο για επεξεργασία μεγάλου όγκου δεδομένων.

Υλικό Μαθήματος

https://e-class.ionio.gr/courses/DCS262/

http://users.ionio.gr/~dtsouma/bigdata-fall2015.html

Προτεινόμενη βιβλιογραφία

  1. Εξόρυξη από Μεγάλα Σύνολα Δεδομένων”, Anand Rajaraman, Jeffrey David Ullman, ΕΚΔΟΣΕΙΣ ΝΕΩΝ ΤΕΧΝΟΛΟΓΙΩΝ ΜΟΝ. ΕΠΕ 2012, ΑΘΗΝΑ

  2. Η ΜΕΘΟΔΟΣ PAGERANK ΤΗΣ GOOGLE ΚΑΙ ΑΛΛΑ ΣΥΣΤΗΜΑΤΑ ΚΑΤΑΤΑΞΗΣ ΙΣΤΟΣΕΛΙΔΩΝ”, LANGVILLE AMY, MEYER CARL ΙΔΡΥΜΑ ΤΕΧΝΟΛΟΓΙΑΣ & ΕΡΕΥΝΑΣ-ΠΑΝΕΠΙΣΤΗΜΙΑΚΕΣ ΕΚΔΟΣΕΙΣ ΚΡΗΤΗΣ 2010