Η Επιστήμη Δεδομένων είναι ένα διεπιστημονικό πεδίο του οποίου αντικείμενο είναι η ανάπτυξη μεθόδων, διαδικασιών και συστημάτων για την εξαγωγή γνώσης από αδόμητη ή δομημένη πληροφορία. Αφορά σε μια νέα προσέγγιση αντιμετώπισης της διαρκώς αυξανόμενης ανάγκης ανάλυσης δεδομένων, η οποία έχει προκύψει τα τελευταία χρόνια με την έκρηξη του διαδικτύου και την εμφάνιση δεδομένων τεράστιου όγκου σε πολλές εφαρμογές.
Σκοπός αυτού του μαθήματος είναι η παρουσίαση και η κριτική κατανόηση προηγμένων αλγοριθμικών τεχνικών ανάλυσης όγκου και πολυπλοκότητας δεδομένων. Συγκεκριμένα παρουσιάζονται: μοντέλα και προγραμματιστικές τεχνικές επεξεργασίας μεγάλου όγκου δεδομένων· πολυπλοκότητα αλγορίθμων μεγάλου όγκου δεδομένων· εξερεύνηση κανόνων συσχέτισης μέσω συχνών ομάδων αντικειμένων· κατακερματισμός ευαίσθητος ως προς την τοπικότητα· συσταδοποίηση δεδομένων· μείωση διάστασης· ανάλυση συνδέσμων και συσχετίσεων σε τεράστια γραφήματα (π.χ., PageRank)· ανάλυση κοινωνικών δικτύων και εντοπισμός κοινοτήτων· συστήματα παροχής συστάσεων· αλγόριθμοι για ροές μεγάλου όγκου δεδομένων. Ιδιαίτερη έμφαση δίνεται στις θεμελιώδεις αλγοριθμικές τεχνικές ανάλυσης και επεξεργασίας δεδομένων μεγάλου όγκου, καθώς και στην εφαρμοσιμότητά τους σε πληθώρα πρακτικών εφαρμογών.