Weekly outline

  • Ακαδημαϊκό Έτος 2023-2024

    Το μάθημα προσφέρεται στα πλαίσια του ΔΠΜΣ "Επιστήμη Δεδομένων και Μηχανική Μάθηση", στους Υ.Δ. της ΣΗΜΜΥ, καθώς και σε άλλα μεταπτυχιακά προγράμματα (ΑΛΜΑ, ΕΜΕ, Μαθηματική Προτυποποίηση).

    Διαλέξεις

    • Παρασκευή, 13:15-16:00, αίθ. 002, Νέο Κτ. Ηλεκτρολόγων ΕΜΠ
      (οι φοιτητές του ΑΛΜΑ θα έχουν 1 πρόσθετη ώρα, 16:15-17:00)

    Έναρξη

    • Παρασκευή 23/2/2024

    Διδάσκοντες

    Βοηθός διδασκαλίας

    • Σταύρος Πετσαλάκης, Υ.Δ. (stpetsalakis@gmail.com)

    Βιβλιογραφία



  • 1η διάλεξη

    Διάλεξη 23/2

    • 2η Διάλεξη

      Διάλεξη 1/3

      Σύντομη επισκόπηση του clustering

      Clustering Techniques, The curse of dimensionality, Hierarchical clustering, K-means, BFR algorithm, Cure. (Διαφάνειες, 1-56).

      Προτεινόμενη μελέτη: [MMDS] Ενότητες: 7.1, 7.2, 7.3 και 7.4.
      Περαιτέρω μελέτη:      [TSKK]  Κεφάλαιο 7

      • 3η Διάλεξη

        Διάλεξη 15/3

        Κατακερματισμός (hashing) I

        (διαφάνειες U. Zwick από μάθημα Advanced Algorithms, Tel Aviv University): 

        • Κλειστή και ανοιχτή διευθυνσιοδότηση. Universal hash families. Αλυσίδωση.
        • Παράγοντας φόρτου και επίδρασή του στον χρόνο εκτέλεσης.

        Παρουσιάστηκαν οι διαφάνειες 1-20.

        Προτεινόμενη μελέτη: σημειώσεις (και αναφορές που περιέχονται).

        • 4η Διάλεξη

          Διάλεξη 29/3

          Κατακερματισμός (hashing) II

          (διαφάνειες U. Zwick από μάθημα Advanced Algorithms, Tel Aviv University): 

          • Επιθυμητές ιδιότητες. Καθολικότητα και k-ανεξαρτησία. Carter-Wegman Universal hash family. 
          • Ανάλυση χρόνου βασικών πράξεων στην κλειστή και ανοιχτή διεθυνσιοδότηση.
          • Μέθοδοι διερεύνησης στην ανοιχτή διευθυνσιοδότηση.
          • Τέλειος κατακερματισμός (perfect hashing). Κατακερματισμός κούκου (Cuckoo hashing). 

          Παρουσιάστηκαν οι διαφάνειες 14-20 (επανάληψη) και 21-54.

          Προτεινόμενη μελέτη: σημειώσεις (και αναφορές που περιέχονται).
          • 5η Διάλεξη

            Διάλεξη 5/4

            • Εξόρυξη κανόνων συσχέτισης και συνόλων στοιχείων που εμφανίζονται συχνά σε μεγάλα δεδομένα. 
            • Αλγόριθμος A-priori και FP-Growth. 

            Διαφάνειες

            Προτεινόμενη μελέτη: [MMDS] κεφ. 6 (link) (ενότητες 6.1, 6.2). Συμπληρωματικά: [TSKK] κεφ. 6 (link) (ενότητες 6.1, 6.2).





            • 6η διάλεξη

              Διάλεξη 12/4

              Προτεινόμενη μελέτη: [MMDS] κεφ. 6 (link) [ενότητες 6.3, 6.4].

              Δείτε ακόμη: [TSKK] κεφ. 6 (link) (ενότητα 6.5).