Λεπτομέρειες

ΕίδοςΔιπλωματική
ΚωδικόςDIPL-2006-22
ΤίτλοςΜέθοδοι Επαναχρησιμοποίησης Αποτελεσμάτων Εξόρυξης Γνώσης
ΣυγγραφέαςΣοφία Διαμαντίδου
Έτος2006
Λέξεις κλειδιάδοσοληψία, εξόρυξη συχνών προτύπων, ένωση δέντρων συχνών προτύπων, εξόρυξη γνώσης
ΠερίληψηΣτη διπλωματική αυτή εργασία, προτείνουμε μία μέθοδο για την βελτίωση της επίδοσης διαδικασιών εξόρυξης γνώσης, που βασίζεται στην προσθετική επεξεργασία υπαρχόντων αποτελεσμάτων. Πιο συγκεκριμένα, εστιάζουμε στη μέθοδο εξόρυξης συχνών προτύπων FP-growth και προτείνουμε έναν αλγόριθμο ένωσης δύο FP-trees που αντιστοιχούν σε δύο βάσεις με δοσοληψίες πάνω στο ίδιο σύνολο αντικειμένων και τα οποία έχουν κατασκευαστεί σε προηγούμενη εφαρμογή της μεθόδου. Στόχος είναι το mining της ένωσης των δύο βάσεων να γίνεται γρηγορότερα από την κλασική εφαρμγοή της FP-growth, η οποία προϋποθέτει την κατασκευή του FP-tree για την ενωμένη βάση από την αρχή. Η μέθοδος FP-growth είναι μία divide-and-conquer προσέγγιση του προβλήματος της εξόρυξης συχνών προτύπων, η οποία εκτελεί το mining αποκλειστικά σε μία πρότυπη και συμπαγή δομή, το FP-tree. Ως επέκταση της κατασκευής του FP-tree, η εργασία αυτή μελετά και περιγράφει αναλυτικά τις μεθόδους ενημέρωσης και μετασχηματισμού των δέντρων που απαιτούνται για την ένωσή τους, έτσι ώστε το FP-tree που προκύπτει να είναι το ίδιο με αυτό που θα κατασκευαζόταν από την εφαρμογή της FP-growth στην ένωση των βάσεων. Τέλος, γίνεται υλοποίηση του προτεινόμενου αλγορίθμου και μελέτη της επίδοσής του με πειράματα πάνω σε συνθετικά δεδομένα, απ' όπου προκύπτει ότι υπερτερεί της κλασικής διαδικασίας, όσον αφορά τον χρόνο εκτέλεσης.
ΚατηγορίαData Mining
Αρχείο Επισκόπηση


Επιστροφή στην αρχική σελίδα