Λεπτομέρειες

ΕίδοςΔιπλωματική
ΚωδικόςDIPL-2006-15
ΤίτλοςΜέθοδοι εκμάθησης ταξινομητών από θετικά παραδείγματα με αριθμητικά χαρακτηριστικά
ΣυγγραφέαςΝικόλαος Τρογκάνης
Έτος2006
Λέξεις κλειδιάMachine Learning, Classification, Supervised Learning, Semi-supervised Learning, Data Description, Learning from positive and unlabeled data, Imbalance Datasets Problem
ΠερίληψηΗ εργασία αυτή μελετά δύο κύριες κατηγορίες μάθησης: μάθηση με πλήρη επίβλεψη και μάθηση με μερική επίβλεψη για το πρόβλημα της ταξινόμησης. Ιδιαίτερη έμφαση δίνεται όταν έχουμε ταξινομημένα παραδείγματα μόνο από την μια κλάση που μας ενδιαφέρει (θετική κλάση), οπότε έχουμε την περιγραφή έννοιας και την μάθηση από θετικά και μη ταξινομημένα παραδείγματα αντίστοιχα. Από την τελευταία αυτή κατηγορία περιγράφουμε τους αλγόριθμους: Naive Bayes Positive (NBP), Naive Bayes Multinomial Positive (NBMP), και Biased-SVM. Ο NBP αναπτύχθηκε στα πλαίσια της εργασίας για την αντιμετώπιση οποιουδήποτε σώματος δεδομένων με διακριτά και κυρίως συνεχή-αριθμητικά χαρακτηριστικά. Το μειονέκτημα των δύο Naive Bayes Positive αλγορίθμων είναι ότι απαιτούν από τον χρήστη να δίνει μια εκτίμηση της εκ των προτέρων πιθανότητας της θετικής κλάσης, η οποία σε αρκετά προβλήματα μπορεί να μην είναι γνωστή, και για αυτό υλοποιήσαμε τέσσερις μεθόδους για τον υπολογισμό της. Οι παραπάνω αλγόριθμοι, αξιολογούνται πειραματικά σε επτά προβλήματα ταξινόμησης μη ισοζυγισμένων σωμάτων δεδομένων, και συγκρίνονται με τους αντίστοιχους αλγορίθμους μάθησης με πλήρη επίβλεψη. Τα αποτελέσματα τους αναδεικνύουν ιδιαίτερα ανταγωνιστικούς. Με ένα πολύ μικρότερο αριθμό ταξινομημένων παραδειγμάτων εκπαίδευσης, και μάλιστα μόνο από την κατηγορία που μας ενδιαφέρει, κάνοντας παράλληλα χρήση μη ταξινομημένων από τον εκπαιδευτή παραδειγμάτων, είναι δυνατόν να κατασκευαστεί ταξινομητής με ισάξια ή ακόμα και καλύτερη απόδοση. Οπότε το κέρδος είναι τεράστιο, αν αναλογιστούμε ότι η ταξινόμηση του σώματος εκπαίδευσης που γίνεται συνήθως χειροκίνητα από τον εκπαιδευτή αποτελεί μια επίπονη και χρονοβόρα διαδικασία. Εξετάζονται επίσης πειραματικά οι μέθοδοι υπολογισμού της εκτίμησης της εκ των προτέρων πιθανότητας της θετικής κλάσης, όπου και βρέθηκε ότι παρουσιάζουν πάρα πολύ καλά αποτελέσματα.
ΚατηγορίαOther
Αρχείο Επισκόπηση


Επιστροφή στην αρχική σελίδα