Λεπτομέρειες

ΕίδοςΔιπλωματική
ΚωδικόςDIPL-2011-1
ΤίτλοςΜελέτη μεθόδων για την έμμεση αύξηση των δεδομένων εκπαίδευσης συναρτήσεων ταξινόμησης σε αποτελέσματα αναζήτησης
ΣυγγραφέαςΠαναγιώτης Πάρχας
Έτος2011
Λέξεις κλειδιάweb search optimization, clustering, SVM, relevance judgments, information retrieval, LETOR benchmark, βελτίωση σειράς εμφάνισης αποτελεσμάτων αναζήτησης, προσωποποίηση αναζήτησης, συσταδοποίηση, διανύσματα χαρακτηριστικών
ΠερίληψηΚαθώς ο όγκος πληροφορίας που διακινείται μέσω του διαδικτύου αυξάνεται με εκθετικό ρυθμό, η ανάγκη αποδοτικής αναζήτησης γίνεται όλο και πιο επιβεβλημένη. Η αναζήτηση πλέον διαφοροποιείται ανάλογα με τον χρήστη και τις συνήθειές του. Καθώς ο χρήστης αλλάζει συνεχώς το μοτίβο (pattern) των επιλογών του, δεν μπορεί να κατασκευαστεί ντετερμινιστικός αλγόριθμος που να επιστρέφει την βέλτιστη σειρά αποτελεσμάτων για τον εκάστοτε χρήστη. Μια προσέγγιση για την επίτευξη της προσωποποιημένης αναζήτησης είναι η χρήση νευρωνικών δικτύων. Τα νευρωνικά δίκτυα αποτελούν προσεγγιστικά μοντέλα τα οποία ουσιαστικά ελαχιστοποιούν μια συνάρτηση βάση κάποιων περιορισμών. Για την υλοποίηση τους χρειαζόμαστε κάποιο σύνολο εκμάθησης. Θεωρητικά, όσο μεγαλύτερο και πιο αντιπροσωπευτικό είναι το σύνολο εκμάθησης τόσο καλύτερο είναι το μοντέλο που κατασκευάζεται. Το σύνολο όμως των αποτελεσμάτων που αξιολογούν οι χρήστες σε κάθε αναζήτησή τους είναι μικρό (συνήθως μόνο τα 10 πρώτα αποτελέσματα). Η ιδέα αυτής της διπλωματικής είναι να επεκτείνουμε τις πραγματικές αξιολογήσεις των χρηστών σε αποτελέσματα που είναι συναφή με βάση κάποια συγκεκριμένα χαρακτηριστικά. Υλοποιούμε δηλαδή συσταδοποίηση (clustering) των αποτελεσμάτων, αποφασίζουμε ποιες συστάδες θα κρατήσουμε, ορίζουμε μια ενιαία αξιολόγηση για κάθε συστάδα και την επεκτείνουμε σε όλα τα μέλη του. Επίσης δοκιμάστηκε μεγάλο σύνολο αλγορίθμων για το clustering ώστε να επιτευχθεί το καλύτερο δυνατό αποτέλεσμα. Αυτά τα νέα σύνολα δόθηκαν σαν είσοδος στο νευρωνικό (SVM) και κατασκευάστηκε το μοντέλο που στη συνέχεια ελέγχθηκε με τη χρήση ενός διαφορετικού συνόλου ελέγχου(dataset) που προσομοιώνει την νέα αναζήτηση του χρήστη. Όλη η διαδικασία αναλύεται με λεπτομέρειες στις σελίδες που ακολουθούν.
ΚατηγορίαWWW and DBMS
Αρχείο Επισκόπηση


Επιστροφή στην αρχική σελίδα