Λεπτομέρειες

ΕίδοςΔιπλωματική
ΚωδικόςDIPL-2008-8
ΤίτλοςΑυτόματη Θεματική Κατηγοριοποίηση και Σημασιολογική Διεύρυνση Ερωτημάτων για Μηχανή Αναζήτησης με Οντολογίες
ΣυγγραφέαςΑμαλία Κούρτη
Έτος2008
Λέξεις κλειδιάκατηγοριοποίηση, μηχανική μάθηση, k-NN, αναζήτηση εγγύτητας, οντολογία, σημασιολογικός χαρακτηρισμός
ΠερίληψηΣκοπός της παρούσας διπλωματικής είναι η επέκταση του συστήματος GoNTogle, μίας μηχανής αναζήτησης που συνδυάζει λέξεις κλειδιά και σημασιολογία και αναπτύχθηκε στο Εργαστήριο ΣΒΓΔ. Για να είναι χρηστικό το σύστημα αναζήτησης του GoNTogle, απαιτείται η ύπαρξη σημασιολογικών επισημειώσεων επί των εγγράφων μιας συλλογής ή τμημάτων τους, ως προς τους κόμβους μιας οντολογίας. Επειδή η χειροκίνητη δημιουργία αυτών των χαρακτηρισμών είναι έργο επίπονο, υλοποιήθηκε υποσύστημα αυτόματου σημασιολογικού χαρακτηρισμού εγγράφων με χρήση τεχνικών μηχανικής μάθησης. Το σύστημα προτείνει στο χρήστη τους πιο υποσχόμενους χαρακτηρισμούς για κάθε κείμενο, μαθαίνει από τα λάθη του και επιτυγχάνει υψηλή απόδοση. Ένα άλλο συχνό πρόβλημα που παρατηρείται σε αναζητήσεις, είναι η επιστροφή μη επαρκούς αριθμού αποτελεσμάτων, για παράδειγμα αν το ερώτημα αναζήτησης είναι υπερβολικά περιοριστικό. Για την αντιμετώπιση αυτού του προβλήματος προτείνουμε τεχνικές επέκτασης του ερωτήματος στο σημασιολογικό άξονα, υπό το γενικό τίτλο «αναζήτηση σημασιολογικής γειτονίας». Με τις μεθόδους αυτές ο χρήστης μπορεί να εξερευνήσει αποδοτικά τον χώρο των σημασιολογικά συναφών αποτελεσμάτων σχετικά με το αρχικό του ερώτημα. Επίσης υλοποιήθηκαν επεκτάσεις του συστήματος GoNTogle, που αφορούν στην ευρετηριοποίηση εγγράφων. Τέλος, δημιουργήθηκε οντολογία για την κατηγοριοποίηση επιστημονικών δημοσιεύσεων Πληροφορικής βασισμένη στην κατάταξη ACM. Πειράματα με πραγματικά δεδομένα με χρήση αυτής της οντολογίας αναδεικνύουν την αποδοτικότητα των μεθόδων μας.
ΚατηγορίαWWW and DBMS
Αρχείο Επισκόπηση


Επιστροφή στην αρχική σελίδα