Λεπτομέρειες

ΕίδοςΔιπλωματική
ΚωδικόςDIPL-2008-11
ΤίτλοςΥλοποίηση Μηχανισμού Κατασκευής και Βελτίωσης Αντιστοιχιών για Δίκτυα Ομότιμων Βάσεων Δεδομένων
ΣυγγραφέαςΔημοσθένης Μπουσούνης
Έτος2008
Λέξεις κλειδιάΔίκτυα Ομότιμων Βάσεων Δεδομένων, Παραγωγή Αντιστοιχιών, Ισοδυναμίες Ιδιοτήτων, Ετερογένεια Δεδομένων
ΠερίληψηΈνα από τα βασικότερα προβλήματα σε εφαρμογές ομότιμων βάσεων δεδομένων είναι η γρήγορη και ακριβής αντιστοίχιση δεδομένων που είναι εκφρασμένα σε εν γένει διαφορετικές μορφές, ο τρόπος δηλαδή που μπορεί να ξεπερασθεί το πρόβλημα της ετερογένειας δεδομένων. Στις περισσότερες περιπτώσεις, τα συστήματα ομότιμων ΒΔ χρησιμοποιούν δηλωτικά ερωτήματα – όψεις, που φανερώνουν τις αντιστοιχίες πινάκων των δύο σχημάτων σε conjunctive μορφή. Παρόλα αυτά κρίνεται απαραίτητη η ανάπτυξη μιας διαδικασίας (ημι)αυτόματης παραγωγής των αντιστοιχιών αυτών, ώστε η αντιστοίχιση δύο σχημάτων να γίνεται με τη μικρότερη δυνατή παρέμβαση του χρήστη. Ο σκοπός της διπλωματικής αυτής εργασίας είναι η παρουσίαση και υλοποίηση ενός αλγορίθμου για την παραγωγή και σταδιακή βελτίωση αντιστοιχιών πινάκων (table mappings) μεταξύ δύο σχεσιακών σχημάτων. Υποβοηθούμενη από ένα automatic schema matching tool και από την ανάδραση του χρήστη, η διαδικασία αυτή, συνδυάζει με ένα σύστημα σταδιακής μάθησης απλές ισοδυναμίες ιδιοτήτων (element correspondences) και παράγει SQL ερωτήματα που αποτελούν αντιστοιχίες εκφρασμένες σε GAV/LAV μορφή. Ο τρόπος που γίνεται αυτός ο συνδυασμός ισοδυναμιών, έγκειται στην εύρεση των επιπλέον περιορισμών που πρέπει να ενσωματωθούν στις δηλωτικές όψεις, ώστε η αντιστοιχία που θα παράγεται να είναι σημασιολογικά σωστή. Ιδιαίτερη έμφαση δόθηκε στους περιορισμούς συνδέσμων, η αναζήτηση των οποίων υλοποιήθηκε και ελέγχθηκε με δύο διαφορετικά ευριστικά κριτήρια. Βασικό προτέρημα του μηχανισμού που σχεδιάσθηκε είναι η δυνατότητα λειτουργίας του, τόσο μεταξύ πλήρων σχημάτων εισόδου, όσο και μεταξύ σχημάτων που αποκαλύπτονται σταδιακά από εισερχόμενα ερωτήματα. Για το λόγο αυτό η διπλωματική αυτή εργασία μπορεί να αποτελέσει αφενός, ένα σύστημα παραγωγής και βελτίωσης αντιστοιχιών μεταξύ κόμβων ενός p2p συστήματος, όπου η δομή των σχημάτων γνωστοποιείται σταδιακά, αφετέρου ένα ξεχωριστό εργαλείο εύρεσης GAV/LAV αντιστοιχιών μεταξύ δύο σχεσιακών σχημάτων πάνω στο ίδιο αντικείμενο (domain specific schemas). Έτσι λοιπόν, τα αποτελέσματα της διαδικασίας που αναπτύχθηκε, ελέγχθηκαν σε πλήρη σχήματα, προσομοιώνοντας, τη λειτουργία ενός ανεξάρτητου εργαλείου, αλλά παράλληλα σχεδιάσθηκε και υλοποιήθηκε η ενσωμάτωση του μηχανισμού, στο σύστημα GrouPeer, ένα σύστημα που συνδυάζει τεχνικές μετάφρασης ερωτημάτων πάνω από GAV/LAV αντιστοιχίες και μεθόδους βελτίωσης αντιστοιχιών, ώστε να ξεπεράσει το πρόβλημα της σταδιακής απαξίωσης ερωτημάτων σε δίκτυα ομότιμων βάσεων δεδομένων.
ΚατηγορίαP2P Data Management
Αρχείο Επισκόπηση


Επιστροφή στην αρχική σελίδα