Λεπτομέρειες

ΕίδοςΔιπλωματική
ΚωδικόςDIPL-2015-3
ΤίτλοςΑναζήτηση k-εγγύτερων γειτόνων μεταξύ περιοχών αβεβαιότητας με κανονική κατανομή
ΣυγγραφέαςΧρήστος Κούτρας
Έτος2015
Λέξεις κλειδιάUncertainty, Probabilistic nearest neighbor queries, bivariate Gaussian distribution, moving objects, data streams
ΠερίληψηΑντικείμενο της διπλωματικής εργασίας είναι η ανάπτυξη και υλοποίηση ενός αλγορίθμου για την εύρεση πιθανότερων εγγύτερων γειτόνων από συγκεκριμένες σημειακές εστίες σε μία υποθετική υπηρεσία για κατόχους κινητών τηλεφώνων. Όποτε κάποιος χρήστης υποβάλλει ένα ερώτημα, θέτει τρία κριτήρια: (i) μία σημειακή εστία ενδιαφέροντος q, (ii) τον επιθυμητό αριθμό k των αναζητούμενων γειτόνων, καθώς και (iii) ένα κατώφλι πιθανότητας θ. Για λόγους προστασίας του απορρήτου, κανένας χρήστης δεν αποκαλύπτει στους υπόλοιπους το ακριβές γεωγραφικό στίγμα του, αλλά δηλώνει μία ευρύτερη περιοχή αβεβαιότητας. Στην προκειμένη περίπτωση, οι περιοχές αυτές μοντελοποιούνται σύμφωνα με την κανονική κατανομή. Φυσικά, η αβεβαιότητα μπορεί να έχει διαφορετικές παραμέτρους, εκφράζοντας διαφορετικές βαθμίδες ιδιωτικότητας. Με τον όρο ̈πιθανότεροι εγγύτεροι γείτονες’, εννοούμε ότι σε μία συγκεκριμένη περιοχή αναζήτησης γύρω από την εστία q, έχουν βρεθεί τουλάχιστον k κινούμενοι χρήστες με πιθανοτική κάλυψη μεγαλύτερη από το δεδομένο κατώφλι θ. Η εργασία επικεντρώνεται κυρίως στην ανάπτυξη τεχνικών δεικτοδότησης, φιλτραρίσματος και κλαδέματος βάσει των οποίων θα μπορούμε να μειώσουμε το κόστος και τον χρόνο επεξεργασίας των δεδομένων. Ο αλγόριθμος που προτείνεται επιλέχτηκε να είναι προσεγγιστικός ως προς τον υπολογισμό της πιθανοτικής κάλυψης των περιοχών αβεβαιότητας και παρέχει μία λύση στο πρόβλημα της αποτίμησης πιθανοτικών ερωτημάτων εγγύτερων γειτόνων για αβέβαιες θέσεις κινούμενων αντικειμένων. Με εφαρμογή των παραπάνω τεχνικών, πραγματοποιήθηκαν πειράματα σε συνθετικά δεδομένα πάνω στον χάρτη της Αττικής, από τα οποία προέκυψαν θετικά αποτελέσματα. Επίσης, επιβεβαιώθηκαν οι αναμενόμενες επιδόσεις τους σχετικά με τους χρόνους εκτέλεσης και την ακρίβεια των απαντήσεων. Αυτό που μπορεί να εξαχθεί ως γενικό συμπέρασμα της εργασίας είναι ότι ο εν λόγω αλγόριθμος είναι κατάλληλος για προβλήματα πραγματικού χρόνου, θυσιάζοντας την ακρίβεια για χάρη της έγκαιρης απόκρισης.
ΚατηγορίαData Streams
Αρχείο Επισκόπηση


Επιστροφή στην αρχική σελίδα