Λεπτομέρειες

ΕίδοςΔιπλωματική
ΚωδικόςDIPL-2016-3
ΤίτλοςΕποπτεία γεωγραφικής κάλυψης συζητήσεων σε κοινωνικά δίκτυα
ΣυγγραφέαςΕμμανουήλ Λουκαδάκης
Έτος2016
Λέξεις κλειδιάSocial networks, popular topics, spatial coverage, geotagged messages, data streams
ΠερίληψηΑντικείμενο της διπλωματικής εργασίας είναι η ανάπτυξη ενός αλγορίθμου για την ανίχνευση δημοφιλών συζήτησεων που εκτυλίσσονται στα κοινωνικά δίκτυα, καθώς και για την εποπτεία της γεωγραφικής τους κάλυψης με την πάροδο του χρόνου. Συγκεκριμένα, η μελέτη επικεντρώθηκε στο κοινωνικό δίκτυο Twitter, καθώς τα σχετικά μηνύματα δημοσιεύονται με πολύ γρήγορο ρυθμό, επομένως θεωρείται ότι συγκροτούν ένα ρεύμα δεδομένων. Όταν διαδραματίζεται ένα γεγονός (λ.χ. ποδοσφαιρικός αγώνας, διαδήλωση, συναυλία), οι χρήστες των κοινωνικών δικτύων έχουν την τάση να δημοσιεύουν μηνύματα και να συζητούν σχετικά με αυτό. Τέτοια γεγονότα μπορούν να χαρακτηριστούν ως δημοφιλείς συζητήσεις και τα σχετικά μηνύματα στο Twitter συνήθως συνοδεύονται από χαρακτηριστικές ετικέτες. Πολλές φορές, μία τέτοια συζήτηση είναι δημοφιλής μόνο κατά τόπους, υποθέτοντας βέβαια ότι είναι γνωστή η γεωγραφική θέση των χρηστών που συμμετέχουν σ ́ αυτήν. Στην παρούσα διπλωματική εργασία, μελετάμε την εξέλιξη τέτοιων συζητήσεων στον χώρο και στον χρόνο, ανανεώνοντας τις περιοχές επιρροής τους σε πραγματικό χρόνο. Παρακολουθώντας τις μεταβολές στην γεωγραφική κάλυψη τέτοιων φαινομένων, μπορούμε να εξάγουμε χρήσιμα συμπεράσματα σχετικά με την ένταση κάθε φαινομένου και τον αντίκτυπο που έχει στην κοινωνία. Η εργασία επικεντρώνεται κυρίως στην ανάπτυξη τεχνικών για ανίχνευση συζητήσεων, προσδιορισμό των πιο δημοφιλών από αυτές και εποπτεία της γεωγραφικής κάλυψής τους. Ο αλγόριθμος είναι επίτηδες προσεγγιστικός ως προς την εκτίμηση της γεωγραφικής κάλυψης των δημοφιλών συζητήσεων, στοχεύοντας σε βελτιωμένες επιδόσεις ως προς τον χρόνο εκτέλεσης. Η πειραματική μελέτη σε πραγματικά δεδομένα από το Twitter για την ευρύτερη περιοχή του Λονδίνου, επιβεβαίωσε ότι η προτεινόμενη μεθοδολογία είναι ικανή να αντιμετωπίσει κλιμακούμενους όγκους μηνυμάτων για διάφορες τιμές παραμέτρων επιστρέφοντας εκτιμήσεις καλής ποιότητας. Ως γενικό συμπέρασμα της εργασίας μπορεί να ειπωθεί ότι ο αλγόριθμος είναι κατάλληλος για ανίχνευση της χωρικής κάλυψης τέτοιων συζητήσεων, θυσιάζοντας την ακρίβεια προς όφελος της έγκαιρης απόκρισης.
ΚατηγορίαData Streams
Αρχείο Επισκόπηση


Επιστροφή στην αρχική σελίδα