Λεπτομέρειες

ΕίδοςΔιπλωματική
ΚωδικόςDIPL-2007-17
ΤίτλοςΑνάλυση τοπολογικής διάταξης ιστοσελίδας για αποδοτικότερη γεωκωδικοποίηση
ΣυγγραφέαςΜπάλα Παναγιώτης
Έτος2007
Λέξεις κλειδιάαποδοτική εξαγωγή γεωγραφικής πληροφορίας, σημασιολογική επεξεργασία, ομαδοποίηση στοιχείων, μελέτη τοπολογίας, html tags
ΠερίληψηΗ αποδοτική εξαγωγή γεωγραφικής πληροφορίας (geoparsing) από ιστοσελίδες απαιτεί τη σημασιολογική ανάλυση της σελίδας και την ανακάλυψη της τοπολογικής της δομής. στην παρούσα διπλωματική εργασία αναπτύσσονται και παρουσιάζονται τεχνικές που επιλύουν τα δυο αυτά θέματα. η σημασιολογική επεξεργασία της σελίδας υποδηλώνει την εξέταση των στοιχείων της ως προς το περιεχόμενό τους και τη συσχέτιση μεταξύ τους. έτσι αναπτύσσονται νέοι αλγόριθμοι και ορίζονται κριτήρια που επιχειρούν ομαδοποίηση των στοιχείων της ιστοσελίδας ελέγχοντας τη συνάφεια του περιεχομένου τους. αποτέλεσμα της διαδικασίας είναι η απεικόνιση της σελίδας σαν ένα σύνολο από ομάδες στοιχείων οι οποίες χαρακτηρίζονται από περιεχόμενο συγκεκριμένου τύπου. για τη μελέτη της τοπολογίας των σελίδων θα στηριχτούμε αποκλειστικά στην επεξεργασία των html tags για το λόγο αυτό εξετάζουμε μόνο αμιγώς html αρχεία. οι αλγόριθμοι που θα παρουσιάσουμε εκμεταλλεύονται τις τοπολογικές ιδιότητες των tags και σχηματίζουν μια εικόνα της χωρικής διάταξης των στοιχείων της ιστοσελίδας. Για κάθε στοιχείο πλέον θα γνωρίζουμε τα γειτονικά του στοιχεία καθώς και τη σχετική του θέση στη σελίδα. το τελικό αποτέλεσμα μπορεί να δοθεί στον geoparser, ο οποίος μπορεί να επιλέξει ομάδα στοιχείων με βάση το περιεχόμενό τους σε συνδυασμό με τη θέση τους στη σελίδα. τέλος, οφείλουμε να τονίσουμε ότι οι δυο διαδικασίες, αυτή της σημασιολογικής και εκείνη της τοπολογικής ανάλυσης, είναι τελείως ανεξάρτητες μεταξύ τους.
ΚατηγορίαGeographic Information Systems
Αρχείο Επισκόπηση


Επιστροφή στην αρχική σελίδα