Λεπτομέρειες

ΕίδοςΔιπλωματική
ΚωδικόςDIPL-2008-2
Τίτλος∆ιαχωρισμός και κατηγοριοποίηση καταχωρήσεων ιστολόγιων
ΣυγγραφέαςΑναστασιάδης Αντώνιος
Έτος2008
Λέξεις κλειδιάδιαδίκτυο,ιστολόγιο,κατηγοριοποίηση κειμένου,άποψη
ΠερίληψηΣκοπός της εργασίας αυτής είναι η ανάπτυξη μεθόδων για τον διαχωρισμό και την εξαγωγή των καταχωρήσεων από ιστοσελίδες ιστολόγιων και την κα- τηγοριοποίησή τους με βάση την άποψη που εκφράζουν για κάποιο θέμα. Αυτές οι μέθοδοι εκμεταλλεύονται την συντακτική πληροφορία του κώδικα των ιστοσελίδων, τα feeds τους καθώς και τις ημερομηνίες που περιέχουν ωστε να εξάγει τις καταχωρήσεις τους. Κατόπιν, χρησιμοποιούμε έναν αλ- γόριθμο ∆ιανυσμάτων Υποστήριξης ωστε να ταξινομήσουμε τις καταχωρήσεις που εξήχθησαν από ιστολόγια με κριτικές ταινιών σε δύο σύνολα θετικών και αρνητικών απόψεων αντίστοιχα. Στα πλαίσια της εργασίας υλοποιήθηκε μια εφαρμογή στη γλώσσα Java η οποία δέχεται ένα σύνολο ιστολόγιων, τα επεξεργάζεται και εξάγει τις καταχω- ρήσεις τους με αυτοματοποιημένο και αποδοτικό τρόπο. Επίσης, υλοποιήθη- καν και άλλα εργαλεία τα οποία δέχονται τα δεδομένα των καταχωρήσεων, τα μετατρέπουν σε μορφή έτοιμη προς κατηγοριοποίηση και πραγματοποιούν την ταξινόμησή τους. Η μεθοδολογία αυτή θα μπορούσε να χρησιμοποιηθεί σαν βάση για ένα σύστημα αυτόματης ανάλυσης των ιστολόγιων του διαδικτύου και ταξινόμη- σης της πληροφορίας τους, χρησιμοποιώντας επιπλέον μεθόδους όπως γλωσ- σολογική ανάλυση και αυτόματη εκμάθηση στην εξαγωγή και την ταξινόμηση των καταχωρήσεων.
ΚατηγορίαData Mining
Αρχείο Επισκόπηση


Επιστροφή στην αρχική σελίδα