Λεπτομέρειες

ΕίδοςΔιπλωματική
ΚωδικόςDIPL-2014-6
ΤίτλοςΣύστημα Αυτόματης Εξαγωγής Αλληλεπιδράσεων μεταξύ Μορίων microRNA και Γονιδίων από Επιστημονικές Δημοσιεύσεις στις Βιοεπιστήμες
ΣυγγραφέαςΡοδοθέα-Μυρσίνη Τσουπίδη
Έτος2014
Λέξεις κλειδιάmicroRNA, miRNA, γονίδιο, πρωτεΐνη, Εξαγωγή Συσχετίσεων, Κατηγοριοποίηση, Επεξεργασία Φυσικής Γλώσσας, Ανάκτηση Πληροφορίας
ΠερίληψηΗ Εξαγωγή Πληροφορίας είναι η διαδικασία αυτόματης εξαγωγής δομημένης πληροφορίας από μη-δομημένα δεδομένα που είναι διαθέσιμα σε μορφή κατάλληλη για μηχανιστική επεξεργασία. Μία εφαρμογή της είναι η Εξαγωγή Συσχετίσεων μεταξύ διαφορετικών οντοτήτων από κείμενο φυσικής γλώσσας. Στόχος της παρούσας εργασίας ήταν η κατασκευή ενός στατιστικού μοντέλου για την Εξαγωγή των Αλληλεπιδράσεων μεταξύ βιολογικών μορίων microRNA και γονιδίων, από επιστημονικές δημοσιεύσεις. Η μέθοδος περιλαμβάνει την αναγνώριση των Οντοτήτων που αναφέρονται σε microRNA και Γονίδια στο κείμενο, την εξαγωγή γλωσσικής πληροφορίας σχετικά με τους δύο όρους και την εκπαίδευση ενός στατιστικού μοντέλου χρησιμοποιώντας δεδομένα από επικυρωμένες αλληλεπιδράσεις microRNA-Γονιδίων. Το μοντέλο αυτό μπορεί στη συνέχεια να εφαρμοστεί σε νέα κείμενα δημοσιεύσεων και να εντοπίσει τις αλληλεπιδράσεις που αναφέρονται. Τα δεδομένα εκπαίδευσης προέρχονται από ειδικές βάσεις δεδομένων που περιλαμβάνουν αλληλεπιδράσεις microRNA και Γονιδίων, οι οποίες έχουν επιβεβαιωθεί πειραματικά. Τέτοιες βάσεις δεδομένων είναι το TarBase, το miRTarBase και το miRecords και τα δεδομένα που παρέχουν έχουν επιμεληθεί από ανθρώπους. Παράλληλα, στα πλαίσια της διπλωματικής αυτής υλοποιήθηκαν εργαλεία για την επίλυση υποπροβλημάτων της Επεξεργασίας Φυσικής Γλώσσας, τα οποία είναι απαραίτητα στην κατασκευή του μοντέλου.
ΚατηγορίαOther
Αρχείο Επισκόπηση


Επιστροφή στην αρχική σελίδα