Λεπτομέρειες

ΕίδοςΔιδακτορικό
ΚωδικόςPHD-2004-2
ΤίτλοςΜοντελοποίηση και Βελτιστοποίηση Διεργασιών Εξαγωγής, Μετασχηματισμού και Φόρτωσης Δεδομένων σε Αποθήκες Δεδομένων
ΣυγγραφέαςΑλκης Σιμιτσής
Έτος2004
Λέξεις κλειδιάETL, Data Warehouses
ΠερίληψηΟι λειτουργικές διαδικασίες των Αποθηκών Δεδομένων (ΑΔ) συνήθως συνθέτουν μια εντατική και σύνθετη ροή έργου, ενώ αποτελούν και αναπόσπαστο τμήμα του ‘πίσω-μέρους’ της αρχιτεκτονικής μιας ΑΔ. Για να αντιμετωπιστεί η πολυπλοκότητα και ο χειρισμός τέτοιων ροών έργου, καθώς και για τη διευκόλυνση και επεξεργασία των λειτουργικών διαδικασιών της ΑΔ, χρησιμοποιούνται εξειδικευμένες διαδικασίες με τη γενική ονομασία: διαδικασίες Εξαγωγής – Μετασχηματισμού – Φόρτωσης (ΕΜΦ) δεδομένων. Οι διαδικασίες αυτές καθίστανται υπεύθυνες για την εξαγωγή των δεδομένων από διάφορες πηγές, τον καθαρισμό τους, την προσαρμογή και μετασχηματισμό τους, και τέλος, για τη φόρτωσή τους στην ΑΔ. Ωστόσο, παρά το γεγονός ότι οι διαδικασίες ΕΜΦ αποτελούν μια καινούρια, ολοένα αναπτυσσόμενη αγορά, η αυστηρή μοντελοποίηση και επεξεργασία αυτών δεν έχει επαρκώς πραγματοποιηθεί από την ερευνητική κοινότητα. Η Διατριβή αυτή μελετά τη σχεδίαση, την ανάπτυξη και τη βελτιστοποίηση διαδικασιών ΕΜΦ. Προτείνει ένα πρωτότυπο εννοιολογικό μοντέλο για τα αρχικά στάδια ενός έργου σχεδίασης και ανάπτυξης μιας ΑΔ. Κατά τη διάρκεια ενός τέτοιου έργου, χρονικοί περιορισμοί απαιτούν περισσότερο μια γρήγορη τεκμηρίωση των εμπλεκομένων μετασχηματισμών και των χώρων αποθήκευσης δεδομένων μαζί με τα γνωρίσματά τους, παρά μία σε βάθος περιγραφή της σύνθετης ροής έργου. Επιπλέον, η Διατριβή προτείνει ένα αυστηρό λογικό μοντέλο για το περιβάλλον των διαδικασιών ΕΜΦ, που επικεντρώνεται στη ροή των δεδομένων από τις πηγές προς την ΑΔ, μέσω της σύνθεσης διεργασιών και συνόλων εγγραφών. Το μοντέλο αυτό έχει δύο κύρια χαρακτηριστικά: τη γενικότητα και την επεκτασιμότητα. Τα δύο αυτά μοντέλα συμπληρώνονται με μια μεθοδολογία ημί-αυτόματης μετάβασης από το εννοιολογικό στο λογικό μοντέλο. Επιπρόσθετα, η Διατριβή διερευνά θέματα βελτιστοποίησης ροών έργου για διαδικασίες ΕΜΦ, έχοντας ως απώτερο σκοπό την εύρεση της βέλτιστης ροής έργου. Τέλος, η Διατριβή συμπληρώνει τα προαναφερόμενα θέματα παρουσιάζοντας ένα πρότυπο εργαλείο ΕΜΦ, που ονομάζεται ΑΡΚΤΟΣ ΙΙ, με στόχο τη διευκόλυνση της σχεδίασης, της (επανα-)χρησιμοποίησης και της βελτιστοποίησης ροών έργου για διαδικασίες ΕΜΦ.
ΚατηγορίαETL
Αρχείο Επισκόπηση


Επιστροφή στην αρχική σελίδα