Λεπτομέρειες

ΕίδοςΔιδακτορικό
ΚωδικόςPHD-2000-1
ΤίτλοςΖητήματα Μοντελοποίησης και Ποιότητας Συγκεντρωτικών Αποθηκών Δεδομένων
ΣυγγραφέαςΠαναγιώτης Βασιλειάδης
Έτος2000
Λέξεις κλειδιάData Warehousing, OLAP, Quality
ΠερίληψηΟι Συγκεντρωτικές Αποθήκες Δεδομένων (ΣΑΔ) ορίζονται ως 'θεματικά προσδιορισμένες, ενιαίες, μεταβαλλόμενες στο χρόνο, μη διαγραφόμενες συλλογές δεδομένων, χρησιμοποιούμενες κυρίως για τη λήψη αποφάσεων σε επιχειρησιακό επίπεδο'. Τα τελευταία χρόνια η τεχνολογία των συγκεντρωτικών αποθηκών δεδομένων έγινε μια σημαντική στρατηγική επιλογή των οργανισμών στην προσπάθεια ενοποίησης ετερογενών πηγών πληροφορίας και της χρήσης της τεχνολογίας Σύγχρονης Αναλυτικής Επεξεργασίας Δεδομένων (OLAP). Δυστυχώς ούτε η διαδικασία συγκέντρωσης, ούτε η διαδικασία αποθήκευσης είναι απολύτως αξιόπιστες. Για παράδειγμα, στη βιβλιογραφία αναφέρεται ότι εξ’ αιτίας λαθών στα δεδομένα, πάνω από 2 δισεκατομμύρια δολάρια χάθηκαν σε μία και μόνη υπηρεσία, καθώς και ότι οι κατασκευαστικές εταιρείες ξόδεψαν πάνω από το 25% των πωλήσεών τους σε μη κερδοφόρες τακτικές, ποσοστό που φτάνει το 40% για εταιρείες παροχής υπηρεσιών. Το ερώτημα που προκύπτει λοιπόν είναι πώς θα οργανώσουμε τη σχεδίαση, διαχείριση και εξέλιξη της συγκεντρωτικής αποθήκης δεδομένων με τέτοιο τρόπο ώστε όλες οι διαφορετικές -και συχνά αλληλοαναιρούμενες- επιδιώξεις ποιότητας των χρηστών να μπορούν να επιτευχθούν ταυτοχρόνως. Για την αντιμετώπιση του προβλήματος αυτού, η εν λόγω διατριβή συνεισφέρει ως εξής: Το πρώτο σημαντικό αποτέλεσμα είναι ένα πλαίσιο ορισμού μεταπληροφορίας για τη διαχείριση συγκεντρωτικών αποθηκών δεδομένων μέσα από ένα λεξικό μεταπληροφορίας. Το πλαίσιο αυτό, απαιτεί την κατηγοριοποίηση της μεταπληροφορίας σε δύο τουλάχιστον στρώματα συμμετοχής και τρεις προοπτικές. Τα στρώματα συμμετοχής διακρίνονται στο στρώμα μεταμοντέλου που καλύπτει το σχήμα του λεξικού μεταπληροφορίας και το στρώμα μεταδεδομένων που αφορά τη μεταπληροφορία για κάθε συγκεκριμένη συγκεντρωτική αποθήκη δεδομένων. Οι προοπτικές είναι οι γνωστές από το χώρο των πληροφοριακών συστημάτων εννοιολογική, λογική και φυσική προοπτική. Για κάθε μία από τις επόψεις μιας συγκεντρωτικής αποθήκης δεδομένων, ορίζεται και ένα μοντέλο, εντός του προαναφερθέντος πλαισίου. Κατ’ αρχήν υιοθετείται ένα ορισμένο μεταμοντέλο αρχιτεκτονικής για συγκεντρωτικές αποθήκες δεδομένων από τη διεθνή βιβλιογραφία. Επιπλέον, ορίζεται ένα μεταμοντέλο ποιότητας επεκτείνοντας τη γνωστή τεχνική Στόχου-Ερώτησης-Μετρικής για τη διαχείριση ποιότητας σε πληροφοριακά συστήματα. Εμπλουτίζεται το αφαιρετικό στρώμα μεταμοντέλου με υποδείγματα που αφορούν αφενός στόχους εμπλεκομένων και αφετέρου μετρικών για κλάσεις αντικειμένων της συγκεντρωτικής αποθήκης δεδομένων. Στη συνέχεια, προτείνεται ένα μεταμοντέλο για τις λειτουργικές διαδικασίες της συγκεντρωτικής αποθήκης δεδομένων. Το εν λόγω μεταμοντέλο επιτρέπει τη διαχείριση, σχεδίαση και εξέλιξη της συγκεντρωτικής αποθήκης δεδομένων, καταγράφοντας και τις τρεις προοπτικές (εννοιολογική, λογική και φυσική) των διαδικασιών μιας συγκεντρωτικής αποθήκης δεδομένων. Η εκ προοιμίου μεταχείριση του λεξικού μεταπληροφορίας γίνεται εφικτή από ένα σύνολο «βημάτων», ή «ερωτήσεων ποιότητας» που ορίζουν τη μεθοδολογία για την ποιοτική διαχείριση και εξέλιξη μιας συγκεντρωτικής αποθήκης δεδομένων, με βάση τα προαναφερθέντα μεταμοντέλα. Η προσέγγιση αυτή επεκτείνει τη μέθοδο Στόχου-Ερώτησης-Μετρικής με βάση την ιδέα ότι ένας στόχος είναι λειτουργικά ορισμένος από ένα σύνολο ερωτήσεων. Κατά συνέπεια, παρέχονται συγκεκριμένες «ερωτήσεις» για όλο τον κύκλο ζωής ενός στόχου ποιότητας. Με τον τρόπο αυτό, το λεξικό μεταπληροφορίας δεν είναι απλώς γεμάτο με στατικές πληροφορίες, αλλά μπορεί να είναι και λειτουργικά χρήσιμο με συστηματικό τρόπο. Ειδική μέριμνα έχει δοθεί σε ένα συγκεκριμένο τμήμα της μοντελοποίησης της αρχιτεκτονικής μιας συγκεντρωτικής αποθήκης δεδομένων, τη μοντελοποίηση βάσεων δεδομένων για OLAP. Παρουσιάζεται ένα λογικό μοντέλο για κύβους, με βάση την παρατήρηση ότι ένας κύβος δεν είναι μια αυθύπαρκτη οντότητα, αλλά μια όψη πάνω σε ένα υποκείμενο σύνολο δεδομένων. Το προτεινόμενο μοντέλο είναι αρκετά ισχυρό στο να καλύπτει όλες τις συνηθισμένες πράξεις OLAP όπως επιλογή, roll-up και drill down, μέσω μιας συνεπούς και πλήρης άλγεβρας. Δείχνεται επίσης πώς αυτό το μοντέλο μπορεί να χρησιμοποιηθεί σαν η βάση για την επεξεργασία λειτουργιών στους κύβους και παρουσιάζονται συντακτικοί χαρακτηρισμοί για τα προβλήματα της χρησιμότητα κύβων. Η διατριβή παρουσιάζει ακόμα και μια εκτενή καταγραφή της υπάρχουσας βιβλιογραφίας καθώς και μια λίστα από σχετικά ανοιχτά ερευνητικά ζητήματα.
ΚατηγορίαData Warehousing
Αρχείο Επισκόπηση


Επιστροφή στην αρχική σελίδα