Ο διαδραστικός Ηλεκτρονικός οδηγός για το Μετασχηματισμό δομημένων δεδομένων παρέχει οδηγίες σχετικά με την διαδικασία αντιστοίχισης και μετασχηματισμού δεδομένων που θα διευκολύνουν τη συσσώρευση, την ενιαία πρόσβαση και την επιτυχή διαχείριση ετερογενών δεδομένων. Απευθύνεται σε παρόχους περιεχομένων που επιθυμούν να μετασχηματίσουν τα δεδομένα τους και να τα διαθέσουν σε αποθετήρια γνώσης, και έχει εκπαιδευτικό χαρακτήρα.
Ο ηλεκτρονικός οδηγός περιέχει τις εξής κατηγορίες ενοτήτων:
- Data Aggregation for Information Integration (Συγκέντρωση Δεδομένων με σκοπό την Ενοποίηση της Πληροφορίας)
- Background Knowledge (Γνωστικό Υπόβαθρο)
- Mapping Methodology (Μεθοδολογία Αντιστοίχισης)
- Existing Mapping Tools (Υπάρχοντα Εργαλεία Αντιστοίχισης) που περιγράφουμε αναλυτικά στις παρακάτω παραγράφους.
Επιλέχθηκε ο ηλεκτρονικός οδηγός για τον μετασχηματισμό δεδομένων να αναπτυχθεί στη αγγλική γλώσσα για την μεγαλύτερη διάχυση αυτού.
Ακολουθεί αναλυτική περιγραφή των ενοτήτων:
- Συγκέντρωση Δεδομένων με σκοπό την Ενοποίηση της Πληροφορίας: Σε αυτήν την κατηγορία αναφέρονται γενικά στοιχεία για την ανάγκη της συγκέντρωσης και διασύνδεσης ποικίλων, ανομοιογενών και μεγάλου αριθμού πηγών πληροφοριών με κύριο στόχο την ενοποίηση και τη διαχείριση αυτών. Η επιτυχής ενσωμάτωση πλούσιων δεδομένων και μεταδεδομένων εξυπηρετεί παράλληλα και στην ομοιόμορφη πρόσβαση σε ετερογενείς και αυτόνομες πηγές δεδομένων. Αυτό μπορεί να επιτευχθεί με την τεχνολογία της αντιστοίχισης (mapping technology). Η εισαγωγή λοιπόν στη σημασιολογική συσχέτιση και αντιστοίχιση με σκοπό τη συγκέντρωση και ολοκλήρωση της πληροφορίας γίνεται κατανοητή μέσα από πληροφορίες που περιγράφονται σε υπο-ενότητες όπως :
- Ανάλυση του προβλήματος
- Ορισμός Αντιστοίχισης
- Τα οφέλη μίας καλής αντιστοίχισης
- Αντιστοιχίζοντας σχεσιακές βάσεις σε οντολογίες
- Χρήστες και διαφορετικοί ρόλοι
- Γνωστικό Υπόβαθρο: Στη συγκεκριμένη ενότητα περιγράφονται οι βασικές, στοιχειώδεις γνώσεις που χρειάζεται να έχει κάποιος για να μπορεί να χρησιμοποιήσει την τεχνολογία αντιστοιχίσεων για μετασχηματισμό δεδομένων. Η κάθε διαδικασία ερμηνείας, αντιστοίχισης της πληροφορίας και μοντελοποίησης εννοιών προϋποθέτει γενικές γνώσεις σχετικές με οντολογίες και σημασιολογικά μοντέλα, γνώση για μεθόδους αναπαράστασης εννοιών και των συσχετίσεών τους, και εξοικείωση με γλώσσες περιγραφής πόρων και σημασιολογίας των δεδομένων, καθώς και κατανόηση της βασικής θεωρίας Linked Open Data. Το γνωστικό υπόβαθρο αποτελεί επομένως μία εισαγωγή σε στοιχειώδεις έννοιες όπως: Knowledge Representation (Αναπαράσταση Γνώσης), Ontologies and Semantic Models (Οντολογίες και Σημασιολογικά Μοντέλα), Linked Data and Resource Description Framework Schema (RDFS).
- Μεθοδολογία Αντιστοίχισης: Η συγκεκριμένη ενότητα περιλαμβάνει πληροφορίες για τις μέθοδο που χρησιμοποιείται στη διαδικασία αντιστοίχισης και μετασχηματισμού σε ισοδύναμες εννοιολογικά προτάσεις. Η διαδικασία αντιστοίχισης του σχήματος μιας βάσης δεδομένων σε μια οντολογία δεν είναι εύκολη ούτε ασήμαντη, και επομένως είναι απαραίτητο να γνωρίζουμε τις προδιαγραφές αντιστοίχισης για να υποστηρίξουμε το μετασχηματισμό κάθε διακριτού σχήματος. Είναι ζωτικής σημασίας κατά τη διάρκεια του μετασχηματισμού, οι πληροφορίες που κωδικοποιούνται στη βάση δεδομένων προέλευσης να μην χαθούν, η αρχική «έννοια» θα πρέπει να διατηρηθεί όσο το δυνατόν περισσότερο. Η Μεθοδολογία Αντιστοίχισης περιλαμβάνει πληροφορίες που αφορούν:
- The Mapping workflow/process (τη διαδικασία/ροή εργασιών της αντιστοίχισης)
- Different Expressions of mappings (Διαφορετικές Μορφές αντιστοιχίσεων)
- How we handle identifiers and labels (appellation) for instances (Πώς διαχειριζόμαστε τους κωδικούς και τα ονόματα για τα στιγμιότυπα)
- Mapping to CIDOC CRM (Αντιστοίχιση στην οντολογία του CIDOC CRM)
- Υπάρχοντα Εργαλεία Αντιστοίχισης: Η διαδικασία της αντιστοίχισης των δεδομένων διαδραματίζει σημαντικό ρόλο στην ενοποίηση και αποθήκευση των δεδομένων και επομένως χρειάζεται υποστήριξη από τα κατάλληλα εργαλεία. Η συγκεκριμένη ενότητα περιλαμβάνει πληροφορίες για τα εργαλεία και τις γλώσσες που είναι διαθέσιμα σήμερα και υποστηρίζουν τέτοιου είδους διαδικασίες. Λεπτομερής αναφορά γίνεται και στο εργαλείο 3Μ, ένα σύστημα αντιστοιχίσεων βασισμένο στη γλώσσα X3ML που στοχεύει σε μία τυποποιημένη περιγραφή αντιστοιχίσεων και μετασχηματισμού.