Κυριακή 8 Νοεμβρίου 2009

openarchives.gr + deixto

Για την εισαγωγή μιας ψηφιακής βιβλιοθήκης στο ευρετήριο του openarchives.gr, απαιτούνταν μέχρι τώρα η υπάρξη μεταδεδομένων σε μορφή OAI-PMH.
Τέτοια μεταδεδομένα δημιουργούνται αυτόματα από λογισμικά όπως το dspace, το eprints και το Open Journal System. Με τον καιρό όμως, δημιουργήθηκε η ανάγκη να προστεθούν στο ευρετήριο και άλλες ψηφιακές βιβλιοθήκες που είτε είναι παλαιότερης τεχνολογίας είτε δεν υποστηρίζουν εξαγωγή μεταδεδομένων σε OAI-PMH ή κάποιο άλλο XML format.

Έτσι, ξεκινώντας με τo DIGMA - Ψηφιοποιημένο Αρχείο Ελληνικής Μουσικής, το openarchives.gr περιλαμβάνει και βιβλιοθήκες ανεξάρτητα από το λογισμικό τους και τα μεταδεδομένα που διαθέτουν. Αυτό το "μαγικό" δεν θα μπορούσε να πραγματοποιηθεί χωρίς την χρήση του DEiXTo.
Link
DEiXTo

Το ΔEiXToDEiXTo) είναι ένα πολύ ισχυρό πρόγραμμα εξαγωγής δεδομένων από ιστοσελίδες που βασίζεται στο πρότυπο Document Object Model (DOM) του W3C. Επιτρέπει την δημιουργία κανόνων εξαγωγής δεδομένων (wrappers) που περιγράφουν με ακρίβεια και αξιοπιστία ποια τμήματα των δεδομένων μιας ιστοσελίδας θα πρέπει να εξαχθούν κάθε φορά. Tα δεδομένα που εξάγονται μέσω του DEiXTo μπορούν να αποθηκευτούν σε RSS, XML ή οποιοδήποτε άλλο format.

Το DEiXTo χρησιμοποιήθηκε με επιτυχία στην εξαγωγή δεδομένων από την Μουσική Βιβλιοθήκη όπου έγινε αρχικά αποδελτίωση των μεταδεδομένων των τεκμηρίων και συνέχεια με κατάλληλη επεξεργασία επιτεύχθηκε ο μετασχηματισμός τους σε OAI-PMH ώστε να εισαχθούν στο ευρετήριο του openarchives.gr.

Δημιουργός του DEiXTo είναι ο Κώστας Ντονάς.

2 σχόλια:

kokkoras είπε...

ΔEiXTo rocks! Απλά το δείχνεις κι έγινε.

Ανώνυμος είπε...
Αυτό το σχόλιο αφαιρέθηκε από έναν διαχειριστή ιστολογίου.