Acest document descrie un model abstract pentru metadatele Dublin Core.
1. Introducere
Acest document specifică un model abstract pentru metadatele Dublin Core. Scopul principal al acestui document este de a specifica componentele și constructele utilizate în metadatele Dublin Core. Definește natura componentelor utilizate și descrie modul în care acele componente sunt combinate pentru a crea structuri informaționale. Acesta oferă un model informațional care este independent de orice sintaxă de codare specială. Un astfel de model informațional ne permite să înțelegem mai bine tipurile de descrieri pe care le codificăm și facilitează dezvoltarea unor mai bune corelări și traduceri de sintaxă încrucișată.
Acest document vizează în primul rând dezvoltatorii de aplicații software care folosesc metadatele Dublin Core, persoanele implicate în elaborarea de noi instrucțiuni de codificare a sintaxelor pentru metadatele Dublin Core și pentru cei care dezvoltă profiluri de metadate pentru aplicații bazate pe vocabularele DCMI sau alte vocabulare compatibile.
Modelul abstract DCMI se bazează pe activitatea desfășurată de consorțiul World Wide Web Consortium (W3C) privind Resource Description Framework (RDF) [RDF, RDFS]. Utilizarea conceptelor din RDF este rezumată mai jos în Secțiunea 5.
Modelul abstract DCMI este reprezentat aici folosind diagrame de clasă UML [UML]. Cititorii care nu sunt familiarizați cu diagramele de clasă UML ar trebui să rețină că liniile care se termină într-o săgeată bloc trebuie citite ca fiind „este” sau „este o” (de exemplu, „o valoare este o resursă”) și că liniile care încep cu un bloc diamant trebuie citite „conține un” sau „are un” (de exemplu, „o declarație conține un URI de proprietate”). Alte relații sunt etichetate corespunzător. În acest document, cuvintele și expresiile redactate în cursive sunt definite în Secțiunea 7, Terminologie.
2. Modelul Abstract al DCMI
2.1 Modelul resurselor DCMI
Modelul abstract al resurselor explicat prin descrieri este după cum urmează:
Fiecare resursă descrisă este descrisă utilizând una sau mai multe perechi de proprietăți-valoare.
Fiecare pereche proprietate-valoare este alcătuită dintr-o proprietate și o valoare.
Fiecare valoare este o resursă - o entitate fizică, digitală sau conceptuală ori literală care este asociată cu o proprietate atunci când o pereche proprietate-valoare este utilizată pentru a descrie o resursă. Prin urmare, fiecare valoare este fie o valoare literală, fie o valoare non-literală:
O valoare literală este o valoare care este un literal.
O valoare non-literală este o valoare care este o entitate fizică, digitală sau conceptuală.
Un literal este o entitate care utilizează un șir Unicode ca formă lexicală, împreună cu un tag opțional de limbaj sau care specifică un tip de date, pentru a denumi o resursă (adică „literală” așa cum este definită de RDF [RDF]).
2.2 Modelul setului descrierilor în DCMI
Modelul abstract al seturilor de descriere pentru metadatele DC este după cum urmează:
Un set de descriere este un set de una sau mai multe descrieri, fiecare dintre acestea descriind o singură resursă.
O descriere este alcătuită dintr-una sau mai multe declarații (despre o singură resursă și numai una singură) și un singur URI de resursă descrisă sau deloc (un URI care identifică resursa descrisă).
Fiecare declarație (statement) instanțiază o pereche de proprietăți-valoare și este alcătuită dintr-un URI de proprietate (un URI care identifică o proprietate) și o valoare surogat.
O valoare surogat este fie o valoare literală surogat, fie o valoare non-literală surogat:
O valoare surogat literală este o valoare surogat pentru o valoare literală și este alcătuită dintr-un singur string valoare. Stringul de valoare este un literal care codifică valoarea literală.
O valoare surogat non-literală este o valoare surogat pentru o valoare non-literală și este contituită din zero sau un URI al valorii (un URI care identifică valoarea non-literală asociată cu proprietatea), zero sau un URI al unei scheme de codare a vocabularului (un URI care identifică schema de codare a vocabularului din care valoarea non-literală este membru) și zero sau mai multe string-uri valoare. Fiecare string valoare este un literal care reprezintă valoarea non-literală.
Un string valoare este fie un simplu string valoare sau un typed value string
Un simplu string valoare poate avea asociată o valoare string de limbă care este un tag de reprezentare a unei limbi conform ISO (de exemplu, en-GB). Valorile string simple sunt create pentru a fi citite de oameni.
Un typed value string are un URI asociat unei scheme de codificare a sintaxei care identifică o schemă de codificare a sintaxei.
2.3 Modelul pentru un vocabular DCMI
Modelul abstract al vocabularelor utilizate în descrierile metadatelor DC este după cum urmează:
Un vocabular (vocabulary) este un set de unul sau mai mulți termeni. Fiecare termen este un membru al unuia sau mai multor vocabulare.
Un termen (term) este o proprietate (element), o clasă (class), o schemă de codificare a vocabularului (vocabulary encoding scheme) sau o schemă de codificare a sintaxei (syntax encoding scheme).
Fiecare proprietate (property) poate fi legată de una sau mai multe clase printr-o relație de tipul își are domeniul în (has domain). Acolo unde se declară că o proprietate are o astfel de relație cu o clasă, iar proprietatea face parte dintr-o pereche de proprietate/valoare, rezultă că resursa descrisă este o instanță a acelei clase.
Fiecare proprietate (property) poate fi legată de una sau mai multe clase printr-o relație de tipul este într-o plajă (has range). Acolo unde se afirmă că o proprietate are o astfel de relație cu o clasă iar proprietatea face parte dintr-o pereche proprietate/valoare, rezultă că valoarea este o instanță a acelei clase.
Fiecare resursă poate fi o instanță a uneia sau a mai multor clase.
Fiecare resursă poate fi membru al uneia sau mai multor scheme de codare a vocabularului.
Fiecare clasă poate stabili o relație cu una sau mai multe alte clase printr-o sub-clasă (sub-class of) de relație (unde cele două clase sunt definite astfel încât toate resursele care sunt instanțe ale sub-clasei sunt la rândul lor instanțe ale clasei cu care a stabilit relația).
Fiecare proprietate poate stabili o relație cu una sau mai multe proprietăți diferite printr-o sub-proprietate de relație. Acolo unde este menționat faptul că o astfel de relație există, cele două proprietăți sunt definite în așa fel ca de fiecare dată când o sub-proprietate este parte a unei perechi proprietate/valoare ce descrie o resursă, resursa este descrisă la rândul ei folosind o pereche proprietate/valoare secundară constituită din proprietate și valoare.
Fiecare schemă de codare a sintaxei este o clasă (de literale).
A se nota faptul că termenul de „vocabular” este utilizat aici pentru a indica strict un set de termeni, un set în care membrii sunt proprietăți (elemente), clase, scheme de codare a vocabularului și/sau scheme de codare a sintaxei.
2.4 Note
O serie de lucruri despre model merită notate:
Fiecare valoare non-literală poate fi resursa descrisă într-o descriere separată din același set de descrieri. De exemplu, o descriere separată poate oferi metadate despre persoana care este creatorul resursei descrise. O valoare literală nu poate fi resursa descrisă într-o descriere separată.
Modelul pentru setul de descriere al DCMI nu oferă un mecanism explicit pentru a indica clasele resursei descrise. Claseleresursei descrise pot fi indicate explicit folosind una sau mai multe declarații (statements) în descriere sau poate fi inserată din domeniile proprietăților folosite în descriere.
Modelul setului pentru descriere al DCMI indică diferența dintre valorile literale și cele non-literale prin prezența într-o declarație a unei valori literale surogat sau a unei valori non-literale surogat. Pentru o valoare non-literală, modelul setului pentru o descriere DCMI nu oferă un mecanism explicit pentru a indica mai departe claselevalorii. Clasele oricărei valori non-literale pot fi indicate explicit folosind una sau mai multe declarații într-o descriere făcută separat despre acea valoare sau poate fi inserată din plaja (range) pe care o oferă proprietatea. Pentru o valoare literală, claselevalorii pot fi indicate explicit folosind o schemă de codare a sintaxei pentru valoarea string sau poate fi inserată din plaja (range) pe care o oferă proprietatea.
Modelul abstract prezentat mai sus indică faptul că fiecare descriere de metadate DC descrie o resursă și numai una. Acest principiu este cunoscut ca unu-la-unu.
Totuși, aplicațiile care folosesc metadate au tendința de a se baza pe seturi de descrieri grupate liber (acolo unde resursele descrise, de regulă sunt într-o relație), cunoscute aici ca seturi de descriere. De exemplu, un set de descriere poate să fie constituit din descrierea unui tablou și a autorului acestuia. Mai mult, de cele mai multe ori un set de descriere va conține și o descriere a setului de descriere (cunoscut uneori ca „metadate administrative” sau „meta-metadate”).
Seturile descriptive sunt instanțiate, de exemplu în scopul de a face schimb de date între aplicațiile software sub formă de înregistrări de metadate respectând ghidurile de codate DCMI (de exemplu, meta tagurile XHTML, XML și RDF/XML) [DCMI-ENCODINGS].
4. Valorile
O valoare de metadate DC poate fi o entitate fizică, digitală sau conceptuală sau un literal asociat cu o proprietate atunci când o pereche proprietate/valoare este folosită pentru a descrie o resursă. De exemplu, o valoare asociată cu proprietatea Creator din Dublin Core este o persoană, o organizație sau un serviciu - o entitate fizică. o valoare asociată cu proprietatea Dată (Date) a Dublin Core este un punct în timp (sau un interval) - o entitate conceptuală. O valoare asociată cu proprietatea Areal (Coverage) din Dublin Core este o regiune geografică sau o țară - o entitate fizică. O valoare asociată cu proprietatea Subiect (Subject) din Dublin Core este un concept (o entitate conceptuală) sau un obiect fizic (o entitate fizică). O valoare asociată cu proprietatea nume (name) din schema FOAF este un literal. Fiecare dintre aceste entități sunt câte o resursă.
5. Semanticile Modelului Abstract DCMI
Trebuie notat faptul că această Recomandare nu definește explicit o semantică formală pentru Modelul Abstract DCMI. Intenția este ca semnaticile formale să fie definite prin referință către semanticile RDF și Schema RDF așa cum este definit în [RDFMT]. Echivalențele dintre unele noțiuni în Modelul Abstract al DCMI și notațiile corespondente din RDF sunt introduse în următorul tabel:
împreună cu Recomandarea DCMI „Exprimarea Dublin Core folosind Resource Description Framework (RDF)” [DCRDF], aceste echivalențe formează baza semanticilor formale ale Modelului Abstract al DCMI. Totuși, detaliile unei astfel de semantici depășesc sfera acestei Recomandări.
6. Îndrumări de codare
Îndrumările de codare specifice (meta tagurile HTML, XML, RDF/XML, etc.) [DCMI-ENCODINGS] nu trebuie să codeze toate aspectele modelului abstract descris mai sus. Totuși, ar trebui să trimită la Modelul Abstract DCMI unde să indice care părți ale modelului sunt codate și care nu sunt.
Îndrumările de codare ar trebui să indice cum o valoare non-literală ar trebui să fie tratată ca o resursă descrisă printr-o descriere separată în acele cazuri în care o valoare non-literală surogat nu include o valoare URI.
7. Terminologie
Documentul folosește următorii termeni:
class (http://www.w3.org/2000/01/rdf-schema#Class) Este un grup care conține membrii care au atribute, comportamente, relații sau semantici comune; un soi de categorie. described resource O resursă care este descrisă printr-o descriere. described resource URI Un URI care identifică resursa descrisă. description Una sau mai multe declarații despre o resursă unică. description set Un set de una sau mai multe descrieri, fiecare dintre acestea descriind o singură resursă. element (http://www.w3.org/1999/02/22-rdf-syntax-ns#Property) Un sinonim pentru proprietate. Ar trebui remarcat faptul că termenul de element este folosit uzual pentru a trimite la o componentă de markup structural din interiorul documentului XML. has domain (http://www.w3.org/2000/01/rdf-schema#domain) Este o relație dintre o proprietate și o clasă care indică dacă proprietatea este dintr-o pereche proprietate/valoare, implicând faptul că resursa descrisă este o instanță a acelei clase. has range (http://www.w3.org/2000/01/rdf-schema#range) O relație între o proprietate și o clasă care indică dacă proprietatea este parte a unei perechi proprietate/valoare, implicând faptul că valoarea este o instanță a acelei clase. instance of O relație între o resursă și o clasă care indică clasa a cărei instanță este resursa. literal O entitate care folosește un șir de caractere codate Unicode ca formă lexicală împreună cu un tag de limbă opțional sau un anumit tip de date pentru a indica o resursă (adică „literal” așa cum este definit de RDF [RDF]). literal value O valoare care este un literal. literal value surrogate O valoare surogat pentru o valoare literală compusă strict dintr-o valoare string (un literal) care codează însăși valoarea). member of (http://purl.org/dc/dcam/memberOf) O relație între o resursă și o schemă de codare a unui vocabular care indică faptul că o resursă este membră a unui set. non-literal value O valoare care este fizică, digitală sau conceptuală. non-literal value surrogate O valoare surogat pentru o valoare non-literală constituită din URI-ul unei proprietăți (un URI care identifică o proprietate), zero sau o valoare URI (un URI care identifică valoarea non-literală asociată proprietății), zero sau un singur URI al unei scheme de codare a unui vocabular (un URI care identifică schema de codare a vocabularului a cărei membru este valoarea) și zero sau mai multe valori string (literale care reprezintă valoarea). plain value string O valoare string fără un URI al unei scheme asociate pentru codarea sintaxei. property (http://www.w3.org/1999/02/22-rdf-syntax-ns#Property) Un aspect specific, o caracteristică, un atribut sau o relație folosite pentru a descrie o resursă. property URI Un URI care identifică o proprietate unică. property/value pair Combinația unei proprietăți cu o valoare folosite pentru a descrie caracteristica unei resurse. record Instanțierea unui set de descriere creat respectând unul din ghidurile de codare DCMI (de exemplu, meta tagurile XHTML, XML și RDF/XML). resource (http://www.w3.org/2000/01/rdf-schema#Resource) Orice poate fi identificat. Exemplele familiare includ documentele electronice, o imagine, un serviciu (de exemplu, „prognoza meteo a zilei pentru Los Angeles”), și o colecție de alte resurse. Nu toate resursele pot fi „obținute” din rețea; de exemplu, persoanele, corporațiile, conceptele și cărțile dintr-o bibliotecă pot fi considerate resurse, de asemenea. statement Instanțierea unei perechi proprietate-valoare constituită din URI-ul unei proprietăți (un URI care identifică o proprietate) și o valoare surogat. sub-class of (http://www.w3.org/2000/01/rdf-schema#subClassOf) O relație între două clase care indică faptul că cele două clase sunt definite în așa fel încât toate resursele care sunt instanțe ale sub-clasei sunt instanțe ale clasei înrudite. sub-property of (http://www.w3.org/2000/01/rdf-schema#SubPropertyOf). O relație între două proprietăți care indică faptul că două proprietăți sunt definite în așa fel ca atunci când sub-proprietatea este parte a perechii proprietate/valoare ce descrie o resursă rezultă că resursa este descrisă folosind o a doua pereche proprietate/valoare care este formată din proprietate și valoare. syntax encoding scheme (http://www.w3.org/2000/01/rdf-schema#Datatype) Un set de string-uri și setul de reguli asociat care descriu o corespondență între acel set de string-uri și un set de resurse. Regulile de stabilire a corespondențelor ar putea defini cum este structurat string-ul (de exemplu Box-ul DCMI) sau pur și simplu ar putea enumera toate string-urile și resursele corespondente (de exemplu ISO 3166). syntax encoding scheme URI Un URI care identifică o schemă de codare a sintaxei. term O proprietate (element), clasă, schemă de codare a vocabularului sau schemă de codare a sintaxei. typed value string O valoare string care are asociat un URI al unei scheme de codare a sintaxei. URI Un Uniform Resource Identifier [URI] sau Internationalized Resource Identifier [IRI]. Din perspectiva unui Model Abstract DCMI, echivalența URI-urilor este definită așa cum este în RDF [RDF]. value Entitatea fizică, entitatea conceptuală sau un literal (o resursă) care este asociată cu o proprietate atunci când este folosită o pereche proprietate-valoare pentru a descrie o resursă. value URI Este un URI care identifică valoarea. value string Un literal asociat opțional fie cu URI-ul unei scheme de codare a sintaxei sau o valoare string de limbă. În cazul unei valori literale surogat, un string valoare codează valoarea; în cazul unei valori surogat non-literale, un string de valoare reprezintă valoarea. value string language Un tag ISO care indică limba string-ului de valoare. value surrogate O valoare literală surogat sau o valoare non-literală surogat. vocabulary Un set ce conține unul sau mai mulți termeni. vocabulary encoding scheme (http://purl.org/dc/dcam/VocabularyEncodingScheme) Un set enumerat de resurse. vocabulary encoding scheme URI Un URI care identifică o schemă de codare a unui vocabular.
Apendix A - Relația cu principiile gramaticale moștenite ale DCMI
Modelul din substratul metadatelor Dublin Core a evoluat față de momentul în care primele reguli formale au fost propuse la finalul anilor 1999. Următorul tabel prezintă în mare echivalențele terminologice între versiunile anterioare ale principiilor gramaticale ale DCMI [DCMI-GRAM-PRIN] și Modelul Abstract DCMI actual.
Principii gramaticale DCMI
Model Abstract DCMI
termen de vocabular (vocabulary term)
resursă - resource
element
property sau element
rafinament al elementului (element refinement)
property cu relație către o sub-property of
schema de codare (encoding scheme)
syntax encoding scheme sau vocabulary encoding scheme
schema de codare a sintaxei (syntax encoding scheme)
syntax encoding scheme
calificator (qualifier)
property cu relație către o sub-property of, syntax encoding scheme sau vocabulary encoding scheme
schemă de codare a vocabularului (vocabulary encoding scheme)
vocabulary encoding scheme
Tabelul 2 - Principiile gramaticale ale DCMI și Modelul Abstract DCMI
[DCRDF] Nilsson, Mikael, Andy Powell, Pete Johnston, and Ambjörn Naeve. Expressing Dublin Core metadata using the Resource Description Framework (RDF). DCMI Proposed Recommendation. April 2007. < http://dublincore.org/documents/dc-rdf/>
[IRI] Duerst, M., M. Suignard. RFC 3987: Internationalized Resource Identifiers (IRIs). Internet Engineering Task Force (IETF). January 2005. < http://www.ietf.org/rfc/rfc3987.txt>
[RDF] Klyne, Graham and Jeremy Carroll, editors. Resource Description Framework: Concepts and Abstract Syntax. W3C Recommendation. 10 February 2004. < http://www.w3.org/TR/rdf-concepts/>
[RDFS] Brickley, Dan and R.V. Guha, editors. RDF Vocabulary Description Language 1.0: RDF Schema. W3C Recommendation. 10 February 2004. < http://www.w3.org/TR/rdf-schema/>
[UML] Booch, Grady, James Rumbaugh and Ivar Jacobson. The Unified Modeling Language User Guide. Addison-Wesley, 1998.
[URI] Berners-Lee, T., R. Fielding, L. Masinter. RFC 3986: Uniform Resource Identifier (URI): Generic Syntax. Internet Engineering Task Force (IETF). January 2005. < http://www.ietf.org/rfc/rfc3986.txt> Acknowledgements
Mulțumiri lui Dan Brickley, Rachel Heery, Alistair Miles, Sarah Pulis, membrii DC Usage Board și membrilor DCMI Architecture Community pentru comentarii pe versiunile anterioare ale documentului.
Erata din 2007-09-24: A fost corectată o eroare de redactare -- a fost șters un „is” în plus din două instanțe ale lui „which is is”.
Erata din 2013-02-11: URL fix pentru DCMI-GRAM-PRIN.
Dacă nu există alte mențiuni, documentele DCMI sunt licențiate Creative Commons Attribution 3.0 Unported License. Consultați Notele documentului DCMI pentru mai multe instrucțiuni.
Dublin Core Metadata Initiative (DCMI) este un proiect în baza ASIS&T—a U.S. 501(c)(3) nonprofit supus Codului Fiscal Intern Statelor Unite ale Americii. Contribuțiile la DCMI prin ASIS&T sunt deductibile din taxe în baza legilor Statelor Unite. Registrul Dublin Core Metadata este găzduit de Centrul de Cercetare pentru Comunitățile de Cunoaștere de la Universitatea din Tsukuba, Japonia.