manuscripta.se

En digital katalog över medeltida och tidigmoderna handskrifter i Sverige

Presentation för bibliografiska rådet

KB, Stockholm, 27 juni 2023

Patrik Granholm, Kungliga biblioteket

Introduktion

  • Digital katalog över medeltida och tidigmoderna handskrifter i Sverige

  • Utvecklas och förvaltas av KB

  • TEI är metadataformatet för handskriftsbeskrivningarna
  • IIIF används för tillgängliggörande av digitaliserade handskrifter
  • Aktuell status
    • 419 handskrifter (262 digitaliserade) från 9 institutioner
    • ca 90 000 digitaliserade sidor
    • ca 7 000 auktoritetsfiler för personer, organisationer, platser, verk och bibliografiska poster
  • Innehåller i dagsläget främst grekiska och medeltida fornsvenska handskrifter men utökas fortlöpande med annat material
  • Det långsiktiga målet är att inkludera samtliga medeltida och tidigmoderna handskrifter i Sverige

Handskriftsbeskrivningar (TEI)

  • Metadataformatet TEI (Text Encoding Initiative) är en standard för uppmärkning av text i digital form baserad på XML
  • TEI är standardformatet för beskrivningar av medeltida handskrifter
  • TEI lämpar sig väl för detaljerade handskriftsbeskrivningar eftersom den hierarkiska strukturen i TEI motsvarar de fyra delar som används i handskriftskatalogisering:
    • Beskrivning av innehåll
    • Kodikologisk beskrivning
    • Proveniens
    • Bibliografi
  • TEI har stöd för beskrivningar av kodikologiska enheter
  • TEI taggning möjliggör avancerade sökningar och konvertering mellan olika metadataformat

Kort introduktion till XML

<element attribut="värde">innehåll</element>
<author xml:lang="la">Hesiodus</author>

<title type="uniform" xml:lang="la">Opera et dies</title>

<locus from="2r" to="8v" scheme="folios"/>

Exempel

Grundstrukturen i ett TEI-dokument

<TEI>
  <teiHeader>
    <fileDesc>
      …
      <sourceDesc>
        <msDesc>
          Handskriftsbeskrivning        
        </msDesc>
      <sourceDesc>
    </fileDesc>
  </teiHeader>
  <text>
    Transkription av text
  </text>
  <facsimile>
    Metadata om digitisering
  </facsimile>
</TEI>

Identifikatorer (msIdentifier)

<msIdentifier>
  <country ref="https://www.manuscripta.se/place/100081">Sweden</country>
  <settlement ref="https://www.manuscripta.se/place/100078">Stockholm</settlement>
  <institution ref="https://www.manuscripta.se/org/100004">National Library of Sweden</institution>
  <repository ref="https://www.manuscripta.se/place/100040">National Library of Sweden</repository>
  <idno type="shelfmark">A 7</idno>
  <altIdentifier>
    <idno type="id" subtype="Libris">zcvg71kqwvg8bjwv</idno>
  </altIdentifier>
  <altIdentifier>
    <idno type="id" subtype="Regina">004819469</idno>
  </altIdentifier>
</msIdentifier>

Beskrivning av textinnehåll (msItem)

<msItem class="acta">
  <locus from="1v" to="23v" scheme="folios"/>
  <textLang mainLang="la"/>
  <title type="desc" xml:lang="en">Summary of the canonization process of Saint Birgitta of Sweden</title>
  <rubric xml:lang="la">Rubricacio seu summa. Rubricacio seu summa tocius processus canonizacionis beate
    Brigide de Swecia</rubric>
  <incipit defective="false">In nomine yhesu christi Misericordis et pii Ac eius Virginis matris et Beati 
    Ieronimi Amen. QVia dominus noster papa et Collegium Cardinalium multis et arduis que in Romane curie 
    alueum vndique confluunt quasi torrens</incipit>
  <explicit defective="true">ixl dies accedentibus uero singulis infra octauas dei festi ad sepulchrum 
    ipsum. xl. dies de iniuncta sibi penitencia misericorditer Relaxamus.</explicit>
  <note>
    <p> The rubric is inscribed on <locus from="1v" to="1v" scheme="folios"/> in a tall, compressed and 
      elaborate style. The upper parts of the letters in <foreign xml:lang="la">beate</foreign> are 
      missing due to tear in the leaf. </p>
    <p>
      <locusGrp>
        <locus from="1r" to="1r" scheme="folios"/>
        <locus from="22v" to="23v" scheme="folios"/>
      </locusGrp> are blank. </p>
  </note>
  <bibl>
    <title ref="https://www.manuscripta.se/bibl/107108" type="short">Collijn (1924–1924)</title>
    <citedRange unit="page" from="571" to="607"/>
  </bibl>
</msItem>

Beskrivning av ursprung (origin)

<origin>Written by Italian scribes c. 
  <origDate when="1391">1391</origDate>
  in 
  <origPlace>
    <placeName ref="https://www.manuscripta.se/place/100070">Rome</placeName>
  </origPlace>
  , see 
  <bibl>
  	<title ref="https://www.manuscripta.se/bibl/107108" type="short">Collijn (1924–1924)</title>
    <citedRange unit="page" from="iv" to="vii"/>
    <citedRange unit="page" from="xiv" to="xiv"/>
  </bibl>.
</origin>

Ny datamodell

Kort beskrivning: titel, ursprung, datering, material, omfång, storlek, språk, dekorationer, digitisering

Detaljerad beskrivning: innehåll, kodikologi, historia etc.

Detaljerad beskrivning: innehåll, kodikologi, historia etc.

Detaljerad beskrivning: innehåll, kodikologi, historia etc.

Digitaliserade handskrifter (IIIF)

  • IIIF (International Image Interoperability Framework) tillhandahåller standardiserade metoder (API:er) för att beskriva och leverera bilder över webben
  • IIIF utvecklas och förvaltas av ett internationellt konsortium bestående av bibliotek, museer, arkiv, mjukvaruföretag och andra organisationer
  • IIIF har på kort tid fått ett stort genomslag och används idag av många kulturarvsinstitutioner

  • IIIF ger slutanvändaren möjlighet att
    • manipulera bilder på olika sätt (t.ex. ändra storlek, skala, beskära och rotera)

    • citera och dela en bild (eller en del av en bild) med en stabil URI

    • annotera bilder (t.ex. kommentera, transkribera och markera)

    • jämföra och sammanfoga bildmaterial från olika samlingar

Teknisk infrastruktur

  • Byggd med öppen programvara
    • eXist-db, en XML databas som har funktioner för indexering och sökning, samt för konvertering av TEI till HTML
    • Bilder levereras med IIPImage Server och bildvisaren Mirador
    • Redigerings- och sökgränssnitt byggt med React.js
  • Källkod och metadata finns på GitHub
  • Bilder och metadata är fritt tillgängliga utan restriktioner (Public Domain)
  • Detaljerade handskriftsbeskrivningar har licensen CC-BY

Demo

Tack

manuscripta.se

patrikgranholm.com

patrik.granholm@kb.se