1 Title: Hvordan bør RFC 822-formattert epost lagres i en NOARK5-database?
2 Tags: norsk, offentlig innsyn, noark5
5 <p>For noen uker siden ble NXCs fri programvarelisenserte
7 <a href="http://www.nuug.no/aktiviteter/20140211-noark/">presentert hos
9 <a href="https://www.youtube.com/watch?v=JCb_dNS3MHQ">på youtube
10 foreløbig</a>), og det fikk meg til å titte litt mer på NOARK5,
11 standarden for arkivhåndtering i det offentlige Norge. Jeg lurer på
12 om denne kjernen kan være nyttig i et par av mine prosjekter, og for ett
13 av dem er det mest aktuelt å lagre epost. Jeg klarte ikke finne noen
14 anbefaling om hvordan RFC 822-formattert epost (aka Internett-epost)
15 burde lagres i NOARK5, selv om jeg vet at noen arkiver tar
16 PDF-utskrift av eposten med sitt epostprogram og så arkiverer PDF-en
17 (eller enda værre, tar papirutskrift og lagrer bildet av eposten som
20 <p>Det er ikke så mange formater som er akseptert av riksarkivet til
21 langtidsoppbevaring av offentlige arkiver, og PDF og XML er de mest
22 aktuelle i så måte. Det slo meg at det måtte da finnes en eller annen
23 egnet XML-representasjon og at det kanskje var enighet om hvilken som
24 burde brukes, så jeg tok mot til meg og spurte
25 <a href="http://samdok.com/">SAMDOK</a>, en gruppe tilknyttet
26 arkivverket som ser ut til å jobbe med NOARK-samhandling, om de hadde
32 <p>Usikker på om dette er riktig forum å ta opp mitt spørsmål, men jeg
33 lurer på om det er definert en anbefaling om hvordan RFC
34 822-formatterte epost (aka vanlig Internet-epost) bør lages håndteres
35 i NOARK5, slik at en bevarer all informasjon i eposten
36 (f.eks. Received-linjer). Finnes det en anbefalt XML-mapping ala den
38 <URL: <a href="https://www.informit.com/articles/article.aspx?p=32074">https://www.informit.com/articles/article.aspx?p=32074</a> >? Mitt
39 mål er at det skal være mulig å lagre eposten i en NOARK5-kjerne og
40 kunne få ut en identisk formattert kopi av opprinnelig epost ved
44 <p>Postmottaker hos SAMDOK mente spørsmålet heller burde stilles
45 direkte til riksarkivet, og jeg fikk i dag svar derfra formulert av
46 seniorrådgiver Geir Ivar Tungesvik:</p>
49 <p>Riksarkivet har ingen anbefalinger når det gjelder konvertering fra
50 e-post til XML. Det står arkivskaper fritt å eventuelt definere/bruke
51 eget format. Inklusive da - som det spørres om - et format der det er
52 mulig å re-etablere e-post format ut fra XML-en. XML (e-post)
53 dokumenter må være referert i arkivstrukturen, og det må vedlegges et
54 gyldig XML skjema (.xsd) for XML-filene. Arkivskaper står altså fritt
55 til å gjøre hva de vil, bare det dokumenteres og det kan dannes et
56 utrekk ved avlevering til depot.</p>
58 <p>De obligatoriske kravene i Noark 5 standarden må altså oppfylles -
59 etter dialog med Riksarkivet i forbindelse med godkjenning. For
60 offentlige arkiv er det særlig viktig med filene loependeJournal.xml
61 og offentligJournal.xml. Private arkiv som vil forholde seg til Noark
62 5 standarden er selvsagt frie til å bruke det som er relevant for dem
63 av obligatoriske krav.</p>
66 <p>Det ser dermed ut for meg som om det er et lite behov for å
67 standardisere XML-lagring av RFC-822-formatterte meldinger. Noen som
68 vet om god spesifikasjon i så måte? I tillegg til den omtalt over,
69 har jeg kommet over flere aktuelle beskrivelser (søk på "rfc 822
70 xml", så finner du aktuelle alternativer).</p>
74 <li><a href="http://www.openhealth.org/xmtp/">XML MIME Transformation
75 protocol (XMTP)</a> fra OpenHealth, sist oppdatert 2001.</li>
77 <li><a href="https://tools.ietf.org/html/draft-klyne-message-rfc822-xml-03">An
78 XML format for mail and other messages</a> utkast fra IETF datert
81 <li><a href="http://www.informit.com/articles/article.aspx?p=32074">xMail:
82 E-mail as XML</a> en artikkel fra 2003 som beskriver python-modulen
83 rfc822 som gir ut XML-representasjon av en RFC 822-formattert epost.</li>
87 <p>Finnes det andre og bedre spesifikasjoner for slik lagring? Send
88 meg en epost hvis du har innspill.</p>