1 <?xml version=
"1.0" encoding=
"ISO-8859-1"?>
2 <rss version='
2.0' xmlns:lj='http://www.livejournal.org/rss/lj/
1.0/'
>
4 <title>Petter Reinholdtsen - Entries from March
2014</title>
5 <description>Entries from March
2014</description>
6 <link>http://people.skolelinux.org/pere/blog/
</link>
10 <title>Hvordan bør RFC
822-formattert epost lagres i en NOARK5-database?
</title>
11 <link>http://people.skolelinux.org/pere/blog/Hvordan_b_r_RFC_822_formattert_epost_lagres_i_en_NOARK5_database_.html
</link>
12 <guid isPermaLink=
"true">http://people.skolelinux.org/pere/blog/Hvordan_b_r_RFC_822_formattert_epost_lagres_i_en_NOARK5_database_.html
</guid>
13 <pubDate>Fri,
7 Mar
2014 15:
20:
00 +
0100</pubDate>
14 <description><p
>For noen uker siden ble NXCs fri programvarelisenserte
16 <a href=
"http://www.nuug.no/aktiviteter/
20140211-noark/
">presentert hos
18 <a href=
"https://www.youtube.com/watch?v=JCb_dNS3MHQ
">på youtube
19 foreløbig
</a
>), og det fikk meg til å titte litt mer på NOARK5,
20 standarden for arkivhåndtering i det offentlige Norge. Jeg lurer på
21 om denne kjernen kan være nyttig i et par av mine prosjekter, og for ett
22 av dem er det mest aktuelt å lagre epost. Jeg klarte ikke finne noen
23 anbefaling om hvordan RFC
822-formattert epost (aka Internett-epost)
24 burde lagres i NOARK5, selv om jeg vet at noen arkiver tar
25 PDF-utskrift av eposten med sitt epostprogram og så arkiverer PDF-en
26 (eller enda værre, tar papirutskrift og lagrer bildet av eposten som
27 PDF i arkivet).
</p
>
29 <p
>Det er ikke så mange formater som er akseptert av riksarkivet til
30 langtidsoppbevaring av offentlige arkiver, og PDF og XML er de mest
31 aktuelle i så måte. Det slo meg at det måtte da finnes en eller annen
32 egnet XML-representasjon og at det kanskje var enighet om hvilken som
33 burde brukes, så jeg tok mot til meg og spurte
34 <a href=
"http://samdok.com/
">SAMDOK
</a
>, en gruppe tilknyttet
35 arkivverket som ser ut til å jobbe med NOARK-samhandling, om de hadde
38 <p
><blockquote
>
39 <p
>Hei.
</p
>
41 <p
>Usikker på om dette er riktig forum å ta opp mitt spørsmål, men jeg
42 lurer på om det er definert en anbefaling om hvordan RFC
43 822-formatterte epost (aka vanlig Internet-epost) bør lages håndteres
44 i NOARK5, slik at en bevarer all informasjon i eposten
45 (f.eks. Received-linjer). Finnes det en anbefalt XML-mapping ala den
47 &lt;URL:
<a href=
"https://www.informit.com/articles/article.aspx?p=
32074">https://www.informit.com/articles/article.aspx?p=
32074</a
> &gt;? Mitt
48 mål er at det skal være mulig å lagre eposten i en NOARK5-kjerne og
49 kunne få ut en identisk formattert kopi av opprinnelig epost ved
51 </blockquote
></p
>
53 <p
>Postmottaker hos SAMDOK mente spørsmålet heller burde stilles
54 direkte til riksarkivet, og jeg fikk i dag svar derfra formulert av
55 seniorrådgiver Geir Ivar Tungesvik:
</p
>
57 <p
><blockquote
>
58 <p
>Riksarkivet har ingen anbefalinger når det gjelder konvertering fra
59 e-post til XML. Det står arkivskaper fritt å eventuelt definere/bruke
60 eget format. Inklusive da - som det spørres om - et format der det er
61 mulig å re-etablere e-post format ut fra XML-en. XML (e-post)
62 dokumenter må være referert i arkivstrukturen, og det må vedlegges et
63 gyldig XML skjema (.xsd) for XML-filene. Arkivskaper står altså fritt
64 til å gjøre hva de vil, bare det dokumenteres og det kan dannes et
65 utrekk ved avlevering til depot.
</p
>
67 <p
>De obligatoriske kravene i Noark
5 standarden må altså oppfylles -
68 etter dialog med Riksarkivet i forbindelse med godkjenning. For
69 offentlige arkiv er det særlig viktig med filene loependeJournal.xml
70 og offentligJournal.xml. Private arkiv som vil forholde seg til Noark
71 5 standarden er selvsagt frie til å bruke det som er relevant for dem
72 av obligatoriske krav.
</p
>
73 </blockquote
></p
>
75 <p
>Det ser dermed ut for meg som om det er et lite behov for å
76 standardisere XML-lagring av RFC-
822-formatterte meldinger. Noen som
77 vet om god spesifikasjon i så måte? I tillegg til den omtalt over,
78 har jeg kommet over flere aktuelle beskrivelser (søk på
"rfc
822
79 xml
", så finner du aktuelle alternativer).
</p
>
83 <li
><a href=
"http://www.openhealth.org/xmtp/
">XML MIME Transformation
84 protocol (XMTP)
</a
> fra OpenHealth, sist oppdatert
2001.
</li
>
86 <li
><a href=
"https://tools.ietf.org/html/draft-klyne-message-rfc822-xml-
03">An
87 XML format for mail and other messages
</a
> utkast fra IETF datert
90 <li
><a href=
"http://www.informit.com/articles/article.aspx?p=
32074">xMail:
91 E-mail as XML
</a
> en artikkel fra
2003 som beskriver python-modulen
92 rfc822 som gir ut XML-representasjon av en RFC
822-formattert epost.
</li
>
96 <p
>Finnes det andre og bedre spesifikasjoner for slik lagring? Send
97 meg en epost hvis du har innspill.
</p
>