]> pere.pagekite.me Git - homepage.git/blob - blog/archive/2014/03/03.rss
Generated.
[homepage.git] / blog / archive / 2014 / 03 / 03.rss
1 <?xml version="1.0" encoding="ISO-8859-1"?>
2 <rss version='2.0' xmlns:lj='http://www.livejournal.org/rss/lj/1.0/'>
3 <channel>
4 <title>Petter Reinholdtsen - Entries from March 2014</title>
5 <description>Entries from March 2014</description>
6 <link>http://people.skolelinux.org/pere/blog/</link>
7
8
9 <item>
10 <title>Hvordan bør RFC 822-formattert epost lagres i en NOARK5-database?</title>
11 <link>http://people.skolelinux.org/pere/blog/Hvordan_b_r_RFC_822_formattert_epost_lagres_i_en_NOARK5_database_.html</link>
12 <guid isPermaLink="true">http://people.skolelinux.org/pere/blog/Hvordan_b_r_RFC_822_formattert_epost_lagres_i_en_NOARK5_database_.html</guid>
13 <pubDate>Fri, 7 Mar 2014 15:20:00 +0100</pubDate>
14 <description>&lt;p&gt;For noen uker siden ble NXCs fri programvarelisenserte
15 NOARK5-løsning
16 &lt;a href=&quot;http://www.nuug.no/aktiviteter/20140211-noark/&quot;&gt;presentert hos
17 NUUG&lt;/a&gt; (video
18 &lt;a href=&quot;https://www.youtube.com/watch?v=JCb_dNS3MHQ&quot;&gt;på youtube
19 foreløbig&lt;/a&gt;), og det fikk meg til å titte litt mer på NOARK5,
20 standarden for arkivhåndtering i det offentlige Norge. Jeg lurer på
21 om denne kjernen kan være nyttig i et par av mine prosjekter, og for ett
22 av dem er det mest aktuelt å lagre epost. Jeg klarte ikke finne noen
23 anbefaling om hvordan RFC 822-formattert epost (aka Internett-epost)
24 burde lagres i NOARK5, selv om jeg vet at noen arkiver tar
25 PDF-utskrift av eposten med sitt epostprogram og så arkiverer PDF-en
26 (eller enda værre, tar papirutskrift og lagrer bildet av eposten som
27 PDF i arkivet).&lt;/p&gt;
28
29 &lt;p&gt;Det er ikke så mange formater som er akseptert av riksarkivet til
30 langtidsoppbevaring av offentlige arkiver, og PDF og XML er de mest
31 aktuelle i så måte. Det slo meg at det måtte da finnes en eller annen
32 egnet XML-representasjon og at det kanskje var enighet om hvilken som
33 burde brukes, så jeg tok mot til meg og spurte
34 &lt;a href=&quot;http://samdok.com/&quot;&gt;SAMDOK&lt;/a&gt;, en gruppe tilknyttet
35 arkivverket som ser ut til å jobbe med NOARK-samhandling, om de hadde
36 noen anbefalinger:
37
38 &lt;p&gt;&lt;blockquote&gt;
39 &lt;p&gt;Hei.&lt;/p&gt;
40
41 &lt;p&gt;Usikker på om dette er riktig forum å ta opp mitt spørsmål, men jeg
42 lurer på om det er definert en anbefaling om hvordan RFC
43 822-formatterte epost (aka vanlig Internet-epost) bør lages håndteres
44 i NOARK5, slik at en bevarer all informasjon i eposten
45 (f.eks. Received-linjer). Finnes det en anbefalt XML-mapping ala den
46 som beskrives på
47 &amp;lt;URL: &lt;a href=&quot;https://www.informit.com/articles/article.aspx?p=32074&quot;&gt;https://www.informit.com/articles/article.aspx?p=32074&lt;/a&gt; &amp;gt;? Mitt
48 mål er at det skal være mulig å lagre eposten i en NOARK5-kjerne og
49 kunne få ut en identisk formattert kopi av opprinnelig epost ved
50 behov.&lt;/p&gt;
51 &lt;/blockquote&gt;&lt;/p&gt;
52
53 &lt;p&gt;Postmottaker hos SAMDOK mente spørsmålet heller burde stilles
54 direkte til riksarkivet, og jeg fikk i dag svar derfra formulert av
55 seniorrådgiver Geir Ivar Tungesvik:&lt;/p&gt;
56
57 &lt;p&gt;&lt;blockquote&gt;
58 &lt;p&gt;Riksarkivet har ingen anbefalinger når det gjelder konvertering fra
59 e-post til XML. Det står arkivskaper fritt å eventuelt definere/bruke
60 eget format. Inklusive da - som det spørres om - et format der det er
61 mulig å re-etablere e-post format ut fra XML-en. XML (e-post)
62 dokumenter må være referert i arkivstrukturen, og det må vedlegges et
63 gyldig XML skjema (.xsd) for XML-filene. Arkivskaper står altså fritt
64 til å gjøre hva de vil, bare det dokumenteres og det kan dannes et
65 utrekk ved avlevering til depot.&lt;/p&gt;
66
67 &lt;p&gt;De obligatoriske kravene i Noark 5 standarden må altså oppfylles -
68 etter dialog med Riksarkivet i forbindelse med godkjenning. For
69 offentlige arkiv er det særlig viktig med filene loependeJournal.xml
70 og offentligJournal.xml. Private arkiv som vil forholde seg til Noark
71 5 standarden er selvsagt frie til å bruke det som er relevant for dem
72 av obligatoriske krav.&lt;/p&gt;
73 &lt;/blockquote&gt;&lt;/p&gt;
74
75 &lt;p&gt;Det ser dermed ut for meg som om det er et lite behov for å
76 standardisere XML-lagring av RFC-822-formatterte meldinger. Noen som
77 vet om god spesifikasjon i så måte? I tillegg til den omtalt over,
78 har jeg kommet over flere aktuelle beskrivelser (søk på &quot;rfc 822
79 xml&quot;, så finner du aktuelle alternativer).&lt;/p&gt;
80
81 &lt;ul&gt;
82
83 &lt;li&gt;&lt;a href=&quot;http://www.openhealth.org/xmtp/&quot;&gt;XML MIME Transformation
84 protocol (XMTP)&lt;/a&gt; fra OpenHealth, sist oppdatert 2001.&lt;/li&gt;
85
86 &lt;li&gt;&lt;a href=&quot;https://tools.ietf.org/html/draft-klyne-message-rfc822-xml-03&quot;&gt;An
87 XML format for mail and other messages&lt;/a&gt; utkast fra IETF datert
88 2001.&lt;/li&gt;
89
90 &lt;li&gt;&lt;a href=&quot;http://www.informit.com/articles/article.aspx?p=32074&quot;&gt;xMail:
91 E-mail as XML&lt;/a&gt; en artikkel fra 2003 som beskriver python-modulen
92 rfc822 som gir ut XML-representasjon av en RFC 822-formattert epost.&lt;/li&gt;
93
94 &lt;/ul&gt;
95
96 &lt;p&gt;Finnes det andre og bedre spesifikasjoner for slik lagring? Send
97 meg en epost hvis du har innspill.&lt;/p&gt;
98 </description>
99 </item>
100
101 </channel>
102 </rss>