X-Git-Url: http://pere.pagekite.me/gitweb/homepage.git/blobdiff_plain/7a10fbf35756051e2b87f316faaa708edd7d3bcc..ae5db6d19f3d85fdd5e7bd4c12be28fa3f15fc43:/blog/archive/2015/01/index.html diff --git a/blog/archive/2015/01/index.html b/blog/archive/2015/01/index.html index aee5b08ef1..a4483b6ef3 100644 --- a/blog/archive/2015/01/index.html +++ b/blog/archive/2015/01/index.html @@ -33,15 +33,17 @@ er hvor stor andel av det som ligger i de interne databasene kommer ikke med i postjournalen. Dette er det mulig å finne ut basert på det som ligger i postjournalen. For å forstå hva jeg mener, trengs det -litt bakgrunnsinformasjon. I henhold til NOARK-standarden for norske -offentlige arkiv skal enhver sak ha et årstall og et løpenummer, og -ethvert dokument i saken skal gis et dokument-løpenummer. Det vil si -at en ender opp med dokument-ID som ser ut som ÅÅÅÅ/SAKNR-DOKNR, -f.eks. 2014/2-1 eller 2014/12312-14. Mange oppgir kun tosifret -årstall, men prinsippet er det samme. Så vidt jeg vet skal saksnummer -og dokumentnummer tildeles løpende og i stigende rekkefølge. Gitt en -instans med følgende dokument-ID i postjournalen, så kan en regne ut -hvor mye som ikke finnes i journalen: +litt bakgrunnsinformasjon. I henhold til +NOARK-standarden +for norske offentlige arkiv skal enhver sak ha et årstall og et +løpenummer, og ethvert dokument i saken skal gis et +dokument-løpenummer. Det vil si at en ender opp med dokument-ID som +ser ut som ÅÅÅÅ/SAKNR-DOKNR, f.eks. 2014/2-1 eller 2014/12312-14. +Mange oppgir kun tosifret årstall, men prinsippet er det samme. Så +vidt jeg vet skal saksnummer og dokumentnummer tildeles løpende og i +stigende rekkefølge. Gitt en instans med følgende dokument-ID i +postjournalen, så kan en regne ut hvor mye som ikke finnes i +journalen: -

Her ser en at saksnummer 2 og 4 finnes i postjournalen, mens -nummerene 1 og 3 mangler. En ser også at i sak 2014/4 mangler +

Her ser en at saksnummer 2 og 5 finnes i postjournalen, mens +nummerene 1, 3 og 4 mangler. En ser også at i sak 2014/5 mangler dokument 2. Ved hjelp av denne informasjonen har jeg regnet ut hvor stor andel av saksnummer og dokumentløpenummer som ikke har dukket opp i Offentlig Elektronisk Postjournal (OEP). For saksnummer har jeg tatt utgangspunkt i at en ikke trenger å starte på 1, og dermed regnet med området fra laveste til høyeste saksnummer og talt antall unike saksnummer som forekommer i OEP. I -dette tilfellet betyr de at 1 av 4 saksnummer er ubrukte (25%). For +dette tilfellet betyr de at 2 av 4 saksnummer er ubrukte (50%). For dokumentløpenummer har jeg tilsvarende tatt utgangspunkt i laveste og høyeste kjente dokumentløpenummer, for å handtere databaser der jeg -mangler komplett postjournal. For saks 2014/5 her betyr det at 1 av 3 +mangler komplett postjournal. For sak 2014/5 her betyr det at 1 av 3 dokumenter mangler (33%).

Det er flere årsaker til at det kan bli hull i nummerseriene. @@ -86,9 +88,9 @@ sortert listen på prosent upubliserte saksnummer for 2014.

- - - + + + @@ -773,6 +775,11 @@ available in git repository provided by Github. Please let me know if you find errors or have improvements to the subtitles.

+

Update 2015-02-03: Since I publised this post, FSF created a +Libreplanet +project +to track subtitles for the video.

+
@@ -1066,11 +1073,60 @@ Klassekampen 2014-12-31 side 39

Archive

SaksnummerDokumentnummerInstans
201420132014
%Manglende saksnummerTotalt%Manglende saksnummerTotalt%Manglende dok.nr.Totalt
%Upubl. saksnr.Totalt%Upubl. saksnrTotalt%Upubl. dok.nr.Totalt
0.6 8 1282 0.2 2 861 0.0 0 6105Vox, nasjonalt fagorgan for kompetansepolitikk