X-Git-Url: http://pere.pagekite.me/gitweb/homepage.git/blobdiff_plain/8f97879ff3cd6c0e4c0847cb44d58c7f564d4182..c5cda4603f03406fd99f83797d8ddb4ff591a2f1:/blog/index.rss

diff --git a/blog/index.rss b/blog/index.rss
index 434ba4114e..1191988caf 100644
--- a/blog/index.rss
+++ b/blog/index.rss
@@ -6,6 +6,566 @@
                 <link>https://people.skolelinux.org/pere/blog/</link>
                 <atom:link href="https://people.skolelinux.org/pere/blog/index.rss" rel="self" type="application/rss+xml" />
 	
+	<item>
+		<title>Â«NÃ¥r Â«pÃ¥Â» blir Â«pÃÂ¥Â»: Et reservoar av tegn sett fra depotetÂ» i tidsskriftet Aksess</title>
+		<link>https://people.skolelinux.org/pere/blog/_N_r__p___blir__p_____Et_reservoar_av_tegn_sett_fra_depotet__i_tidsskriftet_Aksess.html</link>
+		<guid isPermaLink="true">https://people.skolelinux.org/pere/blog/_N_r__p___blir__p_____Et_reservoar_av_tegn_sett_fra_depotet__i_tidsskriftet_Aksess.html</guid>
+                <pubDate>Wed, 15 Nov 2023 09:20:00 +0100</pubDate>
+		<description>&lt;p&gt;For noen uker siden skrev en kamerat og meg
+&lt;a href=&quot;https://www.aksess-tidsskrift.no/fordypning/175530&quot;&gt;en
+artikkel om tegnsett&lt;/a&gt; i
+&lt;a href=&quot;https://www.aksess-tidsskrift.no/&quot;&gt;arkivtidsskriftet
+Aksess&lt;/a&gt; bÃ¥de pÃ¥ web og i papirutgave nr. 3 2023.  Her er det som
+nettopp ble publisert.&lt;/p&gt;
+
+&lt;blockquote&gt;
+
+&lt;p&gt;&lt;strong&gt;NÃ¥r Â«pÃ¥Â» blir Â«pÃÂ¥Â»: Et reservoar av tegn sett fra
+depotet&lt;/strong&gt;&lt;/p&gt;
+
+&lt;p&gt;av Thomas SÃ¸dring og Petter Reinholdtsen&lt;/p&gt;
+
+&lt;p&gt;De fÃ¦rreste av oss tenker over hva som skjer dypere i datamaskinen
+mens vi sitter der og skriver noe pÃ¥ tastaturet. NÃ¥r du trykker pÃ¥
+tasten Â«ÃÂ», sÃ¥ vises bokstaven Ã. Men noen ganger blir det
+feil. Hvorfor det â og hva er viktig Ã¥ vÃ¦re klar over i
+arkivsammenheng?&lt;/p&gt;
+
+&lt;p&gt;Dersom bokstaver tolkes forskjellig mellom systemer, blir det fort
+rot, dette kalles mojibake blant kjennere, etter det japanske
+uttrykket for tegnomforming. Det er en lang historie her som tidvis
+har vÃ¦rt preget av rot.  Noen husker kanskje tilbake til en tid der
+bokstavene Ã¦, Ã¸ og Ã¥ ofte var Ã¸delagt i e-poster â et klassisk
+eksempel pÃ¥ tegnsettproblemstilling.&lt;/p&gt;
+
+&lt;p id=&quot;tegnsett_access_nÃ¥_og_fÃ¸r&quot;&gt;&lt;strong&gt;Â«NÃ¥Â» og Â«fÃ¸rÂ»&lt;/strong&gt;&lt;/p&gt;
+
+&lt;p&gt;Tid er et skjult problem for depot fordi vi danner dokumentasjon i
+en kontekst som er preget av Ã¥ vÃ¦re Â«nÃ¥Â».  VÃ¥r forstÃ¥else av verden og
+bruken av teknologi er utgangspunktet for denne konteksten. Tenk selv
+hvordan verden har utviklet seg de siste 20 Ã¥rene, hva samfunnet er
+opptatt av, og hvordan vi bruker teknologi i hverdagen. Tid er et
+skjult problem fordi nÃ¥r vi trekker dokumentasjon ut av systemer og
+deponerer for langtidsbevaring, er konteksten til materialet Â«nÃ¥Â», men
+verden gÃ¥r videre. Ettersom teknologien og mÃ¥ten vi bruker den pÃ¥,
+utvikler seg, blir Â«nÃ¥Â» til Â«fÃ¸rÂ», og dokumentasjonen befinner seg
+snart i en Â«fÃ¸rÂ»-kontekst.&lt;/p&gt;
+
+&lt;p&gt;Dette med Â«fÃ¸rÂ» og Â«nÃ¥Â» i forhold til dokumentasjonens kontekst er
+noe vi er veldig lite bevisste pÃ¥, men det er en problemstilling
+depotarkivene eier og forvalter.  En av disse utfordringene er hvorfor
+Â«ÃÂ» ikke nÃ¸dvendigvis er det samme som Â«ÃÂ», og hvorfor det i det hele
+tatt gir mening Ã¥ si noe sÃ¥nt. Vi snakker her om noe som heter
+tegnsett, som er en avtalt mÃ¥te Ã¥ representere bokstaver, tall og
+andre symboler pÃ¥ slik at vi pÃ¥ en feilfri mÃ¥te kan utveksle tekst
+mellom datasystemer.&lt;/p&gt;
+
+&lt;p&gt;Tegnsettproblemstillingen er satt sammen av fire fasetter;
+repertoar, representasjon, koding og uttegning.&lt;/p&gt;
+
+&lt;p id=&quot;tegnsett_access_repertoarer&quot;&gt;&lt;strong&gt;Repertoarer&lt;/strong&gt;&lt;/p&gt;
+
+&lt;p&gt;Repertoar er en samling med tegn og symboler som kan
+representeres. Tenk norsk alfabet eller japanske piktogrammer, men
+ogsÃ¥ matematiske og elektroniske symboler. Bokstaven Â«stor aÂ» kan vÃ¦re
+en oppfÃ¸ring i et slikt repertoar. For Ã¥ kunne brukes i en datamaskin
+trenger hver oppfÃ¸ring i et slikt repertoar en representasjon, hvilket
+i datamaskinsammenheng betyr at det tilordnes et tall. Tallet kan
+lagres pÃ¥ ulike vis i en eller flere kodingsformater. For eksempel kan
+en skrive tallet ti som bÃ¥de 10, X og A, i henholdsvis
+titallssystemet, romertallssystemet og sekstentallssystemet.&lt;/p&gt;
+
+&lt;p&gt;Hvis en skal kunne lese inn filer og vite hvilket tall og hvilken
+representasjon og instans i et repertoar det er snakk om, sÃ¥ mÃ¥ en
+vite hvordan tallet er kodet. Sist, men ikke minst, for Ã¥ kunne bruke
+symbolet til noe mÃ¥ det kunne vÃ¦re kjent hvordan det skal se ut eller
+tegnes pÃ¥ ark. Det finnes utallige skrifttyper med norske bokstaver,
+alle litt forskjellige, og skal en kunne tegne en stor A pÃ¥ skjermen,
+sÃ¥ mÃ¥ datamaskinen vite hva den skal tegne. Skrifttyper inneholder
+informasjon om hvordan ulike tall skal tegnes. De inneholder ikke
+alltid alle symbolene som er brukt i en tekst, hvilket gjÃ¸r at ikke
+alle forstÃ¥tte tegn vil kunne vises pÃ¥ skjerm eller ark.&lt;/p&gt;
+
+&lt;p&gt;Hver av disse fasettene mÃ¥ vÃ¦re avklart for Ã¥ kunne ta vare pÃ¥ og vise
+frem tekst med en datamaskin. Kombinasjon av repertoar, representasjon
+og koding er det en kaller et tegnsett. Kombinasjonen av
+representasjon og uttegning kalles en skrifttype. De fleste
+skrifttyper har ogsÃ¥ informasjon om repertoar, men det finnes
+skrifttyper som kun kobler mellom tallkode og uttegning, uten Ã¥
+fortelle noe om hvordan tallkodene egentlig skal tolkes.&lt;/p&gt;
+
+&lt;p id=&quot;tegnsett_access_fra_ascii_til_iso_8859&quot;&gt;&lt;strong&gt;Fra ASCII til ISO-8859&lt;/strong&gt;&lt;/p&gt;
+
+&lt;p&gt;Vi begynner historien med ASCII (American Standard Code for
+Information Interchange) som har en historie som spores tilbake til
+1963. Utgangspunktet til ASCII var at det kunne kode opp til 128
+forskjellige symboler i vanlig bruk i USA. De visuelle symbolene i
+ASCII er de smÃ¥ og store bokstavene (a til z og A til Z), tall (0 til
+9) og tegnsettingssymboler (for eksempel semikolon, komma og
+punktum). ASCII har ogsÃ¥ noen usynlige symboler som ble brukt for
+bl.a. kommunikasjon. FÃ¸r ASCII var det for eksempel teleks-tegnsett
+med plass til bare 32 tegn og EBCDIC med plass til 256 tegn, alle med
+en helt annen rekkefÃ¸lge pÃ¥ symbolene enn ASCII, men de har vÃ¦rt lite
+brukt de siste femti Ã¥rene. Et eksempel pÃ¥ noen utvalgte symboler i
+repertoaret til ASCII vises i tabell 1.&lt;/p&gt;
+
+&lt;table align=&quot;center&quot; width=&quot;50%&quot;&gt;
+
+&lt;caption&gt;Tabell 1. Eksempel pÃ¥ utvalgte symboler hentet fra
+ASCII-tegnsettet. Kolonnen Â«BinÃ¦rÂ» viser symbolets verdi i
+totallssystemet (1 og 0 tall), mens kolonnen Â«DesimalÂ» viser symbolets
+verdi i titallssystemet.&lt;/caption&gt;
+
+&lt;tbody&gt;
+&lt;tr&gt;
+&lt;th&gt;Grafisk&lt;/th&gt;
+&lt;th&gt;BinÃ¦r&lt;/th&gt;
+&lt;th&gt;Desimal&lt;/th&gt;
+&lt;/tr&gt;
+&lt;tr&gt;
+&lt;td&gt;A&lt;/td&gt;
+&lt;td&gt;1000001&lt;/td&gt;
+&lt;td align=&quot;right&quot;&gt;65&lt;/td&gt;
+&lt;/tr&gt;
+&lt;tr&gt;
+&lt;td&gt;M&lt;/td&gt;
+&lt;td&gt;1001101&lt;/td&gt;
+&lt;td align=&quot;right&quot;&gt;77&lt;/td&gt;
+&lt;/tr&gt;
+&lt;tr&gt;
+&lt;td&gt;Z&lt;/td&gt;
+&lt;td&gt;1011010&lt;/td&gt;
+&lt;td align=&quot;right&quot;&gt;90&lt;/td&gt;
+&lt;/tr&gt;
+&lt;tr&gt;
+&lt;td&gt;a&lt;/td&gt;
+&lt;td&gt;1100001&lt;/td&gt;
+&lt;td align=&quot;right&quot;&gt;97&lt;/td&gt;
+&lt;/tr&gt;
+&lt;tr&gt;
+&lt;td&gt;m&lt;/td&gt;
+&lt;td&gt;1101101&lt;/td&gt;
+&lt;td align=&quot;right&quot;&gt;109&lt;/td&gt;
+&lt;/tr&gt;
+&lt;tr&gt;
+&lt;td&gt;z&lt;/td&gt;
+&lt;td&gt;1111010&lt;/td&gt;
+&lt;td align=&quot;right&quot;&gt;122&lt;/td&gt;
+&lt;/tr&gt;
+&lt;tr&gt;
+&lt;td&gt;0&lt;/td&gt;
+&lt;td&gt;0110000&lt;/td&gt;
+&lt;td align=&quot;right&quot;&gt;48&lt;/td&gt;
+&lt;/tr&gt;
+&lt;tr&gt;
+&lt;td&gt;9&lt;/td&gt;
+&lt;td&gt;0111001&lt;/td&gt;
+&lt;td align=&quot;right&quot;&gt;58&lt;/td&gt;
+&lt;/tr&gt;
+&lt;tr&gt;
+&lt;td&gt;;&lt;/td&gt;
+&lt;td&gt;0111011&lt;/td&gt;
+&lt;td align=&quot;right&quot;&gt;59&lt;/td&gt;
+&lt;/tr&gt;
+&lt;/tbody&gt;
+&lt;/table&gt;
+
+&lt;p&gt;Det opprinnelige ASCII-tegnsettet ble ogsÃ¥ omtalt som ASCII-7 og
+brukte 7 bits (0 og 1) for Ã¥ representere symboler. Datamaskiner er
+ofte konfigurert til Ã¥ jobbe med enheter der bits er gruppert som 4
+eller 8 bits . Det lÃ¥ en mulighet i Ã¥ ta i bruk bit Ã¥tte. En slik
+endring ville gjÃ¸re det mulig for datamaskiner Ã¥ Ã¸ke antall symboler
+de kunne representere, noe som ga en Ã¸kning fra 128 forskjellige
+symboler til 256 forskjellige symboler. Det ble Ã¥pnet for Ã¥ innlemme
+de nordiske bokstavene sammen med ASCII, og dette ble etter hvert
+standardisert som ISO-8859-1. Tabell 2 viser deler av ISO-8859-1 som
+stÃ¸tter de norske bokstavene.&lt;/p&gt;
+
+&lt;p&gt;Det sier seg selv at muligheten til Ã¥ representere inntil 256 symboler
+ikke holder nÃ¥r vi snakker om en global verden, og det ble gjort et
+standardiseringslÃ¸p som tok utgangspunkt i ASCII-7 med en utvidelse
+til Ã¥ bruke den Ã¥ttende biten for ulike sprÃ¥kgrupper. Denne standarden
+heter ISO-8859 og er inndelt i opptil 16 varianter, altsÃ¥ fra
+ISO-8859-1 til ISO-8859-16.&lt;/p&gt;
+
+&lt;table align=&quot;center&quot; width=&quot;50%&quot;&gt;
+
+&lt;caption&gt;Tabell 2. Koding av de norske symbolene slik de er definert i
+ISO-8859-1 tegnsettet.&lt;/caption&gt;
+
+&lt;tbody&gt;
+&lt;tr&gt;
+&lt;th&gt;Grafisk&lt;/th&gt;
+&lt;th&gt;BinÃ¦r&lt;/th&gt;
+&lt;th&gt;Desimal&lt;/th&gt;
+&lt;/tr&gt;
+&lt;tr&gt;
+&lt;td&gt;Ã&lt;/td&gt;
+&lt;td&gt;11000110&lt;/td&gt;
+&lt;td align=&quot;right&quot;&gt;198&lt;/td&gt;
+&lt;/tr&gt;
+&lt;tr&gt;
+&lt;td&gt;Ã&lt;/td&gt;
+&lt;td&gt;11011000&lt;/td&gt;
+&lt;td align=&quot;right&quot;&gt;216&lt;/td&gt;
+&lt;/tr&gt;
+&lt;tr&gt;
+&lt;td&gt;Ã&lt;/td&gt;
+&lt;td&gt;11000101&lt;/td&gt;
+&lt;td align=&quot;right&quot;&gt;197&lt;/td&gt;
+&lt;/tr&gt;
+&lt;tr&gt;
+&lt;td&gt;Ã¦&lt;/td&gt;
+&lt;td&gt;11100110&lt;/td&gt;
+&lt;td align=&quot;right&quot;&gt;230&lt;/td&gt;
+&lt;/tr&gt;
+&lt;tr&gt;
+&lt;td&gt;Ã¸&lt;/td&gt;
+&lt;td&gt;11111000&lt;/td&gt;
+&lt;td align=&quot;right&quot;&gt;248&lt;/td&gt;
+&lt;/tr&gt;
+&lt;tr&gt;
+&lt;td&gt;Ã¥&lt;/td&gt;
+&lt;td&gt;11100101&lt;/td&gt;
+&lt;td align=&quot;right&quot;&gt;229&lt;/td&gt;
+&lt;/tr&gt;
+&lt;/tbody&gt;
+&lt;/table&gt;
+
+&lt;p&gt;Norske tegn er definert i ISO-8859-1, som ogsÃ¥ omtales som Latin 1, de
+fleste samiske tegn er definert i ISO-8859-4 (Latin 4) mens tilgang
+til â¬-symbolet kom med ISO-8859-15 (Latin 9). ISO-8859-15 er en
+revisjon av ISO-8859-1 som fjerner noen lite brukte symboler og
+erstatter bokstaver som er mer brukt, og introduserer â¬-symbolet.  Det
+er viktig Ã¥ merke at alle ISO-8859-variantene har overlapp med
+ASCII-7, noe som ga samvirke med de engelsksprÃ¥klige landene som ikke
+trengte Ã¥ gjÃ¸re noe. Det innebÃ¦rer ogsÃ¥ at de fÃ¸rste 128 verdiene i
+ISO-8859-variantene representerer de samme symbolene. Det er fÃ¸rst nÃ¥r
+du kommer til tolkningen av de resterende 128 verdiene med nummer 128
+til 255, at det oppsto tolkningsutfordringer mellom
+ISO-8859-variantene.&lt;/p&gt;
+
+&lt;p&gt;ISO-8859-verdenen fungerte godt sÃ¥ lenge tegnsettet som ble brukt nÃ¥r
+innhold ble skapt, ogsÃ¥ ble brukt nÃ¥r innhold ble gjengitt og du ikke
+trengte Ã¥ kombinere innhold fra forskjellige tegnsett i samme
+dokument.  Utfordringen med bruken av ISO-8859-variantene ble raskt
+tydelig i en mer globalisert verden med utveksling av tekst pÃ¥ tvers
+av landegrenser der tekstlig innhold i dokumenter, e-poster og
+websider kunne bli skrevet med ett tegnsett og gjengitt med et annet
+tegnsett.&lt;/p&gt;
+
+&lt;table align=&quot;center&quot; width=&quot;60%&quot;&gt;
+
+&lt;caption&gt;Tabell 3. Viser tolkning av verdiene som er tilegnet de
+norske symbolene i ISO-8859-1 i de andre ISO 8859-variatene. Merk
+ISO-8859-12 ikke finnes da arbeidet ble avsluttet.&lt;sup&gt;[&lt;a id=&quot;tegnsett_access_footnoteref_1&quot; href=&quot;#tegnsett_access_footnotedef_1&quot; title=&quot;View footnote.&quot;&gt;1&lt;/a&gt;]&lt;/sup&gt;&lt;/caption&gt;
+
+&lt;tbody&gt;
+&lt;tr&gt;
+&lt;th&gt;BinÃ¦rverdi&lt;/th&gt;
+&lt;th&gt;1&lt;/th&gt;
+&lt;th&gt;2&lt;/th&gt;
+&lt;th&gt;3&lt;/th&gt;
+&lt;th&gt;4&lt;/th&gt;
+&lt;th&gt;5&lt;/th&gt;
+&lt;th&gt;6&lt;/th&gt;
+&lt;th&gt;7&lt;/th&gt;
+&lt;th&gt;8&lt;/th&gt;
+&lt;th&gt;9&lt;/th&gt;
+&lt;th&gt;10&lt;/th&gt;
+&lt;th&gt;11&lt;/th&gt;
+&lt;th&gt;13&lt;/th&gt;
+&lt;th&gt;14&lt;/th&gt;
+&lt;th&gt;15&lt;/th&gt;
+&lt;th&gt;16&lt;/th&gt;
+&lt;/tr&gt;
+&lt;tr&gt;
+&lt;td&gt;11000110&lt;/td&gt;
+&lt;td&gt;Ã&lt;/td&gt;
+&lt;td&gt;Ä&lt;/td&gt;
+&lt;td&gt;Ä&lt;/td&gt;
+&lt;td&gt;Ã&lt;/td&gt;
+&lt;td&gt;Ð¦&lt;/td&gt;
+&lt;td&gt;Ø¦&lt;/td&gt;
+&lt;td&gt;Î&lt;/td&gt;
+&lt;td&gt;&lt;/td&gt;
+&lt;td&gt;Ã&lt;/td&gt;
+&lt;td&gt;Ã&lt;/td&gt;
+&lt;td&gt;à¸¦&lt;/td&gt;
+&lt;td&gt;Ä&lt;/td&gt;
+&lt;td&gt;Ã&lt;/td&gt;
+&lt;td&gt;Ã&lt;/td&gt;
+&lt;td&gt;Ã&lt;/td&gt;
+&lt;/tr&gt;
+&lt;tr&gt;
+&lt;td&gt;11011000&lt;/td&gt;
+&lt;td&gt;Ã&lt;/td&gt;
+&lt;td&gt;Å&lt;/td&gt;
+&lt;td&gt;Ä&lt;/td&gt;
+&lt;td&gt;Ã&lt;/td&gt;
+&lt;td&gt;Ð¸&lt;/td&gt;
+&lt;td&gt;Ø¸&lt;/td&gt;
+&lt;td&gt;Î¨&lt;/td&gt;
+&lt;td&gt;&lt;/td&gt;
+&lt;td&gt;Ã&lt;/td&gt;
+&lt;td&gt;Ã&lt;/td&gt;
+&lt;td&gt;à¸¸&lt;/td&gt;
+&lt;td&gt;Å²&lt;/td&gt;
+&lt;td&gt;Ã&lt;/td&gt;
+&lt;td&gt;Ã&lt;/td&gt;
+&lt;td&gt;Å°&lt;/td&gt;
+&lt;/tr&gt;
+&lt;tr&gt;
+&lt;td&gt;11000101&lt;/td&gt;
+&lt;td&gt;Ã&lt;/td&gt;
+&lt;td&gt;Ä¹&lt;/td&gt;
+&lt;td&gt;Ä&lt;/td&gt;
+&lt;td&gt;Ã&lt;/td&gt;
+&lt;td&gt;Ð¥&lt;/td&gt;
+&lt;td&gt;Ø¥&lt;/td&gt;
+&lt;td&gt;Î&lt;/td&gt;
+&lt;td&gt;&lt;/td&gt;
+&lt;td&gt;Ã&lt;/td&gt;
+&lt;td&gt;Ã&lt;/td&gt;
+&lt;td&gt;à¸¥&lt;/td&gt;
+&lt;td&gt;Ã&lt;/td&gt;
+&lt;td&gt;Ã&lt;/td&gt;
+&lt;td&gt;Ã&lt;/td&gt;
+&lt;td&gt;Ä&lt;/td&gt;
+&lt;/tr&gt;
+&lt;tr&gt;
+&lt;td&gt;11100110&lt;/td&gt;
+&lt;td&gt;Ã¦&lt;/td&gt;
+&lt;td&gt;Ä&lt;/td&gt;
+&lt;td&gt;Ä&lt;/td&gt;
+&lt;td&gt;Ã¦&lt;/td&gt;
+&lt;td&gt;Ñ&lt;/td&gt;
+&lt;td&gt;Ù&lt;/td&gt;
+&lt;td&gt;Î¶&lt;/td&gt;
+&lt;td&gt;×&lt;/td&gt;
+&lt;td&gt;Ã¦&lt;/td&gt;
+&lt;td&gt;Ã¦&lt;/td&gt;
+&lt;td&gt;à¹&lt;/td&gt;
+&lt;td&gt;Ä&lt;/td&gt;
+&lt;td&gt;Ã¦&lt;/td&gt;
+&lt;td&gt;Ã¦&lt;/td&gt;
+&lt;td&gt;v&lt;/td&gt;
+&lt;/tr&gt;
+&lt;tr&gt;
+&lt;td&gt;11111000&lt;/td&gt;
+&lt;td&gt;Ã¸&lt;/td&gt;
+&lt;td&gt;Å&lt;/td&gt;
+&lt;td&gt;Ä&lt;/td&gt;
+&lt;td&gt;Ã¸&lt;/td&gt;
+&lt;td&gt;Ñ&lt;/td&gt;
+&lt;td&gt;&lt;/td&gt;
+&lt;td&gt;Ï&lt;/td&gt;
+&lt;td&gt;×¨&lt;/td&gt;
+&lt;td&gt;Ã¸&lt;/td&gt;
+&lt;td&gt;Ã¸&lt;/td&gt;
+&lt;td&gt;à¹&lt;/td&gt;
+&lt;td&gt;Å³&lt;/td&gt;
+&lt;td&gt;Ã¸&lt;/td&gt;
+&lt;td&gt;Ã¸&lt;/td&gt;
+&lt;td&gt;Å±&lt;/td&gt;
+&lt;/tr&gt;
+&lt;tr&gt;
+&lt;td&gt;11100101&lt;/td&gt;
+&lt;td&gt;Ã¥&lt;/td&gt;
+&lt;td&gt;Äº&lt;/td&gt;
+&lt;td&gt;Ä&lt;/td&gt;
+&lt;td&gt;Ã¥&lt;/td&gt;
+&lt;td&gt;Ñ&lt;/td&gt;
+&lt;td&gt;Ù&lt;/td&gt;
+&lt;td&gt;Îµ&lt;/td&gt;
+&lt;td&gt;×&lt;/td&gt;
+&lt;td&gt;Ã¥&lt;/td&gt;
+&lt;td&gt;Ã¥&lt;/td&gt;
+&lt;td&gt;à¹&lt;/td&gt;
+&lt;td&gt;Ã¥&lt;/td&gt;
+&lt;td&gt;Ã¥&lt;/td&gt;
+&lt;td&gt;Ã¥&lt;/td&gt;
+&lt;td&gt;Ä&lt;/td&gt;
+&lt;/tr&gt;
+&lt;/tbody&gt;
+&lt;/table&gt;
+
+&lt;p&gt;Denne problemstillingen er illustrert i tabell 3, der vi ser verdiene
+tilegnet de norske symbolene i ISO-8859-1 i kolonne Â«1Â». I de Ã¸vrige
+kolonnene ser vi hvilket symbol verdien fÃ¥r i de andre
+ISO-8859-variantene. Tar vi utgangspunkt i tabell 3, kan vi se at
+ordet lÃ¦rlingspÃ¸rsmÃ¥l gjengitt med ISO-8859-2 (kolonne 2) blir
+lÄrlingspÅrsmÄºl, mens det blir lÎ¶rlingspÏrsmÎµl med ISO- 8859-7
+(kolonne 7). Med ISO-8859-2 blir Â«Ã¦Â» til Â«ÄÂ», Â«Ã¸Â» til Â«ÅÂ» og Â«Ã¥Â» til
+ Â«ÄºÂ». I ISO-8859-7 blir Â«Ã¦Â» til Â«Î¶Â», Â«Ã¸Â» til Â«ÏÂ», mens Â«Ã¥Â» blir Â«ÎµÂ».&lt;/p&gt;
+
+&lt;p&gt;Det er egentlig ingen utfordring med dette sÃ¥ lenge du vet hvilket
+tegnsett innholdet ditt er representert med, og det ikke har skjedd
+omforminger som du ikke er klar over. Det er det siste som er
+problematisk, spesielt de datasystemene som har vÃ¦rt i bruk de siste
+20 Ã¥rene, som ikke har noe innebygd funksjonalitet for Ã¥ forvalte
+tegnsettproblematikken. Et godt eksempel pÃ¥ dette er
+Microsoft-tegnsettet Windows-1252, som ble forvekslet som 100 %
+kompatibel med ISO-8859-1, men hadde byttet ut plassene fra 127 til
+159. Historisk vil det finnes en del variasjon i hvilket tegnsett som
+har vÃ¦rt i bruk, og hvor vellykket konvertering mellom tegnsett har
+vÃ¦rt.&lt;/p&gt;
+
+&lt;p id=&quot;tegnsett_access_unicode_som_lÃ¸sning&quot;&gt;&lt;strong&gt;Unicode som lÃ¸sning&lt;/strong&gt;&lt;/p&gt;
+
+&lt;p&gt;Tegnsettforvirring ble etter hvert et irritasjonsmoment og
+samvirkeproblem. Ofte fikk man en e-post der Ã¦Ã¸Ã¥ var erstattet av rare
+symboler fordi e-posten hadde vÃ¦rt innom et eller annet datasystem som
+ikke brukte samme tegnsett.&lt;/p&gt;
+
+&lt;p&gt;For Ã¥ lÃ¸se dette samvirkeproblemet for tegnsett ble det startet et
+arbeid og en ny standard sÃ¥ dagens lys etter hvert. Denne standarden
+fikk navnet Unicode (ISO/ IEC 10646) og skulle resultere i et tegnsett
+som alle skulle vÃ¦re enige om. Unicode er et repertoar og en
+representasjon, dvs. navngivning og tilordning av tallverdi til alle
+symboler i bruk i verden i dag.  OppfÃ¸ringer i Unicode skrives gjerne
+U+XXXX der XXXX er tallkoden i sekstentallssystemet som oppfÃ¸ringen
+har i Unicode-katalogen. Her finner vi tegn brukt av bÃ¥de levende og
+dÃ¸de sprÃ¥k, konstruerte sprÃ¥k, tekniske symboler, morsomme tegninger
+(sÃ¥kalte emojier) og tegn ingen vet hva betyr eller skal brukes
+til. Et morsomt eksempel er i nettartikkelen: U+237C â¼ RIGHT ANGLE
+WITH DOWNWARDS ZIGZAG ARROW, av Jonathan Chan.&lt;sup&gt;[&lt;a id=&quot;tegnsett_access_footnoteref_2&quot; href=&quot;#tegnsett_access_footnotedef_2&quot; title=&quot;View footnote.&quot;&gt;2&lt;/a&gt;]&lt;/sup&gt;&lt;/p&gt;
+
+&lt;p&gt;Sammen med Unicode kom det tre mÃ¥ter Ã¥ kode disse tallene pÃ¥; UTF-8,
+UTF-16 og UTF-32. Av datatekniske Ã¥rsaker er UTF-8 mye brukt, spesielt
+nÃ¥r det gjelder utveksling av tekst over Internett, mens UTF-16 er
+brukt en del til tekstfiler lagret pÃ¥ Windows. En utfordring med
+Unicode og UTF-variantene er at disse gir flere mÃ¥ter Ã¥ kode samme
+symbol pÃ¥ med en kombinasjonsmekanisme. Dette kan gi utfordringer ved
+sÃ¸k, hvis en skal sÃ¸ke etter et ord som har ett eller flere symboler
+som kan skrives pÃ¥ ulikt vis, sÃ¥ er det ikke sikkert at sÃ¸kesystemet
+vil finne alle forekomster. For eksempel kan bokstaven U+00F8 Â«Latin
+Small Letter O with StrokeÂ» kodes som den tradisjonelle norske tegnet
+Ã¸, men ogsÃ¥ som o kombinert med skrÃ¥strek U+0338. Begge deler er
+gyldig bruk av Unicode, selv om det er tradisjon for Ã¥ foretrekke Ã¥
+Â«normalisereÂ» kombinasjoner som enkelttegn der det er mulig, nettopp
+for Ã¥ forenkle sÃ¸k.&lt;/p&gt;
+
+&lt;p id=&quot;tegnsett_access_bare_unicode_fremover&quot;&gt;&lt;strong&gt;Bare Unicode fremover&lt;/strong&gt;&lt;/p&gt;
+
+&lt;p&gt;Forvaltningens bruk av tegnsett er regulert i Forskrift om
+IT-standarder i offentlig forvaltning&lt;sup&gt;[&lt;a id=&quot;tegnsett_access_footnoteref_3&quot; href=&quot;#tegnsett_access_footnotedef_3&quot; title=&quot;View footnote.&quot;&gt;3&lt;/a&gt;]&lt;/sup&gt;. Her stÃ¥r det: Â«Ved all
+utveksling av informasjon mellom forvaltningsorganer og fra
+forvaltningsorgan til innbyggere og nÃ¦ringsliv skal tegnsettstandarden
+ISO/IEC 10646 representert ved UTF8 benyttes.Â»  Det er forskjellige
+bruksomrÃ¥der til UTF-8, UTF-16 og UTF-32, men UTF-8 er kodingen vi
+kjenner mest til.  Det er flere grunner at UTF-8 Â«vantÂ» konkurransen
+til Ã¥ bli den utvalgte. Den kanskje viktigste er at UTF-8 er fullt
+samvirkende med ASCII-7, slik at den engelsksprÃ¥klige delen av verden
+kunne rulle ut UTF-8 uten Ã¥ merke noe forskjell. En tekstfil med kun
+ASCII-tekst vil vÃ¦re identisk pÃ¥ disken hvis den lagres som UTF-8 og
+ASCII. UTF-16 og UTF-32 byr pÃ¥ noen optimaliseringer som gjÃ¸r dem
+relevant for spesifikke problemomrÃ¥der, men for det meste vil vi aldri
+oppleve disse standardene pÃ¥ nÃ¦rt hold i hverdagen. Det er uansett kun
+bruken av UTF-8 som er lovregulert i Norge.&lt;/p&gt;
+
+&lt;p&gt;Det er ikke slik at hele verden bruker ISO/IEC 10646 og UTF-8. Kina
+har egne standarder for tegnsett, mye brukt er GB 18030, som er
+Unicode med en annen koding enn UTF-8, mens Taiwan og andre asiatiske
+land gjerne bruker Big5 eller andre tegnsett.&lt;/p&gt;
+
+&lt;p&gt;UTF-8 er dominerende i Norge, men det er tidsperioder der forskjellige
+datasystemer utvekslet data i henhold til ISO-8859-1, ISO-8859-15,
+Windows-1252, Codepage 865 og ISO-646-60 / Codepage 1016 mens
+overgangen til UTF-8 pÃ¥gikk. Det er ikke slik at et datasystem enkelt
+kan tvinges til Ã¥ bruke et tegnsett, da det er flere lag i et
+datasystem som mÃ¥ settes opp til Ã¥ bruke riktig tegnsett, og
+tegnsettproblemet fort oppstÃ¥r nÃ¥r det er et eller annet i
+datasystemet som bruker feil tegnsett.&lt;/p&gt;
+
+&lt;p&gt;Et klassisk eksempel pÃ¥ problemet er en utveksling av tekst mellom to
+systemer der teksten i utgangspunktet er kodet i UTF-8, men gÃ¥r
+gjennom noe som er ISO-8859-1 underveis. Dette kan vises med at ordet
+Â«pÃ¥Â» i et slik scenario ender opp som Â«pÃÂ¥Â». Det er mulig Ã¥ spore
+dette tilbake til verdiene symbolene er tilordnet i tegnsettene. Â«pÃ¥Â»
+blir til Â«pÃÂ¥Â» fordi Â«Ã¥Â» i UTF-8 er representert med U+C3AF, og dersom
+vi ser pÃ¥ hva disse verdiene representerer, ser vi at
+sekstentallssystemverdien C3 er 1100 0011 i totallssystemet og
+symbolet med dette tallet i ISO-8859-1 er Ã.&lt;/p&gt;
+
+&lt;p&gt;Vi ser det samme med sekstentallssystemverdien A5, som er 1010 0101 i
+totallssystemet, og tilsvarende symbol i ISO-8859-1 er Â¥. Slik
+mojibake kan lett skje hvis Â«pÃ¥Â» i utgangspunktet var representert med
+UTF-8, men ble behandlet med et system som bruker ISO-8859-1. Det er
+ingen automatikk i Ã¥ fange opp slike Ã¸deleggelser mens tekstlig
+innhold utveksles mellom datasystemer.&lt;/p&gt;
+
+&lt;p&gt;En utfordring for depotarkivene er at bruken av tegnsett ikke alltid
+har vÃ¦rt regulert, og at det kan finnes flere dokumentasjonssamlinger
+som er opprettet med varierende tegnsett fÃ¸r gjeldende forskrift
+inntraff â uten at det er mulig Ã¥ avlede fra filene hvilket tegnsett
+som ble brukt. Et eksempel pÃ¥ dette er â¬-symbolet, som kom fÃ¸rst etter
+at ISO-8859-1 var tatt i bruk. Det kan bli en utfordring for et
+depotarkiv, men sÃ¥ lenge det er kjent hvilket tegnsett var i bruk, sÃ¥
+bÃ¸r det gÃ¥ bra.  Riksarkivarens
+forskrift&lt;sup&gt;[&lt;a id=&quot;tegnsett_access_footnoteref_4&quot; href=&quot;#tegnsett_access_footnotedef_4&quot; title=&quot;View footnote.&quot;&gt;4&lt;/a&gt;]&lt;/sup&gt;
+formaliserer dette ved Ã¥ kreve fÃ¸lgende:&lt;/p&gt;
+
+&lt;blockquote&gt;
+&lt;p&gt;Â§ 5-11. Tegnsett i arkivuttrekk&lt;/p&gt;
+
+&lt;ol&gt;
+  &lt;li&gt;Arkivuttrekk og medfÃ¸lgende struktur- og innholdsbeskrivelser skal
+      overfÃ¸res som ren tekst i ukryptert form, og benytte godkjent
+      tegnsett.&lt;/li&gt;
+
+  &lt;li&gt;Godkjente tegnsett er:
+    &lt;ol&gt;
+      &lt;li&gt;Unicode UTF-8&lt;br&gt;
+          (ISO/IEC 10646-1:2000 Annex D)&lt;/li&gt;
+      &lt;li&gt;ISO 8859-1:1998, Latin 1&lt;/li&gt;
+      &lt;li&gt;ISO 8859-4:1998, Latin 4 for samiske tegn.&lt;/li&gt;
+    &lt;/ol&gt;&lt;/li&gt;
+
+  &lt;li&gt;Andre tegnsett aksepteres bare etter avtale med Arkivverket.&lt;/li&gt;
+&lt;/ol&gt;
+&lt;/blockquote&gt;
+
+&lt;p id=&quot;tegnsett_access_ditt_ansvar&quot;&gt;&lt;strong&gt;Ditt ansvar&lt;/strong&gt;&lt;/p&gt;
+
+&lt;p&gt;PÃ¥ mange mÃ¥ter burde ikke tegnsett vÃ¦re et problem i 2023, men sÃ¥nn er
+det nok ikke. Land som har oppgradert til UTF-8 som primÃ¦rtegnsett for
+utveksling av tekstlig innhold, begrenser problematikken betraktelig,
+men globalt sett sÃ¥ er tegnsettutfordringen ikke lÃ¸st fordi ikke alle
+er enige om Ã¥ bruke samme tegnsett.  Det kan vÃ¦re geopolitiske eller
+kulturelle hensyn som ligger til grunn for dette.&lt;/p&gt;
+
+&lt;p&gt;Det er uansett verdt Ã¥ merke at selv om bruken av UTF-8 skulle bli
+100% utbredt, sÃ¥ er det et historisk perspektiv (ASCII-7,
+ISO-8859-variantene, UTF-8) her som gjÃ¸r tegnsett til et problemomrÃ¥de
+arkivarene mÃ¥ forstÃ¥ og hÃ¥ndtere.  Som danningsarkivar har du et
+ansvar for Ã¥ vite hvilket tegnsett systemene og databasene dere
+forvalter, er i samsvar med. Det er noe IT-avdelingen din eller
+programvareleverandÃ¸rene enkelt skal kunne svare pÃ¥, og svaret skal
+vÃ¦re UTF-8 for alle nye systemer.&lt;/p&gt;
+
+&lt;hr&gt;
+
+&lt;p id=&quot;tegnsett_access_footnotedef_1&quot;&gt;&lt;a href=&quot;#tegnsett_access_footnoteref_1&quot;&gt;1&lt;/a&gt;. Tegnsettkilde &lt;a href=&quot;https://en.wikipedia.org/wiki/ISO/IEC_8859&quot;&gt;https://en.wikipedia.org/wiki/ISO/IEC_8859&lt;/a&gt;&lt;/p&gt;
+
+&lt;p id=&quot;tegnsett_access_footnotedef_2&quot;&gt;&lt;a href=&quot;#tegnsett_access_footnoteref_2&quot;&gt;2&lt;/a&gt;. &lt;a href=&quot;https://ionathan.ch/2022/04/09/angzarr.html&quot;&gt;https://ionathan.ch/2022/04/09/angzarr.html&lt;/a&gt;&lt;/p&gt;
+
+&lt;p id=&quot;tegnsett_access_footnotedef_3&quot;&gt;&lt;a href=&quot;#tegnsett_access_footnoteref_3&quot;&gt;3&lt;/a&gt;. &lt;a href=&quot;https://lovdata.no/dokument/SF/forskrift/2013-04-05-959/%C2%A78#%C2%A78&quot;&gt;https://lovdata.no/dokument/SF/forskrift/2013-04-05-959/%C2%A78#%C2%A78&lt;/a&gt;&lt;/p&gt;
+
+&lt;p id=&quot;tegnsett_access_footnotedef_4&quot;&gt;&lt;a href=&quot;#tegnsett_access_footnoteref_4&quot;&gt;4&lt;/a&gt;. &lt;a href=&quot;https://lovdata.no/forskrift/2017-12-19-2286/Â§5-11&quot;&gt;https://lovdata.no/forskrift/2017-12-19-2286/Â§5-11&lt;/a&gt;&lt;/p&gt;
+
+&lt;/blockquote&gt;
+
+&lt;p&gt;For Ã¸vrig burde varsleren Edward Snowden fÃ¥ politisk asyl i Norge.&lt;/p&gt;
+
+&lt;p&gt;Som vanlig, hvis du bruker Bitcoin og Ã¸nsker Ã¥ vise din stÃ¸tte til
+det jeg driver med, setter jeg pris pÃ¥ om du sender Bitcoin-donasjoner
+til min adresse
+&lt;b&gt;&lt;a href=&quot;bitcoin:15oWEoG9dUPovwmUL9KWAnYRtNJEkP1u1b&quot;&gt;15oWEoG9dUPovwmUL9KWAnYRtNJEkP1u1b&lt;/a&gt;&lt;/b&gt;. Merk,
+betaling med bitcoin er ikke anonymt. :)&lt;/p&gt;
+</description>
+	</item>
+	
 	<item>
 		<title>New and improved sqlcipher in Debian for accessing Signal database</title>
 		<link>https://people.skolelinux.org/pere/blog/New_and_improved_sqlcipher_in_Debian_for_accessing_Signal_database.html</link>
@@ -911,41 +1471,6 @@ have enough sponsor funds to pay for food, and shelter for the people
 traveling from afar to join us.  If you would like to join the
 gathering, get in touch.&lt;/p&gt;
  
-&lt;p&gt;As usual, if you use Bitcoin and want to show your support of my
-activities, please send Bitcoin donations to my address
-&lt;b&gt;&lt;a href=&quot;bitcoin:15oWEoG9dUPovwmUL9KWAnYRtNJEkP1u1b&quot;&gt;15oWEoG9dUPovwmUL9KWAnYRtNJEkP1u1b&lt;/a&gt;&lt;/b&gt;.&lt;/p&gt;
-</description>
-	</item>
-	
-	<item>
-		<title>OpenSnitch in Debian ready for prime time</title>
-		<link>https://people.skolelinux.org/pere/blog/OpenSnitch_in_Debian_ready_for_prime_time.html</link>
-		<guid isPermaLink="true">https://people.skolelinux.org/pere/blog/OpenSnitch_in_Debian_ready_for_prime_time.html</guid>
-                <pubDate>Sat, 13 May 2023 12:10:00 +0200</pubDate>
-		<description>&lt;p&gt;A bit delayed,
-&lt;a href=&quot;https://tracker.debian.org/pkg/opensnitch&quot;&gt;the interactive
-application firewall OpenSnitch&lt;/a&gt; package in Debian now got the
-latest fixes ready for Debian Bookworm.  Because it depend on a
-package missing on some architectures, the autopkgtest check of the
-testing migration script did not understand that the tests were
-actually working, so the migration was delayed.  A bug in the package
-dependencies is also fixed, so those installing the firewall package
-(opensnitch) now also get the GUI admin tool (python3-opensnitch-ui)
-installed by default.  I am very grateful to Gustavo IÃ±iguez Goya for
-his work on getting the package ready for Debian Bookworm.&lt;/p&gt;
-
-&lt;p&gt;Armed with this package I have discovered some surprising
-connections from programs I believed were able to work completly
-offline, and it has already proven its worth, at least to me.  If you
-too want to get more familiar with the kind of programs using
-Internett connections on your machine, I recommend testing &lt;tt&gt;apt
-install opensnitch&lt;/tt&gt; in Bookworm and see what you think.&lt;/p&gt;
-
-&lt;p&gt;The package is still not able to build its eBPF module within
-Debian.  Not sure how much work it would be to get it working, but
-suspect some kernel related packages need to be extended with more
-header files to get it working.&lt;/p&gt;
-
 &lt;p&gt;As usual, if you use Bitcoin and want to show your support of my
 activities, please send Bitcoin donations to my address
 &lt;b&gt;&lt;a href=&quot;bitcoin:15oWEoG9dUPovwmUL9KWAnYRtNJEkP1u1b&quot;&gt;15oWEoG9dUPovwmUL9KWAnYRtNJEkP1u1b&lt;/a&gt;&lt;/b&gt;.&lt;/p&gt;