Title: «Når «på» blir «pÃ¥»: Et reservoar av tegn sett fra depotet» i tidsskriftet Aksess
Tags: norsk, noark5, standard
-Date: 2023-11-15 10:00
+Date: 2023-11-15 09:20
<p>For noen uker siden skrev en kamerat og meg
<a href="https://www.aksess-tidsskrift.no/fordypning/175530">en
bokstavene æ, ø og å ofte var ødelagt i e-poster – et klassisk
eksempel på tegnsettproblemstilling.</p>
-<p id="_nå_og_før"><strong>«Nå» og «før»</strong></p>
+<p id="tegnsett_access_nå_og_før"><strong>«Nå» og «før»</strong></p>
<p>Tid er et skjult problem for depot fordi vi danner dokumentasjon i
en kontekst som er preget av å være «nå». Vår forståelse av verden og
<p>Tegnsettproblemstillingen er satt sammen av fire fasetter;
repertoar, representasjon, koding og uttegning.</p>
-<p id="_repertoarer"><strong>Repertoarer</strong></p>
+<p id="tegnsett_access_repertoarer"><strong>Repertoarer</strong></p>
<p>Repertoar er en samling med tegn og symboler som kan
representeres. Tenk norsk alfabet eller japanske piktogrammer, men
skrifttyper som kun kobler mellom tallkode og uttegning, uten å
fortelle noe om hvordan tallkodene egentlig skal tolkes.</p>
-<p id="_fra_ascii_til_iso_8859"><strong>Fra ASCII til ISO-8859</strong></p>
+<p id="tegnsett_access_fra_ascii_til_iso_8859"><strong>Fra ASCII til ISO-8859</strong></p>
<p>Vi begynner historien med ASCII (American Standard Code for
Information Interchange) som har en historie som spores tilbake til
<caption>Tabell 3. Viser tolkning av verdiene som er tilegnet de
norske symbolene i ISO-8859-1 i de andre ISO 8859-variatene. Merk
-ISO-8859-12 ikke finnes da arbeidet ble avsluttet.<sup>[<a id="_footnoteref_1" href="#_footnotedef_1" title="View footnote.">1</a>]</sup></caption>
+ISO-8859-12 ikke finnes da arbeidet ble avsluttet.<sup>[<a id="tegnsett_access_footnoteref_1" href="#tegnsett_access_footnotedef_1" title="View footnote.">1</a>]</sup></caption>
<tbody>
<tr>
har vært i bruk, og hvor vellykket konvertering mellom tegnsett har
vært.</p>
-<p id="_unicode_som_løsning"><strong>Unicode som løsning</strong></p>
+<p id="tegnsett_access_unicode_som_løsning"><strong>Unicode som løsning</strong></p>
<p>Tegnsettforvirring ble etter hvert et irritasjonsmoment og
samvirkeproblem. Ofte fikk man en e-post der æøå var erstattet av rare
døde språk, konstruerte språk, tekniske symboler, morsomme tegninger
(såkalte emojier) og tegn ingen vet hva betyr eller skal brukes
til. Et morsomt eksempel er i nettartikkelen: U+237C ⍼ RIGHT ANGLE
-WITH DOWNWARDS ZIGZAG ARROW, av Jonathan Chan.<sup>[<a id="_footnoteref_2" href="#_footnotedef_2" title="View footnote.">2</a>]</sup></p>
+WITH DOWNWARDS ZIGZAG ARROW, av Jonathan Chan.<sup>[<a id="tegnsett_access_footnoteref_2" href="#tegnsett_access_footnotedef_2" title="View footnote.">2</a>]</sup></p>
<p>Sammen med Unicode kom det tre måter å kode disse tallene på; UTF-8,
UTF-16 og UTF-32. Av datatekniske årsaker er UTF-8 mye brukt, spesielt
«normalisere» kombinasjoner som enkelttegn der det er mulig, nettopp
for å forenkle søk.</p>
-<p id="_bare_unicode_fremover"><strong>Bare Unicode fremover</strong></p>
+<p id="tegnsett_access_bare_unicode_fremover"><strong>Bare Unicode fremover</strong></p>
<p>Forvaltningens bruk av tegnsett er regulert i Forskrift om
-IT-standarder i offentlig forvaltning<sup>[<a id="_footnoteref_3" href="#_footnotedef_3" title="View footnote.">3</a>]</sup>. Her står det: «Ved all
+IT-standarder i offentlig forvaltning<sup>[<a id="tegnsett_access_footnoteref_3" href="#tegnsett_access_footnotedef_3" title="View footnote.">3</a>]</sup>. Her står det: «Ved all
utveksling av informasjon mellom forvaltningsorganer og fra
forvaltningsorgan til innbyggere og næringsliv skal tegnsettstandarden
ISO/IEC 10646 representert ved UTF8 benyttes.» Det er forskjellige
at ISO-8859-1 var tatt i bruk. Det kan bli en utfordring for et
depotarkiv, men så lenge det er kjent hvilket tegnsett var i bruk, så
bør det gå bra. Riksarkivarens
-forskrift<sup>[<a id="_footnoteref_4" href="#_footnotedef_4" title="View footnote.">4</a>]</sup>
+forskrift<sup>[<a id="tegnsett_access_footnoteref_4" href="#tegnsett_access_footnotedef_4" title="View footnote.">4</a>]</sup>
formaliserer dette ved å kreve følgende:</p>
<blockquote>
</ol>
</blockquote>
-<p id="_ditt_ansvar"><strong>Ditt ansvar</strong></p>
+<p id="tegnsett_access_ditt_ansvar"><strong>Ditt ansvar</strong></p>
<p>På mange måter burde ikke tegnsett være et problem i 2023, men sånn er
det nok ikke. Land som har oppgradert til UTF-8 som primærtegnsett for
<hr>
-<p id="_footnotedef_1"><a href="#_footnoteref_1">1</a>. Tegnsettkilde <a href="https://en.wikipedia.org/wiki/ISO/IEC_8859">https://en.wikipedia.org/wiki/ISO/IEC_8859</a></p>
+<p id="tegnsett_access_footnotedef_1"><a href="#tegnsett_access_footnoteref_1">1</a>. Tegnsettkilde <a href="https://en.wikipedia.org/wiki/ISO/IEC_8859">https://en.wikipedia.org/wiki/ISO/IEC_8859</a></p>
-<p id="_footnotedef_2"><a href="#_footnoteref_2">2</a>. <a href="https://ionathan.ch/2022/04/09/angzarr.html">https://ionathan.ch/2022/04/09/angzarr.html</a></p>
+<p id="tegnsett_access_footnotedef_2"><a href="#tegnsett_access_footnoteref_2">2</a>. <a href="https://ionathan.ch/2022/04/09/angzarr.html">https://ionathan.ch/2022/04/09/angzarr.html</a></p>
-<p id="_footnotedef_3"><a href="#_footnoteref_3">3</a>. <a href="https://lovdata.no/dokument/SF/forskrift/2013-04-05-959/%C2%A78#%C2%A78">https://lovdata.no/dokument/SF/forskrift/2013-04-05-959/%C2%A78#%C2%A78</a></p>
+<p id="tegnsett_access_footnotedef_3"><a href="#tegnsett_access_footnoteref_3">3</a>. <a href="https://lovdata.no/dokument/SF/forskrift/2013-04-05-959/%C2%A78#%C2%A78">https://lovdata.no/dokument/SF/forskrift/2013-04-05-959/%C2%A78#%C2%A78</a></p>
-<p id="_footnotedef_4"><a href="#_footnoteref_4">4</a>. <a href="https://lovdata.no/forskrift/2017-12-19-2286/§5-11">https://lovdata.no/forskrift/2017-12-19-2286/§5-11</a></p>
+<p id="tegnsett_access_footnotedef_4"><a href="#tegnsett_access_footnoteref_4">4</a>. <a href="https://lovdata.no/forskrift/2017-12-19-2286/§5-11">https://lovdata.no/forskrift/2017-12-19-2286/§5-11</a></p>
</blockquote>