]> pere.pagekite.me Git - homepage.git/blob - blog/index.rss
Generated.
[homepage.git] / blog / index.rss
1 <?xml version="1.0" encoding="utf-8"?>
2 <rss version='2.0' xmlns:lj='http://www.livejournal.org/rss/lj/1.0/' xmlns:atom="http://www.w3.org/2005/Atom">
3 <channel>
4 <title>Petter Reinholdtsen</title>
5 <description></description>
6 <link>https://people.skolelinux.org/pere/blog/</link>
7 <atom:link href="https://people.skolelinux.org/pere/blog/index.rss" rel="self" type="application/rss+xml" />
8
9 <item>
10 <title>«Når «på» blir «pÃ¥»: Et reservoar av tegn sett fra depotet» i tidsskriftet Aksess</title>
11 <link>https://people.skolelinux.org/pere/blog/_N_r__p___blir__p_____Et_reservoar_av_tegn_sett_fra_depotet__i_tidsskriftet_Aksess.html</link>
12 <guid isPermaLink="true">https://people.skolelinux.org/pere/blog/_N_r__p___blir__p_____Et_reservoar_av_tegn_sett_fra_depotet__i_tidsskriftet_Aksess.html</guid>
13 <pubDate>Wed, 15 Nov 2023 09:20:00 +0100</pubDate>
14 <description>&lt;p&gt;For noen uker siden skrev en kamerat og meg
15 &lt;a href=&quot;https://www.aksess-tidsskrift.no/fordypning/175530&quot;&gt;en
16 artikkel om tegnsett&lt;/a&gt; i
17 &lt;a href=&quot;https://www.aksess-tidsskrift.no/&quot;&gt;arkivtidsskriftet
18 Aksess&lt;/a&gt; både på web og i papirutgave nr. 3 2023. Her er det som
19 nettopp ble publisert.&lt;/p&gt;
20
21 &lt;blockquote&gt;
22
23 &lt;p&gt;&lt;strong&gt;Når «på» blir «pÃ¥»: Et reservoar av tegn sett fra
24 depotet&lt;/strong&gt;&lt;/p&gt;
25
26 &lt;p&gt;av Thomas Sødring og Petter Reinholdtsen&lt;/p&gt;
27
28 &lt;p&gt;De færreste av oss tenker over hva som skjer dypere i datamaskinen
29 mens vi sitter der og skriver noe på tastaturet. Når du trykker på
30 tasten «Å», så vises bokstaven Å. Men noen ganger blir det
31 feil. Hvorfor det – og hva er viktig å være klar over i
32 arkivsammenheng?&lt;/p&gt;
33
34 &lt;p&gt;Dersom bokstaver tolkes forskjellig mellom systemer, blir det fort
35 rot, dette kalles mojibake blant kjennere, etter det japanske
36 uttrykket for tegnomforming. Det er en lang historie her som tidvis
37 har vært preget av rot. Noen husker kanskje tilbake til en tid der
38 bokstavene æ, ø og å ofte var ødelagt i e-poster – et klassisk
39 eksempel på tegnsettproblemstilling.&lt;/p&gt;
40
41 &lt;p id=&quot;tegnsett_access_nå_og_før&quot;&gt;&lt;strong&gt;«Nå» og «før»&lt;/strong&gt;&lt;/p&gt;
42
43 &lt;p&gt;Tid er et skjult problem for depot fordi vi danner dokumentasjon i
44 en kontekst som er preget av å være «nå». Vår forståelse av verden og
45 bruken av teknologi er utgangspunktet for denne konteksten. Tenk selv
46 hvordan verden har utviklet seg de siste 20 årene, hva samfunnet er
47 opptatt av, og hvordan vi bruker teknologi i hverdagen. Tid er et
48 skjult problem fordi når vi trekker dokumentasjon ut av systemer og
49 deponerer for langtidsbevaring, er konteksten til materialet «nå», men
50 verden går videre. Ettersom teknologien og måten vi bruker den på,
51 utvikler seg, blir «nå» til «før», og dokumentasjonen befinner seg
52 snart i en «før»-kontekst.&lt;/p&gt;
53
54 &lt;p&gt;Dette med «før» og «nå» i forhold til dokumentasjonens kontekst er
55 noe vi er veldig lite bevisste på, men det er en problemstilling
56 depotarkivene eier og forvalter. En av disse utfordringene er hvorfor
57 «Ø» ikke nødvendigvis er det samme som «Ø», og hvorfor det i det hele
58 tatt gir mening å si noe sånt. Vi snakker her om noe som heter
59 tegnsett, som er en avtalt måte å representere bokstaver, tall og
60 andre symboler på slik at vi på en feilfri måte kan utveksle tekst
61 mellom datasystemer.&lt;/p&gt;
62
63 &lt;p&gt;Tegnsettproblemstillingen er satt sammen av fire fasetter;
64 repertoar, representasjon, koding og uttegning.&lt;/p&gt;
65
66 &lt;p id=&quot;tegnsett_access_repertoarer&quot;&gt;&lt;strong&gt;Repertoarer&lt;/strong&gt;&lt;/p&gt;
67
68 &lt;p&gt;Repertoar er en samling med tegn og symboler som kan
69 representeres. Tenk norsk alfabet eller japanske piktogrammer, men
70 også matematiske og elektroniske symboler. Bokstaven «stor a» kan være
71 en oppføring i et slikt repertoar. For å kunne brukes i en datamaskin
72 trenger hver oppføring i et slikt repertoar en representasjon, hvilket
73 i datamaskinsammenheng betyr at det tilordnes et tall. Tallet kan
74 lagres på ulike vis i en eller flere kodingsformater. For eksempel kan
75 en skrive tallet ti som både 10, X og A, i henholdsvis
76 titallssystemet, romertallssystemet og sekstentallssystemet.&lt;/p&gt;
77
78 &lt;p&gt;Hvis en skal kunne lese inn filer og vite hvilket tall og hvilken
79 representasjon og instans i et repertoar det er snakk om, så må en
80 vite hvordan tallet er kodet. Sist, men ikke minst, for å kunne bruke
81 symbolet til noe må det kunne være kjent hvordan det skal se ut eller
82 tegnes på ark. Det finnes utallige skrifttyper med norske bokstaver,
83 alle litt forskjellige, og skal en kunne tegne en stor A på skjermen,
84 så må datamaskinen vite hva den skal tegne. Skrifttyper inneholder
85 informasjon om hvordan ulike tall skal tegnes. De inneholder ikke
86 alltid alle symbolene som er brukt i en tekst, hvilket gjør at ikke
87 alle forståtte tegn vil kunne vises på skjerm eller ark.&lt;/p&gt;
88
89 &lt;p&gt;Hver av disse fasettene må være avklart for å kunne ta vare på og vise
90 frem tekst med en datamaskin. Kombinasjon av repertoar, representasjon
91 og koding er det en kaller et tegnsett. Kombinasjonen av
92 representasjon og uttegning kalles en skrifttype. De fleste
93 skrifttyper har også informasjon om repertoar, men det finnes
94 skrifttyper som kun kobler mellom tallkode og uttegning, uten å
95 fortelle noe om hvordan tallkodene egentlig skal tolkes.&lt;/p&gt;
96
97 &lt;p id=&quot;tegnsett_access_fra_ascii_til_iso_8859&quot;&gt;&lt;strong&gt;Fra ASCII til ISO-8859&lt;/strong&gt;&lt;/p&gt;
98
99 &lt;p&gt;Vi begynner historien med ASCII (American Standard Code for
100 Information Interchange) som har en historie som spores tilbake til
101 1963. Utgangspunktet til ASCII var at det kunne kode opp til 128
102 forskjellige symboler i vanlig bruk i USA. De visuelle symbolene i
103 ASCII er de små og store bokstavene (a til z og A til Z), tall (0 til
104 9) og tegnsettingssymboler (for eksempel semikolon, komma og
105 punktum). ASCII har også noen usynlige symboler som ble brukt for
106 bl.a. kommunikasjon. Før ASCII var det for eksempel teleks-tegnsett
107 med plass til bare 32 tegn og EBCDIC med plass til 256 tegn, alle med
108 en helt annen rekkefølge på symbolene enn ASCII, men de har vært lite
109 brukt de siste femti årene. Et eksempel på noen utvalgte symboler i
110 repertoaret til ASCII vises i tabell 1.&lt;/p&gt;
111
112 &lt;table align=&quot;center&quot; width=&quot;50%&quot;&gt;
113
114 &lt;caption&gt;Tabell 1. Eksempel på utvalgte symboler hentet fra
115 ASCII-tegnsettet. Kolonnen «Binær» viser symbolets verdi i
116 totallssystemet (1 og 0 tall), mens kolonnen «Desimal» viser symbolets
117 verdi i titallssystemet.&lt;/caption&gt;
118
119 &lt;tbody&gt;
120 &lt;tr&gt;
121 &lt;th&gt;Grafisk&lt;/th&gt;
122 &lt;th&gt;Binær&lt;/th&gt;
123 &lt;th&gt;Desimal&lt;/th&gt;
124 &lt;/tr&gt;
125 &lt;tr&gt;
126 &lt;td&gt;A&lt;/td&gt;
127 &lt;td&gt;1000001&lt;/td&gt;
128 &lt;td align=&quot;right&quot;&gt;65&lt;/td&gt;
129 &lt;/tr&gt;
130 &lt;tr&gt;
131 &lt;td&gt;M&lt;/td&gt;
132 &lt;td&gt;1001101&lt;/td&gt;
133 &lt;td align=&quot;right&quot;&gt;77&lt;/td&gt;
134 &lt;/tr&gt;
135 &lt;tr&gt;
136 &lt;td&gt;Z&lt;/td&gt;
137 &lt;td&gt;1011010&lt;/td&gt;
138 &lt;td align=&quot;right&quot;&gt;90&lt;/td&gt;
139 &lt;/tr&gt;
140 &lt;tr&gt;
141 &lt;td&gt;a&lt;/td&gt;
142 &lt;td&gt;1100001&lt;/td&gt;
143 &lt;td align=&quot;right&quot;&gt;97&lt;/td&gt;
144 &lt;/tr&gt;
145 &lt;tr&gt;
146 &lt;td&gt;m&lt;/td&gt;
147 &lt;td&gt;1101101&lt;/td&gt;
148 &lt;td align=&quot;right&quot;&gt;109&lt;/td&gt;
149 &lt;/tr&gt;
150 &lt;tr&gt;
151 &lt;td&gt;z&lt;/td&gt;
152 &lt;td&gt;1111010&lt;/td&gt;
153 &lt;td align=&quot;right&quot;&gt;122&lt;/td&gt;
154 &lt;/tr&gt;
155 &lt;tr&gt;
156 &lt;td&gt;0&lt;/td&gt;
157 &lt;td&gt;0110000&lt;/td&gt;
158 &lt;td align=&quot;right&quot;&gt;48&lt;/td&gt;
159 &lt;/tr&gt;
160 &lt;tr&gt;
161 &lt;td&gt;9&lt;/td&gt;
162 &lt;td&gt;0111001&lt;/td&gt;
163 &lt;td align=&quot;right&quot;&gt;58&lt;/td&gt;
164 &lt;/tr&gt;
165 &lt;tr&gt;
166 &lt;td&gt;;&lt;/td&gt;
167 &lt;td&gt;0111011&lt;/td&gt;
168 &lt;td align=&quot;right&quot;&gt;59&lt;/td&gt;
169 &lt;/tr&gt;
170 &lt;/tbody&gt;
171 &lt;/table&gt;
172
173 &lt;p&gt;Det opprinnelige ASCII-tegnsettet ble også omtalt som ASCII-7 og
174 brukte 7 bits (0 og 1) for å representere symboler. Datamaskiner er
175 ofte konfigurert til å jobbe med enheter der bits er gruppert som 4
176 eller 8 bits . Det lå en mulighet i å ta i bruk bit åtte. En slik
177 endring ville gjøre det mulig for datamaskiner å øke antall symboler
178 de kunne representere, noe som ga en økning fra 128 forskjellige
179 symboler til 256 forskjellige symboler. Det ble åpnet for å innlemme
180 de nordiske bokstavene sammen med ASCII, og dette ble etter hvert
181 standardisert som ISO-8859-1. Tabell 2 viser deler av ISO-8859-1 som
182 støtter de norske bokstavene.&lt;/p&gt;
183
184 &lt;p&gt;Det sier seg selv at muligheten til å representere inntil 256 symboler
185 ikke holder når vi snakker om en global verden, og det ble gjort et
186 standardiseringsløp som tok utgangspunkt i ASCII-7 med en utvidelse
187 til å bruke den åttende biten for ulike språkgrupper. Denne standarden
188 heter ISO-8859 og er inndelt i opptil 16 varianter, altså fra
189 ISO-8859-1 til ISO-8859-16.&lt;/p&gt;
190
191 &lt;table align=&quot;center&quot; width=&quot;50%&quot;&gt;
192
193 &lt;caption&gt;Tabell 2. Koding av de norske symbolene slik de er definert i
194 ISO-8859-1 tegnsettet.&lt;/caption&gt;
195
196 &lt;tbody&gt;
197 &lt;tr&gt;
198 &lt;th&gt;Grafisk&lt;/th&gt;
199 &lt;th&gt;Binær&lt;/th&gt;
200 &lt;th&gt;Desimal&lt;/th&gt;
201 &lt;/tr&gt;
202 &lt;tr&gt;
203 &lt;td&gt;Æ&lt;/td&gt;
204 &lt;td&gt;11000110&lt;/td&gt;
205 &lt;td align=&quot;right&quot;&gt;198&lt;/td&gt;
206 &lt;/tr&gt;
207 &lt;tr&gt;
208 &lt;td&gt;Ø&lt;/td&gt;
209 &lt;td&gt;11011000&lt;/td&gt;
210 &lt;td align=&quot;right&quot;&gt;216&lt;/td&gt;
211 &lt;/tr&gt;
212 &lt;tr&gt;
213 &lt;td&gt;Å&lt;/td&gt;
214 &lt;td&gt;11000101&lt;/td&gt;
215 &lt;td align=&quot;right&quot;&gt;197&lt;/td&gt;
216 &lt;/tr&gt;
217 &lt;tr&gt;
218 &lt;td&gt;æ&lt;/td&gt;
219 &lt;td&gt;11100110&lt;/td&gt;
220 &lt;td align=&quot;right&quot;&gt;230&lt;/td&gt;
221 &lt;/tr&gt;
222 &lt;tr&gt;
223 &lt;td&gt;ø&lt;/td&gt;
224 &lt;td&gt;11111000&lt;/td&gt;
225 &lt;td align=&quot;right&quot;&gt;248&lt;/td&gt;
226 &lt;/tr&gt;
227 &lt;tr&gt;
228 &lt;td&gt;å&lt;/td&gt;
229 &lt;td&gt;11100101&lt;/td&gt;
230 &lt;td align=&quot;right&quot;&gt;229&lt;/td&gt;
231 &lt;/tr&gt;
232 &lt;/tbody&gt;
233 &lt;/table&gt;
234
235 &lt;p&gt;Norske tegn er definert i ISO-8859-1, som også omtales som Latin 1, de
236 fleste samiske tegn er definert i ISO-8859-4 (Latin 4) mens tilgang
237 til €-symbolet kom med ISO-8859-15 (Latin 9). ISO-8859-15 er en
238 revisjon av ISO-8859-1 som fjerner noen lite brukte symboler og
239 erstatter bokstaver som er mer brukt, og introduserer €-symbolet. Det
240 er viktig å merke at alle ISO-8859-variantene har overlapp med
241 ASCII-7, noe som ga samvirke med de engelskspråklige landene som ikke
242 trengte å gjøre noe. Det innebærer også at de første 128 verdiene i
243 ISO-8859-variantene representerer de samme symbolene. Det er først når
244 du kommer til tolkningen av de resterende 128 verdiene med nummer 128
245 til 255, at det oppsto tolkningsutfordringer mellom
246 ISO-8859-variantene.&lt;/p&gt;
247
248 &lt;p&gt;ISO-8859-verdenen fungerte godt så lenge tegnsettet som ble brukt når
249 innhold ble skapt, også ble brukt når innhold ble gjengitt og du ikke
250 trengte å kombinere innhold fra forskjellige tegnsett i samme
251 dokument. Utfordringen med bruken av ISO-8859-variantene ble raskt
252 tydelig i en mer globalisert verden med utveksling av tekst på tvers
253 av landegrenser der tekstlig innhold i dokumenter, e-poster og
254 websider kunne bli skrevet med ett tegnsett og gjengitt med et annet
255 tegnsett.&lt;/p&gt;
256
257 &lt;table align=&quot;center&quot; width=&quot;60%&quot;&gt;
258
259 &lt;caption&gt;Tabell 3. Viser tolkning av verdiene som er tilegnet de
260 norske symbolene i ISO-8859-1 i de andre ISO 8859-variatene. Merk
261 ISO-8859-12 ikke finnes da arbeidet ble avsluttet.&lt;sup&gt;[&lt;a id=&quot;tegnsett_access_footnoteref_1&quot; href=&quot;#tegnsett_access_footnotedef_1&quot; title=&quot;View footnote.&quot;&gt;1&lt;/a&gt;]&lt;/sup&gt;&lt;/caption&gt;
262
263 &lt;tbody&gt;
264 &lt;tr&gt;
265 &lt;th&gt;Binærverdi&lt;/th&gt;
266 &lt;th&gt;1&lt;/th&gt;
267 &lt;th&gt;2&lt;/th&gt;
268 &lt;th&gt;3&lt;/th&gt;
269 &lt;th&gt;4&lt;/th&gt;
270 &lt;th&gt;5&lt;/th&gt;
271 &lt;th&gt;6&lt;/th&gt;
272 &lt;th&gt;7&lt;/th&gt;
273 &lt;th&gt;8&lt;/th&gt;
274 &lt;th&gt;9&lt;/th&gt;
275 &lt;th&gt;10&lt;/th&gt;
276 &lt;th&gt;11&lt;/th&gt;
277 &lt;th&gt;13&lt;/th&gt;
278 &lt;th&gt;14&lt;/th&gt;
279 &lt;th&gt;15&lt;/th&gt;
280 &lt;th&gt;16&lt;/th&gt;
281 &lt;/tr&gt;
282 &lt;tr&gt;
283 &lt;td&gt;11000110&lt;/td&gt;
284 &lt;td&gt;Æ&lt;/td&gt;
285 &lt;td&gt;Ć&lt;/td&gt;
286 &lt;td&gt;Ĉ&lt;/td&gt;
287 &lt;td&gt;Æ&lt;/td&gt;
288 &lt;td&gt;Ц&lt;/td&gt;
289 &lt;td&gt;ئ&lt;/td&gt;
290 &lt;td&gt;Ζ&lt;/td&gt;
291 &lt;td&gt;&lt;/td&gt;
292 &lt;td&gt;Æ&lt;/td&gt;
293 &lt;td&gt;Æ&lt;/td&gt;
294 &lt;td&gt;&lt;/td&gt;
295 &lt;td&gt;Ę&lt;/td&gt;
296 &lt;td&gt;Æ&lt;/td&gt;
297 &lt;td&gt;Æ&lt;/td&gt;
298 &lt;td&gt;Æ&lt;/td&gt;
299 &lt;/tr&gt;
300 &lt;tr&gt;
301 &lt;td&gt;11011000&lt;/td&gt;
302 &lt;td&gt;Ø&lt;/td&gt;
303 &lt;td&gt;Ř&lt;/td&gt;
304 &lt;td&gt;Ĝ&lt;/td&gt;
305 &lt;td&gt;Ø&lt;/td&gt;
306 &lt;td&gt;и&lt;/td&gt;
307 &lt;td&gt;ظ&lt;/td&gt;
308 &lt;td&gt;Ψ&lt;/td&gt;
309 &lt;td&gt;&lt;/td&gt;
310 &lt;td&gt;Ø&lt;/td&gt;
311 &lt;td&gt;Ø&lt;/td&gt;
312 &lt;td&gt;&lt;/td&gt;
313 &lt;td&gt;Ų&lt;/td&gt;
314 &lt;td&gt;Ø&lt;/td&gt;
315 &lt;td&gt;Ø&lt;/td&gt;
316 &lt;td&gt;Ű&lt;/td&gt;
317 &lt;/tr&gt;
318 &lt;tr&gt;
319 &lt;td&gt;11000101&lt;/td&gt;
320 &lt;td&gt;Å&lt;/td&gt;
321 &lt;td&gt;Ĺ&lt;/td&gt;
322 &lt;td&gt;Ċ&lt;/td&gt;
323 &lt;td&gt;Å&lt;/td&gt;
324 &lt;td&gt;Х&lt;/td&gt;
325 &lt;td&gt;إ&lt;/td&gt;
326 &lt;td&gt;Ε&lt;/td&gt;
327 &lt;td&gt;&lt;/td&gt;
328 &lt;td&gt;Å&lt;/td&gt;
329 &lt;td&gt;Å&lt;/td&gt;
330 &lt;td&gt;&lt;/td&gt;
331 &lt;td&gt;Å&lt;/td&gt;
332 &lt;td&gt;Å&lt;/td&gt;
333 &lt;td&gt;Å&lt;/td&gt;
334 &lt;td&gt;Ć&lt;/td&gt;
335 &lt;/tr&gt;
336 &lt;tr&gt;
337 &lt;td&gt;11100110&lt;/td&gt;
338 &lt;td&gt;æ&lt;/td&gt;
339 &lt;td&gt;ć&lt;/td&gt;
340 &lt;td&gt;ĉ&lt;/td&gt;
341 &lt;td&gt;æ&lt;/td&gt;
342 &lt;td&gt;ц&lt;/td&gt;
343 &lt;td&gt;ن&lt;/td&gt;
344 &lt;td&gt;ζ&lt;/td&gt;
345 &lt;td&gt;ז&lt;/td&gt;
346 &lt;td&gt;æ&lt;/td&gt;
347 &lt;td&gt;æ&lt;/td&gt;
348 &lt;td&gt;&lt;/td&gt;
349 &lt;td&gt;ę&lt;/td&gt;
350 &lt;td&gt;æ&lt;/td&gt;
351 &lt;td&gt;æ&lt;/td&gt;
352 &lt;td&gt;v&lt;/td&gt;
353 &lt;/tr&gt;
354 &lt;tr&gt;
355 &lt;td&gt;11111000&lt;/td&gt;
356 &lt;td&gt;ø&lt;/td&gt;
357 &lt;td&gt;ř&lt;/td&gt;
358 &lt;td&gt;ĝ&lt;/td&gt;
359 &lt;td&gt;ø&lt;/td&gt;
360 &lt;td&gt;ј&lt;/td&gt;
361 &lt;td&gt;&lt;/td&gt;
362 &lt;td&gt;ψ&lt;/td&gt;
363 &lt;td&gt;ר&lt;/td&gt;
364 &lt;td&gt;ø&lt;/td&gt;
365 &lt;td&gt;ø&lt;/td&gt;
366 &lt;td&gt;&lt;/td&gt;
367 &lt;td&gt;ų&lt;/td&gt;
368 &lt;td&gt;ø&lt;/td&gt;
369 &lt;td&gt;ø&lt;/td&gt;
370 &lt;td&gt;ű&lt;/td&gt;
371 &lt;/tr&gt;
372 &lt;tr&gt;
373 &lt;td&gt;11100101&lt;/td&gt;
374 &lt;td&gt;å&lt;/td&gt;
375 &lt;td&gt;ĺ&lt;/td&gt;
376 &lt;td&gt;ċ&lt;/td&gt;
377 &lt;td&gt;å&lt;/td&gt;
378 &lt;td&gt;х&lt;/td&gt;
379 &lt;td&gt;م&lt;/td&gt;
380 &lt;td&gt;ε&lt;/td&gt;
381 &lt;td&gt;ו&lt;/td&gt;
382 &lt;td&gt;å&lt;/td&gt;
383 &lt;td&gt;å&lt;/td&gt;
384 &lt;td&gt;&lt;/td&gt;
385 &lt;td&gt;å&lt;/td&gt;
386 &lt;td&gt;å&lt;/td&gt;
387 &lt;td&gt;å&lt;/td&gt;
388 &lt;td&gt;ć&lt;/td&gt;
389 &lt;/tr&gt;
390 &lt;/tbody&gt;
391 &lt;/table&gt;
392
393 &lt;p&gt;Denne problemstillingen er illustrert i tabell 3, der vi ser verdiene
394 tilegnet de norske symbolene i ISO-8859-1 i kolonne «1». I de øvrige
395 kolonnene ser vi hvilket symbol verdien får i de andre
396 ISO-8859-variantene. Tar vi utgangspunkt i tabell 3, kan vi se at
397 ordet lærlingspørsmål gjengitt med ISO-8859-2 (kolonne 2) blir
398 lćrlingspřrsmĺl, mens det blir lζrlingspψrsmεl med ISO- 8859-7
399 (kolonne 7). Med ISO-8859-2 blir «æ» til «ć», «ø» til «ř» og «å» til
400 «ĺ». I ISO-8859-7 blir «æ» til «ζ», «ø» til «ψ», mens «å» blir «ε».&lt;/p&gt;
401
402 &lt;p&gt;Det er egentlig ingen utfordring med dette så lenge du vet hvilket
403 tegnsett innholdet ditt er representert med, og det ikke har skjedd
404 omforminger som du ikke er klar over. Det er det siste som er
405 problematisk, spesielt de datasystemene som har vært i bruk de siste
406 20 årene, som ikke har noe innebygd funksjonalitet for å forvalte
407 tegnsettproblematikken. Et godt eksempel på dette er
408 Microsoft-tegnsettet Windows-1252, som ble forvekslet som 100 %
409 kompatibel med ISO-8859-1, men hadde byttet ut plassene fra 127 til
410 159. Historisk vil det finnes en del variasjon i hvilket tegnsett som
411 har vært i bruk, og hvor vellykket konvertering mellom tegnsett har
412 vært.&lt;/p&gt;
413
414 &lt;p id=&quot;tegnsett_access_unicode_som_løsning&quot;&gt;&lt;strong&gt;Unicode som løsning&lt;/strong&gt;&lt;/p&gt;
415
416 &lt;p&gt;Tegnsettforvirring ble etter hvert et irritasjonsmoment og
417 samvirkeproblem. Ofte fikk man en e-post der æøå var erstattet av rare
418 symboler fordi e-posten hadde vært innom et eller annet datasystem som
419 ikke brukte samme tegnsett.&lt;/p&gt;
420
421 &lt;p&gt;For å løse dette samvirkeproblemet for tegnsett ble det startet et
422 arbeid og en ny standard så dagens lys etter hvert. Denne standarden
423 fikk navnet Unicode (ISO/ IEC 10646) og skulle resultere i et tegnsett
424 som alle skulle være enige om. Unicode er et repertoar og en
425 representasjon, dvs. navngivning og tilordning av tallverdi til alle
426 symboler i bruk i verden i dag. Oppføringer i Unicode skrives gjerne
427 U+XXXX der XXXX er tallkoden i sekstentallssystemet som oppføringen
428 har i Unicode-katalogen. Her finner vi tegn brukt av både levende og
429 døde språk, konstruerte språk, tekniske symboler, morsomme tegninger
430 (såkalte emojier) og tegn ingen vet hva betyr eller skal brukes
431 til. Et morsomt eksempel er i nettartikkelen: U+237C ⍼ RIGHT ANGLE
432 WITH DOWNWARDS ZIGZAG ARROW, av Jonathan Chan.&lt;sup&gt;[&lt;a id=&quot;tegnsett_access_footnoteref_2&quot; href=&quot;#tegnsett_access_footnotedef_2&quot; title=&quot;View footnote.&quot;&gt;2&lt;/a&gt;]&lt;/sup&gt;&lt;/p&gt;
433
434 &lt;p&gt;Sammen med Unicode kom det tre måter å kode disse tallene på; UTF-8,
435 UTF-16 og UTF-32. Av datatekniske årsaker er UTF-8 mye brukt, spesielt
436 når det gjelder utveksling av tekst over Internett, mens UTF-16 er
437 brukt en del til tekstfiler lagret på Windows. En utfordring med
438 Unicode og UTF-variantene er at disse gir flere måter å kode samme
439 symbol på med en kombinasjonsmekanisme. Dette kan gi utfordringer ved
440 søk, hvis en skal søke etter et ord som har ett eller flere symboler
441 som kan skrives på ulikt vis, så er det ikke sikkert at søkesystemet
442 vil finne alle forekomster. For eksempel kan bokstaven U+00F8 «Latin
443 Small Letter O with Stroke» kodes som den tradisjonelle norske tegnet
444 ø, men også som o kombinert med skråstrek U+0338. Begge deler er
445 gyldig bruk av Unicode, selv om det er tradisjon for å foretrekke å
446 «normalisere» kombinasjoner som enkelttegn der det er mulig, nettopp
447 for å forenkle søk.&lt;/p&gt;
448
449 &lt;p id=&quot;tegnsett_access_bare_unicode_fremover&quot;&gt;&lt;strong&gt;Bare Unicode fremover&lt;/strong&gt;&lt;/p&gt;
450
451 &lt;p&gt;Forvaltningens bruk av tegnsett er regulert i Forskrift om
452 IT-standarder i offentlig forvaltning&lt;sup&gt;[&lt;a id=&quot;tegnsett_access_footnoteref_3&quot; href=&quot;#tegnsett_access_footnotedef_3&quot; title=&quot;View footnote.&quot;&gt;3&lt;/a&gt;]&lt;/sup&gt;. Her står det: «Ved all
453 utveksling av informasjon mellom forvaltningsorganer og fra
454 forvaltningsorgan til innbyggere og næringsliv skal tegnsettstandarden
455 ISO/IEC 10646 representert ved UTF8 benyttes.» Det er forskjellige
456 bruksområder til UTF-8, UTF-16 og UTF-32, men UTF-8 er kodingen vi
457 kjenner mest til. Det er flere grunner at UTF-8 «vant» konkurransen
458 til å bli den utvalgte. Den kanskje viktigste er at UTF-8 er fullt
459 samvirkende med ASCII-7, slik at den engelskspråklige delen av verden
460 kunne rulle ut UTF-8 uten å merke noe forskjell. En tekstfil med kun
461 ASCII-tekst vil være identisk på disken hvis den lagres som UTF-8 og
462 ASCII. UTF-16 og UTF-32 byr på noen optimaliseringer som gjør dem
463 relevant for spesifikke problemområder, men for det meste vil vi aldri
464 oppleve disse standardene på nært hold i hverdagen. Det er uansett kun
465 bruken av UTF-8 som er lovregulert i Norge.&lt;/p&gt;
466
467 &lt;p&gt;Det er ikke slik at hele verden bruker ISO/IEC 10646 og UTF-8. Kina
468 har egne standarder for tegnsett, mye brukt er GB 18030, som er
469 Unicode med en annen koding enn UTF-8, mens Taiwan og andre asiatiske
470 land gjerne bruker Big5 eller andre tegnsett.&lt;/p&gt;
471
472 &lt;p&gt;UTF-8 er dominerende i Norge, men det er tidsperioder der forskjellige
473 datasystemer utvekslet data i henhold til ISO-8859-1, ISO-8859-15,
474 Windows-1252, Codepage 865 og ISO-646-60 / Codepage 1016 mens
475 overgangen til UTF-8 pågikk. Det er ikke slik at et datasystem enkelt
476 kan tvinges til å bruke et tegnsett, da det er flere lag i et
477 datasystem som må settes opp til å bruke riktig tegnsett, og
478 tegnsettproblemet fort oppstår når det er et eller annet i
479 datasystemet som bruker feil tegnsett.&lt;/p&gt;
480
481 &lt;p&gt;Et klassisk eksempel på problemet er en utveksling av tekst mellom to
482 systemer der teksten i utgangspunktet er kodet i UTF-8, men går
483 gjennom noe som er ISO-8859-1 underveis. Dette kan vises med at ordet
484 «på» i et slik scenario ender opp som «pÃ¥». Det er mulig å spore
485 dette tilbake til verdiene symbolene er tilordnet i tegnsettene. «på»
486 blir til «pÃ¥» fordi «å» i UTF-8 er representert med U+C3AF, og dersom
487 vi ser på hva disse verdiene representerer, ser vi at
488 sekstentallssystemverdien C3 er 1100 0011 i totallssystemet og
489 symbolet med dette tallet i ISO-8859-1 er Ã.&lt;/p&gt;
490
491 &lt;p&gt;Vi ser det samme med sekstentallssystemverdien A5, som er 1010 0101 i
492 totallssystemet, og tilsvarende symbol i ISO-8859-1 er ¥. Slik
493 mojibake kan lett skje hvis «på» i utgangspunktet var representert med
494 UTF-8, men ble behandlet med et system som bruker ISO-8859-1. Det er
495 ingen automatikk i å fange opp slike ødeleggelser mens tekstlig
496 innhold utveksles mellom datasystemer.&lt;/p&gt;
497
498 &lt;p&gt;En utfordring for depotarkivene er at bruken av tegnsett ikke alltid
499 har vært regulert, og at det kan finnes flere dokumentasjonssamlinger
500 som er opprettet med varierende tegnsett før gjeldende forskrift
501 inntraff – uten at det er mulig å avlede fra filene hvilket tegnsett
502 som ble brukt. Et eksempel på dette er €-symbolet, som kom først etter
503 at ISO-8859-1 var tatt i bruk. Det kan bli en utfordring for et
504 depotarkiv, men så lenge det er kjent hvilket tegnsett var i bruk, så
505 bør det gå bra. Riksarkivarens
506 forskrift&lt;sup&gt;[&lt;a id=&quot;tegnsett_access_footnoteref_4&quot; href=&quot;#tegnsett_access_footnotedef_4&quot; title=&quot;View footnote.&quot;&gt;4&lt;/a&gt;]&lt;/sup&gt;
507 formaliserer dette ved å kreve følgende:&lt;/p&gt;
508
509 &lt;blockquote&gt;
510 &lt;p&gt;§ 5-11. Tegnsett i arkivuttrekk&lt;/p&gt;
511
512 &lt;ol&gt;
513 &lt;li&gt;Arkivuttrekk og medfølgende struktur- og innholdsbeskrivelser skal
514 overføres som ren tekst i ukryptert form, og benytte godkjent
515 tegnsett.&lt;/li&gt;
516
517 &lt;li&gt;Godkjente tegnsett er:
518 &lt;ol&gt;
519 &lt;li&gt;Unicode UTF-8&lt;br&gt;
520 (ISO/IEC 10646-1:2000 Annex D)&lt;/li&gt;
521 &lt;li&gt;ISO 8859-1:1998, Latin 1&lt;/li&gt;
522 &lt;li&gt;ISO 8859-4:1998, Latin 4 for samiske tegn.&lt;/li&gt;
523 &lt;/ol&gt;&lt;/li&gt;
524
525 &lt;li&gt;Andre tegnsett aksepteres bare etter avtale med Arkivverket.&lt;/li&gt;
526 &lt;/ol&gt;
527 &lt;/blockquote&gt;
528
529 &lt;p id=&quot;tegnsett_access_ditt_ansvar&quot;&gt;&lt;strong&gt;Ditt ansvar&lt;/strong&gt;&lt;/p&gt;
530
531 &lt;p&gt;På mange måter burde ikke tegnsett være et problem i 2023, men sånn er
532 det nok ikke. Land som har oppgradert til UTF-8 som primærtegnsett for
533 utveksling av tekstlig innhold, begrenser problematikken betraktelig,
534 men globalt sett så er tegnsettutfordringen ikke løst fordi ikke alle
535 er enige om å bruke samme tegnsett. Det kan være geopolitiske eller
536 kulturelle hensyn som ligger til grunn for dette.&lt;/p&gt;
537
538 &lt;p&gt;Det er uansett verdt å merke at selv om bruken av UTF-8 skulle bli
539 100% utbredt, så er det et historisk perspektiv (ASCII-7,
540 ISO-8859-variantene, UTF-8) her som gjør tegnsett til et problemområde
541 arkivarene må forstå og håndtere. Som danningsarkivar har du et
542 ansvar for å vite hvilket tegnsett systemene og databasene dere
543 forvalter, er i samsvar med. Det er noe IT-avdelingen din eller
544 programvareleverandørene enkelt skal kunne svare på, og svaret skal
545 være UTF-8 for alle nye systemer.&lt;/p&gt;
546
547 &lt;hr&gt;
548
549 &lt;p id=&quot;tegnsett_access_footnotedef_1&quot;&gt;&lt;a href=&quot;#tegnsett_access_footnoteref_1&quot;&gt;1&lt;/a&gt;. Tegnsettkilde &lt;a href=&quot;https://en.wikipedia.org/wiki/ISO/IEC_8859&quot;&gt;https://en.wikipedia.org/wiki/ISO/IEC_8859&lt;/a&gt;&lt;/p&gt;
550
551 &lt;p id=&quot;tegnsett_access_footnotedef_2&quot;&gt;&lt;a href=&quot;#tegnsett_access_footnoteref_2&quot;&gt;2&lt;/a&gt;. &lt;a href=&quot;https://ionathan.ch/2022/04/09/angzarr.html&quot;&gt;https://ionathan.ch/2022/04/09/angzarr.html&lt;/a&gt;&lt;/p&gt;
552
553 &lt;p id=&quot;tegnsett_access_footnotedef_3&quot;&gt;&lt;a href=&quot;#tegnsett_access_footnoteref_3&quot;&gt;3&lt;/a&gt;. &lt;a href=&quot;https://lovdata.no/dokument/SF/forskrift/2013-04-05-959/%C2%A78#%C2%A78&quot;&gt;https://lovdata.no/dokument/SF/forskrift/2013-04-05-959/%C2%A78#%C2%A78&lt;/a&gt;&lt;/p&gt;
554
555 &lt;p id=&quot;tegnsett_access_footnotedef_4&quot;&gt;&lt;a href=&quot;#tegnsett_access_footnoteref_4&quot;&gt;4&lt;/a&gt;. &lt;a href=&quot;https://lovdata.no/forskrift/2017-12-19-22865-11&quot;&gt;https://lovdata.no/forskrift/2017-12-19-22865-11&lt;/a&gt;&lt;/p&gt;
556
557 &lt;/blockquote&gt;
558
559 &lt;p&gt;For øvrig burde varsleren Edward Snowden få politisk asyl i Norge.&lt;/p&gt;
560
561 &lt;p&gt;Som vanlig, hvis du bruker Bitcoin og ønsker å vise din støtte til
562 det jeg driver med, setter jeg pris på om du sender Bitcoin-donasjoner
563 til min adresse
564 &lt;b&gt;&lt;a href=&quot;bitcoin:15oWEoG9dUPovwmUL9KWAnYRtNJEkP1u1b&quot;&gt;15oWEoG9dUPovwmUL9KWAnYRtNJEkP1u1b&lt;/a&gt;&lt;/b&gt;. Merk,
565 betaling med bitcoin er ikke anonymt. :)&lt;/p&gt;
566 </description>
567 </item>
568
569 <item>
570 <title>New and improved sqlcipher in Debian for accessing Signal database</title>
571 <link>https://people.skolelinux.org/pere/blog/New_and_improved_sqlcipher_in_Debian_for_accessing_Signal_database.html</link>
572 <guid isPermaLink="true">https://people.skolelinux.org/pere/blog/New_and_improved_sqlcipher_in_Debian_for_accessing_Signal_database.html</guid>
573 <pubDate>Sun, 12 Nov 2023 12:00:00 +0100</pubDate>
574 <description>&lt;p&gt;For a while now I wanted to have direct access to the
575 &lt;a href=&quot;https://signal.org/&quot;&gt;Signal&lt;/a&gt; database of messages and
576 channels of my Desktop edition of Signal. I prefer the enforced end
577 to end encryption of Signal these days for my communication with
578 friends and family, to increase the level of safety and privacy as
579 well as raising the cost of the mass surveillance government and
580 non-government entities practice these days. In August I came across
581 a nice
582 &lt;a href=&quot;https://www.yoranbrondsema.com/post/the-guide-to-extracting-statistics-from-your-signal-conversations/&quot;&gt;recipe
583 on how to use sqlcipher to extract statistics from the Signal
584 database&lt;/a&gt; explaining how to do this. Unfortunately this did not
585 work with the version of sqlcipher in Debian. The
586 &lt;a href=&quot;http://tracker.debian.org/sqlcipher/&quot;&gt;sqlcipher&lt;/a&gt;
587 package is a &quot;fork&quot; of the sqlite package with added support for
588 encrypted databases. Sadly the current Debian maintainer
589 &lt;a href=&quot;https://bugs.debian.org/961598&quot;&gt;announced more than three
590 years ago that he did not have time to maintain sqlcipher&lt;/a&gt;, so it
591 seemed unlikely to be upgraded by the maintainer. I was reluctant to
592 take on the job myself, as I have very limited experience maintaining
593 shared libraries in Debian. After waiting and hoping for a few
594 months, I gave up the last week, and set out to update the package. In
595 the process I orphaned it to make it more obvious for the next person
596 looking at it that the package need proper maintenance.&lt;/p&gt;
597
598 &lt;p&gt;The version in Debian was around five years old, and quite a lot of
599 changes had taken place upstream into the Debian maintenance git
600 repository. After spending a few days importing the new upstream
601 versions, realising that upstream did not care much for SONAME
602 versioning as I saw library symbols being both added and removed with
603 minor version number changes to the project, I concluded that I had to
604 do a SONAME bump of the library package to avoid surprising the
605 reverse dependencies. I even added a simple
606 autopkgtest script to ensure the package work as intended. Dug deep
607 into the hole of learning shared library maintenance, I set out a few
608 days ago to upload the new version to Debian experimental to see what
609 the quality assurance framework in Debian had to say about the result.
610 The feedback told me the pacakge was not too shabby, and yesterday I
611 uploaded the latest version to Debian unstable. It should enter
612 testing today or tomorrow, perhaps delayed by
613 &lt;a href=&quot;https://bugs.debian.org/1055812&quot;&gt;a small library
614 transition&lt;/a&gt;.&lt;/p&gt;
615
616 &lt;p&gt;Armed with a new version of sqlcipher, I can now have a look at the
617 SQL database in ~/.config/Signal/sql/db.sqlite. First, one need to
618 fetch the encryption key from the Signal configuration using this
619 simple JSON extraction command:&lt;/p&gt;
620
621 &lt;pre&gt;/usr/bin/jq -r &#39;.&quot;key&quot;&#39; ~/.config/Signal/config.json&lt;/pre&gt;
622
623 &lt;p&gt;Assuming the result from that command is &#39;secretkey&#39;, which is a
624 hexadecimal number representing the key used to encrypt the database.
625 Next, one can now connect to the database and inject the encryption
626 key for access via SQL to fetch information from the database. Here
627 is an example dumping the database structure:&lt;/p&gt;
628
629 &lt;pre&gt;
630 % sqlcipher ~/.config/Signal/sql/db.sqlite
631 sqlite&gt; PRAGMA key = &quot;x&#39;secretkey&#39;&quot;;
632 sqlite&gt; .schema
633 CREATE TABLE sqlite_stat1(tbl,idx,stat);
634 CREATE TABLE conversations(
635 id STRING PRIMARY KEY ASC,
636 json TEXT,
637
638 active_at INTEGER,
639 type STRING,
640 members TEXT,
641 name TEXT,
642 profileName TEXT
643 , profileFamilyName TEXT, profileFullName TEXT, e164 TEXT, serviceId TEXT, groupId TEXT, profileLastFetchedAt INTEGER);
644 CREATE TABLE identityKeys(
645 id STRING PRIMARY KEY ASC,
646 json TEXT
647 );
648 CREATE TABLE items(
649 id STRING PRIMARY KEY ASC,
650 json TEXT
651 );
652 CREATE TABLE sessions(
653 id TEXT PRIMARY KEY,
654 conversationId TEXT,
655 json TEXT
656 , ourServiceId STRING, serviceId STRING);
657 CREATE TABLE attachment_downloads(
658 id STRING primary key,
659 timestamp INTEGER,
660 pending INTEGER,
661 json TEXT
662 );
663 CREATE TABLE sticker_packs(
664 id TEXT PRIMARY KEY,
665 key TEXT NOT NULL,
666
667 author STRING,
668 coverStickerId INTEGER,
669 createdAt INTEGER,
670 downloadAttempts INTEGER,
671 installedAt INTEGER,
672 lastUsed INTEGER,
673 status STRING,
674 stickerCount INTEGER,
675 title STRING
676 , attemptedStatus STRING, position INTEGER DEFAULT 0 NOT NULL, storageID STRING, storageVersion INTEGER, storageUnknownFields BLOB, storageNeedsSync
677 INTEGER DEFAULT 0 NOT NULL);
678 CREATE TABLE stickers(
679 id INTEGER NOT NULL,
680 packId TEXT NOT NULL,
681
682 emoji STRING,
683 height INTEGER,
684 isCoverOnly INTEGER,
685 lastUsed INTEGER,
686 path STRING,
687 width INTEGER,
688
689 PRIMARY KEY (id, packId),
690 CONSTRAINT stickers_fk
691 FOREIGN KEY (packId)
692 REFERENCES sticker_packs(id)
693 ON DELETE CASCADE
694 );
695 CREATE TABLE sticker_references(
696 messageId STRING,
697 packId TEXT,
698 CONSTRAINT sticker_references_fk
699 FOREIGN KEY(packId)
700 REFERENCES sticker_packs(id)
701 ON DELETE CASCADE
702 );
703 CREATE TABLE emojis(
704 shortName TEXT PRIMARY KEY,
705 lastUsage INTEGER
706 );
707 CREATE TABLE messages(
708 rowid INTEGER PRIMARY KEY ASC,
709 id STRING UNIQUE,
710 json TEXT,
711 readStatus INTEGER,
712 expires_at INTEGER,
713 sent_at INTEGER,
714 schemaVersion INTEGER,
715 conversationId STRING,
716 received_at INTEGER,
717 source STRING,
718 hasAttachments INTEGER,
719 hasFileAttachments INTEGER,
720 hasVisualMediaAttachments INTEGER,
721 expireTimer INTEGER,
722 expirationStartTimestamp INTEGER,
723 type STRING,
724 body TEXT,
725 messageTimer INTEGER,
726 messageTimerStart INTEGER,
727 messageTimerExpiresAt INTEGER,
728 isErased INTEGER,
729 isViewOnce INTEGER,
730 sourceServiceId TEXT, serverGuid STRING NULL, sourceDevice INTEGER, storyId STRING, isStory INTEGER
731 GENERATED ALWAYS AS (type IS &#39;story&#39;), isChangeCreatedByUs INTEGER NOT NULL DEFAULT 0, isTimerChangeFromSync INTEGER
732 GENERATED ALWAYS AS (
733 json_extract(json, &#39;$.expirationTimerUpdate.fromSync&#39;) IS 1
734 ), seenStatus NUMBER default 0, storyDistributionListId STRING, expiresAt INT
735 GENERATED ALWAYS
736 AS (ifnull(
737 expirationStartTimestamp + (expireTimer * 1000),
738 9007199254740991
739 )), shouldAffectActivity INTEGER
740 GENERATED ALWAYS AS (
741 type IS NULL
742 OR
743 type NOT IN (
744 &#39;change-number-notification&#39;,
745 &#39;contact-removed-notification&#39;,
746 &#39;conversation-merge&#39;,
747 &#39;group-v1-migration&#39;,
748 &#39;keychange&#39;,
749 &#39;message-history-unsynced&#39;,
750 &#39;profile-change&#39;,
751 &#39;story&#39;,
752 &#39;universal-timer-notification&#39;,
753 &#39;verified-change&#39;
754 )
755 ), shouldAffectPreview INTEGER
756 GENERATED ALWAYS AS (
757 type IS NULL
758 OR
759 type NOT IN (
760 &#39;change-number-notification&#39;,
761 &#39;contact-removed-notification&#39;,
762 &#39;conversation-merge&#39;,
763 &#39;group-v1-migration&#39;,
764 &#39;keychange&#39;,
765 &#39;message-history-unsynced&#39;,
766 &#39;profile-change&#39;,
767 &#39;story&#39;,
768 &#39;universal-timer-notification&#39;,
769 &#39;verified-change&#39;
770 )
771 ), isUserInitiatedMessage INTEGER
772 GENERATED ALWAYS AS (
773 type IS NULL
774 OR
775 type NOT IN (
776 &#39;change-number-notification&#39;,
777 &#39;contact-removed-notification&#39;,
778 &#39;conversation-merge&#39;,
779 &#39;group-v1-migration&#39;,
780 &#39;group-v2-change&#39;,
781 &#39;keychange&#39;,
782 &#39;message-history-unsynced&#39;,
783 &#39;profile-change&#39;,
784 &#39;story&#39;,
785 &#39;universal-timer-notification&#39;,
786 &#39;verified-change&#39;
787 )
788 ), mentionsMe INTEGER NOT NULL DEFAULT 0, isGroupLeaveEvent INTEGER
789 GENERATED ALWAYS AS (
790 type IS &#39;group-v2-change&#39; AND
791 json_array_length(json_extract(json, &#39;$.groupV2Change.details&#39;)) IS 1 AND
792 json_extract(json, &#39;$.groupV2Change.details[0].type&#39;) IS &#39;member-remove&#39; AND
793 json_extract(json, &#39;$.groupV2Change.from&#39;) IS NOT NULL AND
794 json_extract(json, &#39;$.groupV2Change.from&#39;) IS json_extract(json, &#39;$.groupV2Change.details[0].aci&#39;)
795 ), isGroupLeaveEventFromOther INTEGER
796 GENERATED ALWAYS AS (
797 isGroupLeaveEvent IS 1
798 AND
799 isChangeCreatedByUs IS 0
800 ), callId TEXT
801 GENERATED ALWAYS AS (
802 json_extract(json, &#39;$.callId&#39;)
803 ));
804 CREATE TABLE sqlite_stat4(tbl,idx,neq,nlt,ndlt,sample);
805 CREATE TABLE jobs(
806 id TEXT PRIMARY KEY,
807 queueType TEXT STRING NOT NULL,
808 timestamp INTEGER NOT NULL,
809 data STRING TEXT
810 );
811 CREATE TABLE reactions(
812 conversationId STRING,
813 emoji STRING,
814 fromId STRING,
815 messageReceivedAt INTEGER,
816 targetAuthorAci STRING,
817 targetTimestamp INTEGER,
818 unread INTEGER
819 , messageId STRING);
820 CREATE TABLE senderKeys(
821 id TEXT PRIMARY KEY NOT NULL,
822 senderId TEXT NOT NULL,
823 distributionId TEXT NOT NULL,
824 data BLOB NOT NULL,
825 lastUpdatedDate NUMBER NOT NULL
826 );
827 CREATE TABLE unprocessed(
828 id STRING PRIMARY KEY ASC,
829 timestamp INTEGER,
830 version INTEGER,
831 attempts INTEGER,
832 envelope TEXT,
833 decrypted TEXT,
834 source TEXT,
835 serverTimestamp INTEGER,
836 sourceServiceId STRING
837 , serverGuid STRING NULL, sourceDevice INTEGER, receivedAtCounter INTEGER, urgent INTEGER, story INTEGER);
838 CREATE TABLE sendLogPayloads(
839 id INTEGER PRIMARY KEY ASC,
840
841 timestamp INTEGER NOT NULL,
842 contentHint INTEGER NOT NULL,
843 proto BLOB NOT NULL
844 , urgent INTEGER, hasPniSignatureMessage INTEGER DEFAULT 0 NOT NULL);
845 CREATE TABLE sendLogRecipients(
846 payloadId INTEGER NOT NULL,
847
848 recipientServiceId STRING NOT NULL,
849 deviceId INTEGER NOT NULL,
850
851 PRIMARY KEY (payloadId, recipientServiceId, deviceId),
852
853 CONSTRAINT sendLogRecipientsForeignKey
854 FOREIGN KEY (payloadId)
855 REFERENCES sendLogPayloads(id)
856 ON DELETE CASCADE
857 );
858 CREATE TABLE sendLogMessageIds(
859 payloadId INTEGER NOT NULL,
860
861 messageId STRING NOT NULL,
862
863 PRIMARY KEY (payloadId, messageId),
864
865 CONSTRAINT sendLogMessageIdsForeignKey
866 FOREIGN KEY (payloadId)
867 REFERENCES sendLogPayloads(id)
868 ON DELETE CASCADE
869 );
870 CREATE TABLE preKeys(
871 id STRING PRIMARY KEY ASC,
872 json TEXT
873 , ourServiceId NUMBER
874 GENERATED ALWAYS AS (json_extract(json, &#39;$.ourServiceId&#39;)));
875 CREATE TABLE signedPreKeys(
876 id STRING PRIMARY KEY ASC,
877 json TEXT
878 , ourServiceId NUMBER
879 GENERATED ALWAYS AS (json_extract(json, &#39;$.ourServiceId&#39;)));
880 CREATE TABLE badges(
881 id TEXT PRIMARY KEY,
882 category TEXT NOT NULL,
883 name TEXT NOT NULL,
884 descriptionTemplate TEXT NOT NULL
885 );
886 CREATE TABLE badgeImageFiles(
887 badgeId TEXT REFERENCES badges(id)
888 ON DELETE CASCADE
889 ON UPDATE CASCADE,
890 &#39;order&#39; INTEGER NOT NULL,
891 url TEXT NOT NULL,
892 localPath TEXT,
893 theme TEXT NOT NULL
894 );
895 CREATE TABLE storyReads (
896 authorId STRING NOT NULL,
897 conversationId STRING NOT NULL,
898 storyId STRING NOT NULL,
899 storyReadDate NUMBER NOT NULL,
900
901 PRIMARY KEY (authorId, storyId)
902 );
903 CREATE TABLE storyDistributions(
904 id STRING PRIMARY KEY NOT NULL,
905 name TEXT,
906
907 senderKeyInfoJson STRING
908 , deletedAtTimestamp INTEGER, allowsReplies INTEGER, isBlockList INTEGER, storageID STRING, storageVersion INTEGER, storageUnknownFields BLOB, storageNeedsSync INTEGER);
909 CREATE TABLE storyDistributionMembers(
910 listId STRING NOT NULL REFERENCES storyDistributions(id)
911 ON DELETE CASCADE
912 ON UPDATE CASCADE,
913 serviceId STRING NOT NULL,
914
915 PRIMARY KEY (listId, serviceId)
916 );
917 CREATE TABLE uninstalled_sticker_packs (
918 id STRING NOT NULL PRIMARY KEY,
919 uninstalledAt NUMBER NOT NULL,
920 storageID STRING,
921 storageVersion NUMBER,
922 storageUnknownFields BLOB,
923 storageNeedsSync INTEGER NOT NULL
924 );
925 CREATE TABLE groupCallRingCancellations(
926 ringId INTEGER PRIMARY KEY,
927 createdAt INTEGER NOT NULL
928 );
929 CREATE TABLE IF NOT EXISTS &#39;messages_fts_data&#39;(id INTEGER PRIMARY KEY, block BLOB);
930 CREATE TABLE IF NOT EXISTS &#39;messages_fts_idx&#39;(segid, term, pgno, PRIMARY KEY(segid, term)) WITHOUT ROWID;
931 CREATE TABLE IF NOT EXISTS &#39;messages_fts_content&#39;(id INTEGER PRIMARY KEY, c0);
932 CREATE TABLE IF NOT EXISTS &#39;messages_fts_docsize&#39;(id INTEGER PRIMARY KEY, sz BLOB);
933 CREATE TABLE IF NOT EXISTS &#39;messages_fts_config&#39;(k PRIMARY KEY, v) WITHOUT ROWID;
934 CREATE TABLE edited_messages(
935 messageId STRING REFERENCES messages(id)
936 ON DELETE CASCADE,
937 sentAt INTEGER,
938 readStatus INTEGER
939 , conversationId STRING);
940 CREATE TABLE mentions (
941 messageId REFERENCES messages(id) ON DELETE CASCADE,
942 mentionAci STRING,
943 start INTEGER,
944 length INTEGER
945 );
946 CREATE TABLE kyberPreKeys(
947 id STRING PRIMARY KEY NOT NULL,
948 json TEXT NOT NULL, ourServiceId NUMBER
949 GENERATED ALWAYS AS (json_extract(json, &#39;$.ourServiceId&#39;)));
950 CREATE TABLE callsHistory (
951 callId TEXT PRIMARY KEY,
952 peerId TEXT NOT NULL, -- conversation id (legacy) | uuid | groupId | roomId
953 ringerId TEXT DEFAULT NULL, -- ringer uuid
954 mode TEXT NOT NULL, -- enum &quot;Direct&quot; | &quot;Group&quot;
955 type TEXT NOT NULL, -- enum &quot;Audio&quot; | &quot;Video&quot; | &quot;Group&quot;
956 direction TEXT NOT NULL, -- enum &quot;Incoming&quot; | &quot;Outgoing
957 -- Direct: enum &quot;Pending&quot; | &quot;Missed&quot; | &quot;Accepted&quot; | &quot;Deleted&quot;
958 -- Group: enum &quot;GenericGroupCall&quot; | &quot;OutgoingRing&quot; | &quot;Ringing&quot; | &quot;Joined&quot; | &quot;Missed&quot; | &quot;Declined&quot; | &quot;Accepted&quot; | &quot;Deleted&quot;
959 status TEXT NOT NULL,
960 timestamp INTEGER NOT NULL,
961 UNIQUE (callId, peerId) ON CONFLICT FAIL
962 );
963 [ dropped all indexes to save space in this blog post ]
964 CREATE TRIGGER messages_on_view_once_update AFTER UPDATE ON messages
965 WHEN
966 new.body IS NOT NULL AND new.isViewOnce = 1
967 BEGIN
968 DELETE FROM messages_fts WHERE rowid = old.rowid;
969 END;
970 CREATE TRIGGER messages_on_insert AFTER INSERT ON messages
971 WHEN new.isViewOnce IS NOT 1 AND new.storyId IS NULL
972 BEGIN
973 INSERT INTO messages_fts
974 (rowid, body)
975 VALUES
976 (new.rowid, new.body);
977 END;
978 CREATE TRIGGER messages_on_delete AFTER DELETE ON messages BEGIN
979 DELETE FROM messages_fts WHERE rowid = old.rowid;
980 DELETE FROM sendLogPayloads WHERE id IN (
981 SELECT payloadId FROM sendLogMessageIds
982 WHERE messageId = old.id
983 );
984 DELETE FROM reactions WHERE rowid IN (
985 SELECT rowid FROM reactions
986 WHERE messageId = old.id
987 );
988 DELETE FROM storyReads WHERE storyId = old.storyId;
989 END;
990 CREATE VIRTUAL TABLE messages_fts USING fts5(
991 body,
992 tokenize = &#39;signal_tokenizer&#39;
993 );
994 CREATE TRIGGER messages_on_update AFTER UPDATE ON messages
995 WHEN
996 (new.body IS NULL OR old.body IS NOT new.body) AND
997 new.isViewOnce IS NOT 1 AND new.storyId IS NULL
998 BEGIN
999 DELETE FROM messages_fts WHERE rowid = old.rowid;
1000 INSERT INTO messages_fts
1001 (rowid, body)
1002 VALUES
1003 (new.rowid, new.body);
1004 END;
1005 CREATE TRIGGER messages_on_insert_insert_mentions AFTER INSERT ON messages
1006 BEGIN
1007 INSERT INTO mentions (messageId, mentionAci, start, length)
1008
1009 SELECT messages.id, bodyRanges.value -&gt;&gt; &#39;mentionAci&#39; as mentionAci,
1010 bodyRanges.value -&gt;&gt; &#39;start&#39; as start,
1011 bodyRanges.value -&gt;&gt; &#39;length&#39; as length
1012 FROM messages, json_each(messages.json -&gt;&gt; &#39;bodyRanges&#39;) as bodyRanges
1013 WHERE bodyRanges.value -&gt;&gt; &#39;mentionAci&#39; IS NOT NULL
1014
1015 AND messages.id = new.id;
1016 END;
1017 CREATE TRIGGER messages_on_update_update_mentions AFTER UPDATE ON messages
1018 BEGIN
1019 DELETE FROM mentions WHERE messageId = new.id;
1020 INSERT INTO mentions (messageId, mentionAci, start, length)
1021
1022 SELECT messages.id, bodyRanges.value -&gt;&gt; &#39;mentionAci&#39; as mentionAci,
1023 bodyRanges.value -&gt;&gt; &#39;start&#39; as start,
1024 bodyRanges.value -&gt;&gt; &#39;length&#39; as length
1025 FROM messages, json_each(messages.json -&gt;&gt; &#39;bodyRanges&#39;) as bodyRanges
1026 WHERE bodyRanges.value -&gt;&gt; &#39;mentionAci&#39; IS NOT NULL
1027
1028 AND messages.id = new.id;
1029 END;
1030 sqlite&gt;
1031 &lt;/pre&gt;
1032
1033 &lt;p&gt;Finally I have the tool needed to inspect and process Signal
1034 messages that I need, without using the vendor provided client. Now
1035 on to transforming it to a more useful format.&lt;/p&gt;
1036
1037 &lt;p&gt;As usual, if you use Bitcoin and want to show your support of my
1038 activities, please send Bitcoin donations to my address
1039 &lt;b&gt;&lt;a href=&quot;bitcoin:15oWEoG9dUPovwmUL9KWAnYRtNJEkP1u1b&quot;&gt;15oWEoG9dUPovwmUL9KWAnYRtNJEkP1u1b&lt;/a&gt;&lt;/b&gt;.&lt;/p&gt;
1040 </description>
1041 </item>
1042
1043 <item>
1044 <title>New chrpath release 0.17</title>
1045 <link>https://people.skolelinux.org/pere/blog/New_chrpath_release_0_17.html</link>
1046 <guid isPermaLink="true">https://people.skolelinux.org/pere/blog/New_chrpath_release_0_17.html</guid>
1047 <pubDate>Fri, 10 Nov 2023 07:30:00 +0100</pubDate>
1048 <description>&lt;p&gt;The chrpath package provide a simple command line tool to remove or
1049 modify the rpath or runpath of compiled ELF program. It is almost 10
1050 years since I updated the code base, but I stumbled over the tool
1051 today, and decided it was time to move the code base from Subversion
1052 to git and find a new home for it, as the previous one (Debian Alioth)
1053 has been shut down. I decided to go with
1054 &lt;a href=&quot;https://codeberg.org/&quot;&gt;Codeberg&lt;/a&gt; this time, as it is my git
1055 service of choice these days, did a quick and dirty migration to git
1056 and updated the code with a few patches I found in the Debian bug
1057 tracker. These are the release notes:&lt;/p&gt;
1058
1059 &lt;p&gt;New in 0.17 released 2023-11-10:&lt;/p&gt;
1060
1061 &lt;ul&gt;
1062 &lt;li&gt;Moved project to Codeberg, as Alioth is shut down.&lt;/li&gt;
1063 &lt;li&gt;Add Solaris support (use &amp;lt;sys/byteorder.h&gt; instead of &amp;lt;byteswap.h&gt;).
1064 Patch from Rainer Orth.&lt;/li&gt;
1065 &lt;li&gt;Added missing newline from printf() line. Patch from Frank Dana.&lt;/li&gt;
1066 &lt;li&gt;Corrected handling of multiple ELF sections. Patch from Frank Dana.&lt;/li&gt;
1067 &lt;li&gt;Updated build rules for .deb. Partly based on patch from djcj.&lt;/li&gt;
1068 &lt;/ul&gt;
1069
1070 &lt;p&gt;The latest edition is tagged and available from
1071 &lt;a href=&quot;https://codeberg.org/pere/chrpath&quot;&gt;https://codeberg.org/pere/chrpath&lt;/a&gt;.
1072
1073 &lt;p&gt;As usual, if you use Bitcoin and want to show your support of my
1074 activities, please send Bitcoin donations to my address
1075 &lt;b&gt;&lt;a href=&quot;bitcoin:15oWEoG9dUPovwmUL9KWAnYRtNJEkP1u1b&quot;&gt;15oWEoG9dUPovwmUL9KWAnYRtNJEkP1u1b&lt;/a&gt;&lt;/b&gt;.&lt;/p&gt;
1076 </description>
1077 </item>
1078
1079 <item>
1080 <title>Test framework for DocBook processors / formatters</title>
1081 <link>https://people.skolelinux.org/pere/blog/Test_framework_for_DocBook_processors___formatters.html</link>
1082 <guid isPermaLink="true">https://people.skolelinux.org/pere/blog/Test_framework_for_DocBook_processors___formatters.html</guid>
1083 <pubDate>Sun, 5 Nov 2023 13:00:00 +0100</pubDate>
1084 <description>&lt;p&gt;All the books I have published so far has been using
1085 &lt;a href=&quot;https://docbook.org/&quot;&gt;DocBook&lt;/a&gt; somewhere in the process.
1086 For the first book, the source format was DocBook, while for every
1087 later book it was an intermediate format used as the stepping stone to
1088 be able to present the same manuscript in several formats, on paper,
1089 as ebook in ePub format, as a HTML page and as a PDF file either for
1090 paper production or for Internet consumption. This is made possible
1091 with a wide variety of free software tools with DocBook support in
1092 Debian. The source format of later books have been docx via rst,
1093 Markdown, Filemaker and Asciidoc, and for all of these I was able to
1094 generate a suitable DocBook file for further processing using
1095 &lt;a href=&quot;https://tracker.debian.org/pkg/pandoc&quot;&gt;pandoc&lt;/a&gt;,
1096 &lt;a href=&quot;https://tracker.debian.org/pkg/asciidoc&quot;&gt;a2x&lt;/a&gt; and
1097 &lt;a href=&quot;https://tracker.debian.org/pkg/asciidoctor&quot;&gt;asciidoctor&lt;/a&gt;,
1098 as well as rendering using
1099 &lt;a href=&quot;https://tracker.debian.org/pkg/xmlto&quot;&gt;xmlto&lt;/a&gt;,
1100 &lt;a href=&quot;https://tracker.debian.org/pkg/dbtoepub&quot;&gt;dbtoepub&lt;/a&gt;,
1101 &lt;a href=&quot;https://tracker.debian.org/pkg/dblatex&quot;&gt;dblatex&lt;/a&gt;,
1102 &lt;a href=&quot;https://tracker.debian.org/pkg/docbook-xsl&quot;&gt;docbook-xsl&lt;/a&gt; and
1103 &lt;a href=&quot;https://tracker.debian.org/pkg/fop&quot;&gt;fop&lt;/a&gt;.&lt;/p&gt;
1104
1105 &lt;p&gt;Most of the &lt;a href=&quot;http://www.hungry.com/~pere/publisher/&quot;&gt;books I
1106 have published&lt;/a&gt; are translated books, with English as the source
1107 language. The use of
1108 &lt;a href=&quot;https://tracker.debian.org/pkg/po4a&quot;&gt;po4a&lt;/a&gt; to
1109 handle translations using the gettext PO format has been a blessing,
1110 but publishing translated books had triggered the need to ensure the
1111 DocBook tools handle relevant languages correctly. For every new
1112 language I have published, I had to submit patches dblatex, dbtoepub
1113 and docbook-xsl fixing incorrect language and country specific issues
1114 in the framework themselves. Typically this has been missing keywords
1115 like &#39;figure&#39; or sort ordering of index entries. After a while it
1116 became tiresome to only discover issues like this by accident, and I
1117 decided to write a DocBook &quot;test framework&quot; exercising various
1118 features of DocBook and allowing me to see all features exercised for
1119 a given language. It consist of a set of DocBook files, a version 4
1120 book, a version 5 book, a v4 book set, a v4 selection of problematic
1121 tables, one v4 testing sidefloat and finally one v4 testing a book of
1122 articles. The DocBook files are accompanied with a set of build rules
1123 for building PDF using dblatex and docbook-xsl/fop, HTML using xmlto
1124 or docbook-xsl and epub using dbtoepub. The result is a set of files
1125 visualizing footnotes, indexes, table of content list, figures,
1126 formulas and other DocBook features, allowing for a quick review on
1127 the completeness of the given locale settings. To build with a
1128 different language setting, all one need to do is edit the lang= value
1129 in the .xml file to pick a different ISO 639 code value and run
1130 &#39;make&#39;.&lt;/p&gt;
1131
1132 &lt;p&gt;The &lt;a href=&quot;https://codeberg.org/pere/docbook-example/&quot;&gt;test framework
1133 source code&lt;/a&gt; is available from Codeberg, and a generated set of
1134 presentations of the various examples is available as Codeberg static
1135 web pages at
1136 &lt;a href=&quot;https://pere.codeberg.page/docbook-example/&quot;&gt;https://pere.codeberg.page/docbook-example/&lt;/a&gt;.
1137 Using this test framework I have been able to discover and report
1138 several bugs and missing features in various tools, and got a lot of
1139 them fixed. For example I got Northern Sami keywords added to both
1140 docbook-xsl and dblatex, fixed several typos in Norwegian bokmål and
1141 Norwegian Nynorsk, support for non-ascii title IDs added to pandoc,
1142 Norwegian index sorting support fixed in xindy and initial Norwegian
1143 Bokmål support added to dblatex. Some issues still remains, though.
1144 Default index sorting rules are still broken in several tools, so the
1145 Norwegian letters æ, ø and å are more often than not sorted properly
1146 in the book index.&lt;/p&gt;
1147
1148 &lt;p&gt;The test framework recently received some more polish, as part of
1149 publishing my latest book. This book contained a lot of fairly
1150 complex tables, which exposed bugs in some of the tools. This made me
1151 add a new test file with various tables, as well as spend some time to
1152 brush up the build rules. My goal is for the test framework to
1153 exercise all DocBook features to make it easier to see which features
1154 work with different processors, and hopefully get them all to support
1155 the full set of DocBook features. Feel free to send patches to extend
1156 the test set, and test it with your favorite DocBook processor.
1157 Please visit these two URLs to learn more:&lt;/p&gt;
1158
1159 &lt;ul&gt;
1160 &lt;li&gt;&lt;a href=&quot;https://codeberg.org/pere/docbook-example/&quot;&gt;https://codeberg.org/pere/docbook-example/&lt;/a&gt;&lt;/li&gt;
1161 &lt;li&gt;&lt;a href=&quot;https://pere.codeberg.page/docbook-example/&quot;&gt;https://pere.codeberg.page/docbook-example/&lt;/a&gt;&lt;/li&gt;
1162 &lt;/ul&gt;
1163
1164 &lt;p&gt;If you want to learn more on Docbook and translations, I recommend
1165 having a look at the &lt;a href=&quot;https://docbook.org/&quot;&gt;the DocBook
1166 web site&lt;/a&gt;,
1167 &lt;a href=&quot;https://doccookbook.sourceforge.net/html/en/&quot;&gt;the DoCookBook
1168 site&lt;a/&gt; and my earlier blog post on
1169 &lt;a href=&quot;https://people.skolelinux.org/pere/blog/From_English_wiki_to_translated_PDF_and_epub_via_Docbook.html&quot;&gt;how
1170 the Skolelinux project process and translate documentation&lt;/a&gt;, a talk I gave earlier this year on
1171 &lt;a href=&quot;https://www.nuug.no/aktiviteter/20230314-oversetting-og-publisering-av-b%c3%b8ker-med-fri-programvare/&quot;&gt;how
1172 to translate and publish books using free software&lt;/a&gt; (Norwegian
1173 only).&lt;/p&gt;
1174
1175 &lt;!--
1176
1177 https://github.com/docbook/xslt10-stylesheets/issues/205 (docbook-xsl: sme support)
1178 https://bugs.debian.org/968437 (xindy: index sorting rules for nb/nn)
1179 https://bugs.debian.org/856123 (pandoc: markdown to docbook with non-english titles)
1180 https://bugs.debian.org/864813 (dblatex: missing nb words)
1181 https://bugs.debian.org/756386 (dblatex: index sorting rules for nb/nn)
1182 https://bugs.debian.org/796871 (dbtoepub: index sorting rules for nb/nn)
1183 https://bugs.debian.org/792616 (dblatex: PDF metadata)
1184 https://bugs.debian.org/686908 (docbook-xsl: index sorting rules for nb/nn)
1185 https://sourceforge.net/tracker/?func=detail&amp;atid=373747&amp;aid=3556630&amp;group_id=21935 (docbook-xsl: nb/nn support)
1186 https://bugs.debian.org/684391 (dblatex: initial nb support)
1187
1188 --&gt;
1189
1190 &lt;p&gt;As usual, if you use Bitcoin and want to show your support of my
1191 activities, please send Bitcoin donations to my address
1192 &lt;b&gt;&lt;a href=&quot;bitcoin:15oWEoG9dUPovwmUL9KWAnYRtNJEkP1u1b&quot;&gt;15oWEoG9dUPovwmUL9KWAnYRtNJEkP1u1b&lt;/a&gt;&lt;/b&gt;.&lt;/p&gt;
1193 </description>
1194 </item>
1195
1196 <item>
1197 <title>«Virkninger av angrefristloven», hovedfagsoppgaven som fikk endret en lov</title>
1198 <link>https://people.skolelinux.org/pere/blog/_Virkninger_av_angrefristloven___hovedfagsoppgaven_som_fikk_endret_en_lov.html</link>
1199 <guid isPermaLink="true">https://people.skolelinux.org/pere/blog/_Virkninger_av_angrefristloven___hovedfagsoppgaven_som_fikk_endret_en_lov.html</guid>
1200 <pubDate>Sun, 29 Oct 2023 22:00:00 +0100</pubDate>
1201 <description>&lt;img src=&quot;http://people.skolelinux.org/pere/blog/images/2023-10-29-bok-angrefrist.svg&quot; width=&quot;20%&quot; align=&quot;center&quot;&gt;&lt;/a&gt;
1202
1203 &lt;p&gt;I 1979 leverte Ole-Erik Yrvin en hovedfagsoppgave for Cand. Scient.
1204 ved Institutt for sosiologi på Universitetet i Oslo på oppdrag fra
1205 Forbruker- og administrasjonsdepartementet. Oppgaven evaluerte
1206 Angrefristloven fra 1972, og det han oppdaget førte til at loven ble
1207 endret fire år senere.&lt;/p&gt;
1208
1209 &lt;p&gt;Jeg har kjent Ole-Erik en stund, og synes det var trist at hans
1210 oppgave ikke lenger er tilgjengelig, hverken fra oppdragsgiver
1211 eller fra universitetet. Hans forsøk på å få den avbildet og lagt
1212 ut på Internett har vist seg fånyttes, så derfor tilbød jeg meg for
1213 en stund tilbake å publisere den og gjøre den tilgjengelig med
1214 fribruksvilkår på Internett. Det er nå klart, og hovedfagsoppgaven
1215 er tilgjengelig blant annet via &lt;a
1216 href=&quot;http://www.hungry.com/~pere/publisher/&quot;&gt;min liste over
1217 publiserte bøker&lt;/a&gt;, både som nettside,
1218 &lt;a href=&quot;https://www.lulu.com/search?contributor=Ole-Erik+Yrvin&quot;&gt;digital
1219 bok i ePub-format og på papir fra lulu.com&lt;/a&gt;. Jeg regner med at
1220 den også vil dukke opp på nettbokhandlere i løpet av en måned eller
1221 to.&lt;/p&gt;
1222
1223 &lt;p&gt;Alle tabeller og figurer er gjenskapt for bedre lesbarhet, noen
1224 skrivefeil rettet opp og mange referanser har fått flere detaljer
1225 som ISBN-nummer og DOI-referanse. Selv om jeg ikke regner med at
1226 dette blir en kioskvelter, så håper jeg denne nye utgaven kan komme
1227 fremtiden til glede.&lt;/p&gt;
1228
1229 &lt;p&gt;Som vanlig, hvis du bruker Bitcoin og ønsker å vise din støtte til
1230 det jeg driver med, setter jeg pris på om du sender Bitcoin-donasjoner
1231 til min adresse
1232 &lt;b&gt;&lt;a href=&quot;bitcoin:15oWEoG9dUPovwmUL9KWAnYRtNJEkP1u1b&quot;&gt;15oWEoG9dUPovwmUL9KWAnYRtNJEkP1u1b&lt;/a&gt;&lt;/b&gt;. Merk,
1233 betaling med bitcoin er ikke anonymt. :)&lt;/p&gt;
1234 </description>
1235 </item>
1236
1237 <item>
1238 <title>«underordnet tjenestemann blir inhabil fordi en overordnet er inhabil».</title>
1239 <link>https://people.skolelinux.org/pere/blog/_underordnet_tjenestemann_blir_inhabil_fordi_en_overordnet_er_inhabil__.html</link>
1240 <guid isPermaLink="true">https://people.skolelinux.org/pere/blog/_underordnet_tjenestemann_blir_inhabil_fordi_en_overordnet_er_inhabil__.html</guid>
1241 <pubDate>Thu, 7 Sep 2023 09:10:00 +0200</pubDate>
1242 <description>&lt;p&gt;Medlemmene av Norges regjering har demonstert de siste månedene at
1243 habilitetsvureringer ikke er deres sterke side og det gjelder både
1244 Arbeiderpartiets og Senterpartiers representater. Det er heldigvis
1245 enklere i det private, da inhabilitetsreglene kun gjelder de som
1246 jobber for folket, ikke seg selv. Sist ut er utenriksminister
1247 Huitfeldt. I går kom nyheten om at
1248 &lt;a href=&quot;https://www.nrk.no/nyheter/riksadvokaten_-okokrim-nestsjef-kan-behandle-huitfeldt-saken-1.16545162&quot;&gt;Riksadvokaten
1249 har konkludert med at nestsjefen i Økokrim kan behandle sak om
1250 habilitet og innsidekunnskap&lt;/a&gt; for Huitfeldt, på tross av at hans
1251 overordnede, sjefen for Økokrim, har meldt seg inhabil i saken. Dette
1252 er litt rart. I veilednigen
1253 «&lt;a href=&quot;https://www.regjeringen.no/globalassets/upload/krd/vedlegg/komm/veiledere/habilitet_i_kommuner_og_fylkeskommuner.pdf&quot;&gt;Habilitet
1254 i kommuner og fylkeskommuner&lt;/a&gt;» av Kommunal- og regionaldepartementet
1255 forteller de hva som gjelder, riktig nok gjelder veiledningen ikke for
1256 Økokrim som jo ikke er kommune eller fylkeskommune, men jeg får ikke
1257 inntrykk av at dette er regler som kun gjelder for kommune og
1258 fylkeskommune:
1259
1260 &lt;blockquote&gt;
1261 &lt;p&gt;«&lt;strong&gt;2.1 Oversikt over inhabilitetsgrunnlagene&lt;/strong&gt;
1262
1263 &lt;p&gt;De alminnelige reglene om inhabilitet for den offentlige
1264 forvaltningen er gitt i
1265 &lt;a href=&quot;https://lovdata.no/dokument/NL/lov/1967-02-10/KAPITTEL_2#KAPITTEL_2&quot;&gt;forvaltningsloven
1266 §§ 6 til 10&lt;/a&gt;. Forvaltningslovens hovedregel om inhabilitet framgår
1267 av § 6. Her er det gitt tre ulike grunnlag som kan føre til at en
1268 tjenestemann eller folkevalgt blir inhabil. I § 6 første ledd
1269 bokstavene a til e er det oppstilt konkrete tilknytningsforhold mellom
1270 tjenestemannen og saken eller sakens parter som automatisk fører til
1271 inhabilitet. Annet ledd oppstiller en skjønnsmessig regel om at
1272 tjenestemannen også kan bli inhabil etter en konkret vurdering av
1273 inhabilitetsspørsmålet, der en lang rekke momenter kan være
1274 relevante. I tredje ledd er det regler om såkalt avledet
1275 inhabilitet. Det vil si at en underordnet tjenestemann blir inhabil
1276 fordi en overordnet er inhabil.»&lt;/p&gt;
1277 &lt;/blockquote&gt;
1278
1279 &lt;p&gt;Loven sier ganske enkelt «Er den overordnede tjenestemann ugild,
1280 kan avgjørelse i saken heller ikke treffes av en direkte underordnet
1281 tjenestemann i samme forvaltningsorgan.» Jeg antar tanken er at en
1282 underordnet vil stå i fare for å tilpasse sine konklusjoner til det
1283 overordnet vil ha fordel av, for å fortsatt ha et godt forhold til sin
1284 overordnede. Men jeg er ikke jurist og forstår nok ikke kompliserte
1285 juridiske vurderinger. For å sitere «Kamerat Napoleon» av George
1286 Orwell: «Alle dyr er like, men noen dyr er likere enn andre».
1287 </description>
1288 </item>
1289
1290 <item>
1291 <title>Invidious add-on for Kodi 20</title>
1292 <link>https://people.skolelinux.org/pere/blog/Invidious_add_on_for_Kodi_20.html</link>
1293 <guid isPermaLink="true">https://people.skolelinux.org/pere/blog/Invidious_add_on_for_Kodi_20.html</guid>
1294 <pubDate>Thu, 10 Aug 2023 19:50:00 +0200</pubDate>
1295 <description>&lt;p&gt;I still enjoy &lt;a href=&quot;https://kodi.tv/&quot;&gt;Kodi&lt;/a&gt; and
1296 &lt;a href=&quot;https://libreelec.tv/&quot;&gt;LibreELEC&lt;/a&gt; as my multimedia center
1297 at home. Sadly two of the services I really would like to use from
1298 within Kodi are not easily available. The most wanted add-on would be
1299 one making &lt;a href=&quot;https://archive.org/&quot;&gt;The Internet Archive&lt;/a&gt;
1300 available, and it has
1301 &lt;a href=&quot;https://kodi.wiki/view/Add-on:Internet_Archive&quot;&gt;not been
1302 working&lt;/a&gt; for many years. The second most wanted add-on is one
1303 using &lt;a href=&quot;https://invidious.io/&quot;&gt;the Invidious privacy enhanced
1304 Youtube frontent&lt;/a&gt;. A plugin for this has been partly working, but
1305 not been kept up to date in the Kodi add-on repository, and its
1306 upstream seem to have given it up in April this year, when the git
1307 repository was closed. A few days ago I got tired of this sad state
1308 of affairs and decided to
1309 &lt;a href=&quot;https://github.com/petterreinholdtsen/kodi-invidious-plugin&quot;&gt;have
1310 a go at improving the Invidious add-on&lt;/a&gt;. As
1311 &lt;a href=&quot;https://github.com/iv-org/invidious/issues/3872&quot;&gt;Google has
1312 already attacked&lt;/a&gt; the Invidious concept, so it need all the support
1313 if can get. My small contribution here is to improve the service
1314 status on Kodi.&lt;/p&gt;
1315
1316 &lt;p&gt;I added support to the Invidious add-on for automatically picking a
1317 working Invidious instance, instead of requiring the user to specify
1318 the URL to a specific instance after installation. I also had a look
1319 at the set of patches floating around in the various forks on github,
1320 and decided to clean up at least some of the features I liked and
1321 integrate them into my new release branch. Now the plugin can handle
1322 channel and short video items in search results. Earlier it could
1323 only handle single video instances in the search response. I also
1324 brushed up the set of metadata displayed a bit, but hope I can figure
1325 out how to get more relevant metadata displayed.&lt;/p&gt;
1326
1327 &lt;p&gt;Because I only use Kodi 20 myself, I only test on version 20 and am
1328 only motivated to ensure version 20 is working. Because of API changes
1329 between version 19 and 20, I suspect it will fail with earlier Kodi
1330 versions.&lt;/p&gt;
1331
1332 &lt;p&gt;I already
1333 &lt;a href=&quot;https://github.com/xbmc/repo-plugins/pull/4363&quot;&gt;asked to have
1334 the add-on added&lt;/a&gt; to the official Kodi 20 repository, and is
1335 waiting to heard back from the repo maintainers.&lt;/p&gt;
1336
1337 &lt;p&gt;As usual, if you use Bitcoin and want to show your support of my
1338 activities, please send Bitcoin donations to my address
1339 &lt;b&gt;&lt;a href=&quot;bitcoin:15oWEoG9dUPovwmUL9KWAnYRtNJEkP1u1b&quot;&gt;15oWEoG9dUPovwmUL9KWAnYRtNJEkP1u1b&lt;/a&gt;&lt;/b&gt;.&lt;/p&gt;
1340 </description>
1341 </item>
1342
1343 <item>
1344 <title>What did I learn from OpenSnitch this summer?</title>
1345 <link>https://people.skolelinux.org/pere/blog/What_did_I_learn_from_OpenSnitch_this_summer_.html</link>
1346 <guid isPermaLink="true">https://people.skolelinux.org/pere/blog/What_did_I_learn_from_OpenSnitch_this_summer_.html</guid>
1347 <pubDate>Sun, 11 Jun 2023 08:30:00 +0200</pubDate>
1348 <description>&lt;p&gt;With yesterdays
1349 &lt;a href=&quot;https://www.debian.org/News/2023/20230610&quot;&gt;release of Debian
1350 12 Bookworm&lt;/a&gt;, I am happy to know the
1351 &lt;a href=&quot;https://tracker.debian.org/pkg/opensnitch&quot;&gt;the interactive
1352 application firewall OpenSnitch&lt;/a&gt; is available for a wider audience.
1353 I have been running it for a few weeks now, and have been surprised
1354 about some of the programs connecting to the Internet. Some programs
1355 are obviously calling out from my machine, like the NTP network based
1356 clock adjusting system and Tor to reach other Tor clients, but others
1357 were more dubious. For example, the KDE Window manager try to look up
1358 the host name in DNS, for no apparent reason, but if this lookup is
1359 blocked the KDE desktop get periodically stuck when I use it. Another
1360 surprise was how much Firefox call home directly to mozilla.com,
1361 mozilla.net and googleapis.com, to mention a few, when I visit other
1362 web pages. This direct connection happen even if I told Firefox to
1363 always use a proxy, and the proxy setting is ignored for this traffic.
1364 Other surprising connections come from audacity and dirmngr (I do not
1365 use Gnome). It took some trial and error to get a good default set of
1366 permissions. Without it, I would get popups asking for permissions at
1367 any time, also the most inconvenient ones where I am in the middle of
1368 a time sensitive gaming session.&lt;/p&gt;
1369
1370 &lt;p&gt;I suspect some application developers should rethink when then need
1371 to use network connections or DNS lookups, and recommend testing
1372 OpenSnitch (only &lt;tt&gt;apt install opensnitch&lt;/tt&gt; away in Debian
1373 Bookworm) to locate and report any surprising Internet connections on
1374 your desktop machine.&lt;/p&gt;
1375
1376 &lt;p&gt;At the moment the upstream developer and Debian package maintainer
1377 is working on making the system more reliable in Debian, by enabling
1378 the eBPF kernel module to track processes and connections instead of
1379 depending in content in /proc/. This should enter unstable fairly
1380 soon.&lt;/p&gt;
1381
1382 &lt;p&gt;As usual, if you use Bitcoin and want to show your support of my
1383 activities, please send Bitcoin donations to my address
1384 &lt;b&gt;&lt;a href=&quot;bitcoin:15oWEoG9dUPovwmUL9KWAnYRtNJEkP1u1b&quot;&gt;15oWEoG9dUPovwmUL9KWAnYRtNJEkP1u1b&lt;/a&gt;&lt;/b&gt;.&lt;/p&gt;
1385
1386 &lt;p&gt;&lt;strong&gt;Update 2023-06-12&lt;/strong&gt;: I got a tip about
1387 &lt;a href=&quot;https://wiki.debian.org/PrivacyIssues&quot;&gt;a list of privacy
1388 issues in Free Software&lt;/a&gt; and the
1389 &lt;a href=&quot;irc://irc.debian.org/%23debian-privacy&quot;&gt;#debian-privacy IRC
1390 channel&lt;/a&gt; discussing these topics.&lt;/p&gt;
1391
1392 </description>
1393 </item>
1394
1395 <item>
1396 <title>wmbusmeters, parse data from your utility meter - nice free software</title>
1397 <link>https://people.skolelinux.org/pere/blog/wmbusmeters__parse_data_from_your_utility_meter___nice_free_software.html</link>
1398 <guid isPermaLink="true">https://people.skolelinux.org/pere/blog/wmbusmeters__parse_data_from_your_utility_meter___nice_free_software.html</guid>
1399 <pubDate>Fri, 19 May 2023 21:50:00 +0200</pubDate>
1400 <description>&lt;p&gt;There is a European standard for reading utility meters like water,
1401 gas, electricity or heat distribution meters. The
1402 &lt;a href=&quot;https://en.wikipedia.org/wiki/Meter-Bus&quot;&gt;Meter-Bus standard
1403 (EN 13757-2, EN 13757-3 and EN 137574)&lt;/a&gt; provide a cross vendor way
1404 to talk to and collect meter data. I ran into this standard when I
1405 wanted to monitor some heat distribution meters, and managed to find
1406 free software that could do the job. The meters in question broadcast
1407 encrypted messages with meter information via radio, and the hardest
1408 part was to track down the encryption keys from the vendor. With this
1409 in place I could set up a MQTT gateway to submit the meter data for
1410 graphing.&lt;/p&gt;
1411
1412 &lt;p&gt;The free software systems in question,
1413 &lt;a href=&quot;https://tracker.debian.org/pkg/rtl-wmbus&quot;&gt;rtl-wmbus&lt;/a&gt; to
1414 read the messages from a software defined radio, and
1415 &lt;a href=&quot;https://tracker.debian.org/pkg/wmbusmeters&quot;&gt;wmbusmeters&lt;/a&gt; to
1416 decrypt and decode the content of the messages, is working very well
1417 and allowe me to get frequent updates from my meters. I got in touch
1418 with upstream last year to see if there was any interest in publishing
1419 the packages via Debian. I was very happy to learn that Fredrik
1420 Öhrström volunteered to maintain the packages, and I have since
1421 assisted him in getting Debian package build rules in place as well as
1422 sponsoring the packages into the Debian archive. Sadly we completed
1423 it too late for them to become part of the next stable Debian release
1424 (Bookworm). The wmbusmeters package just cleared the NEW queue. It
1425 will need some work to fix a built problem, but I expect Fredrik will
1426 find a solution soon.&lt;/p&gt;
1427
1428 &lt;p&gt;If you got a infrastructure meter supporting the Meter Bus
1429 standard, I strongly recommend having a look at these nice
1430 packages.&lt;/p&gt;
1431
1432 &lt;p&gt;As usual, if you use Bitcoin and want to show your support of my
1433 activities, please send Bitcoin donations to my address
1434 &lt;b&gt;&lt;a href=&quot;bitcoin:15oWEoG9dUPovwmUL9KWAnYRtNJEkP1u1b&quot;&gt;15oWEoG9dUPovwmUL9KWAnYRtNJEkP1u1b&lt;/a&gt;&lt;/b&gt;.&lt;/p&gt;
1435 </description>
1436 </item>
1437
1438 <item>
1439 <title>The 2023 LinuxCNC Norwegian developer gathering</title>
1440 <link>https://people.skolelinux.org/pere/blog/The_2023_LinuxCNC_Norwegian_developer_gathering.html</link>
1441 <guid isPermaLink="true">https://people.skolelinux.org/pere/blog/The_2023_LinuxCNC_Norwegian_developer_gathering.html</guid>
1442 <pubDate>Sun, 14 May 2023 20:30:00 +0200</pubDate>
1443 <description>&lt;p&gt;The LinuxCNC project is making headway these days. A lot of
1444 patches and issues have seen activity on
1445 &lt;a href=&quot;https://github.com/LinuxCNC/linuxcnc/&quot;&gt;the project github
1446 pages&lt;/a&gt; recently. A few weeks ago there was a developer gathering
1447 over at the &lt;a href=&quot;https://tormach.com/&quot;&gt;Tormach&lt;/a&gt; headquarter in
1448 Wisconsin, and now we are planning a new gathering in Norway. If you
1449 wonder what LinuxCNC is, lets quote Wikipedia:&lt;/p&gt;
1450
1451 &lt;blockquote&gt;
1452 &quot;LinuxCNC is a software system for numerical control of
1453 machines such as milling machines, lathes, plasma cutters, routers,
1454 cutting machines, robots and hexapods. It can control up to 9 axes or
1455 joints of a CNC machine using G-code (RS-274NGC) as input. It has
1456 several GUIs suited to specific kinds of usage (touch screen,
1457 interactive development).&quot;
1458 &lt;/blockquote&gt;
1459
1460 &lt;p&gt;The Norwegian developer gathering take place the weekend June 16th
1461 to 18th this year, and is open for everyone interested in contributing
1462 to LinuxCNC. Up to date information about the gathering can be found
1463 in
1464 &lt;a href=&quot;https://sourceforge.net/p/emc/mailman/emc-developers/thread/sa64jp06nob.fsf%40hjemme.reinholdtsen.name/#msg37837251&quot;&gt;the
1465 developer mailing list thread&lt;/a&gt; where the gathering was announced.
1466 Thanks to the good people at
1467 &lt;a href=&quot;https://www.debian.org/&quot;&gt;Debian&lt;/a&gt;,
1468 &lt;a href=&quot;https://www.redpill-linpro.com/&quot;&gt;Redpill-Linpro&lt;/a&gt; and
1469 &lt;a href=&quot;https://www.nuugfoundation.no/no/&quot;&gt;NUUG Foundation&lt;/a&gt;, we
1470 have enough sponsor funds to pay for food, and shelter for the people
1471 traveling from afar to join us. If you would like to join the
1472 gathering, get in touch.&lt;/p&gt;
1473
1474 &lt;p&gt;As usual, if you use Bitcoin and want to show your support of my
1475 activities, please send Bitcoin donations to my address
1476 &lt;b&gt;&lt;a href=&quot;bitcoin:15oWEoG9dUPovwmUL9KWAnYRtNJEkP1u1b&quot;&gt;15oWEoG9dUPovwmUL9KWAnYRtNJEkP1u1b&lt;/a&gt;&lt;/b&gt;.&lt;/p&gt;
1477 </description>
1478 </item>
1479
1480 </channel>
1481 </rss>