]> pere.pagekite.me Git - homepage.git/blob - blog/index.rss
Generated.
[homepage.git] / blog / index.rss
1 <?xml version="1.0" encoding="utf-8"?>
2 <rss version='2.0' xmlns:lj='http://www.livejournal.org/rss/lj/1.0/' xmlns:atom="http://www.w3.org/2005/Atom">
3 <channel>
4 <title>Petter Reinholdtsen</title>
5 <description></description>
6 <link>http://people.skolelinux.org/pere/blog/</link>
7 <atom:link href="http://people.skolelinux.org/pere/blog/index.rss" rel="self" type="application/rss+xml" />
8
9 <item>
10 <title>Overvåkning i Kina vs. Norge</title>
11 <link>http://people.skolelinux.org/pere/blog/Overv_kning_i_Kina_vs__Norge.html</link>
12 <guid isPermaLink="true">http://people.skolelinux.org/pere/blog/Overv_kning_i_Kina_vs__Norge.html</guid>
13 <pubDate>Mon, 12 Feb 2018 09:40:00 +0100</pubDate>
14 <description>&lt;p&gt;Jeg lar meg fascinere av en artikkel
15 &lt;a href=&quot;https://www.dagbladet.no/kultur/terroristene-star-pa-dora/69436116&quot;&gt;i
16 Dagbladet om Kinas håndtering av Xinjiang&lt;/a&gt;, spesielt følgende
17 utsnitt:&lt;/p&gt;
18
19 &lt;p&gt;&lt;blockquote&gt;
20
21 &lt;p&gt;«I den sørvestlige byen Kashgar nærmere grensa til
22 Sentral-Asia meldes det nå at 120.000 uigurer er internert i såkalte
23 omskoleringsleirer. Samtidig er det innført et omfattende
24 helsesjekk-program med innsamling og lagring av DNA-prøver fra
25 absolutt alle innbyggerne. De mest avanserte overvåkingsmetodene
26 testes ut her. Programmer for å gjenkjenne ansikter og stemmer er på
27 plass i regionen. Der har de lokale myndighetene begynt å installere
28 GPS-systemer i alle kjøretøy og egne sporingsapper i
29 mobiltelefoner.&lt;/p&gt;
30
31 &lt;p&gt;Politimetodene griper så dypt inn i folks dagligliv at motstanden
32 mot Beijing-regimet øker.»&lt;/p&gt;
33
34 &lt;/blockquote&gt;&lt;/p&gt;
35
36 &lt;p&gt;Beskrivelsen avviker jo desverre ikke så veldig mye fra tilstanden
37 her i Norge.&lt;/p&gt;
38
39 &lt;table&gt;
40 &lt;tr&gt;
41 &lt;th&gt;Dataregistrering&lt;/th&gt;
42 &lt;th&gt;Kina&lt;/th&gt;
43 &lt;th&gt;Norge&lt;/th&gt;
44
45 &lt;tr&gt;
46 &lt;td&gt;Innsamling og lagring av DNA-prøver fra befolkningen&lt;/td&gt;
47 &lt;td&gt;Ja&lt;/td&gt;
48 &lt;td&gt;Delvis, planlagt for alle nyfødte.&lt;/td&gt;
49 &lt;/tr&gt;
50
51 &lt;tr&gt;
52 &lt;td&gt;Ansiktsgjenkjenning&lt;/td&gt;
53 &lt;td&gt;Ja&lt;/td&gt;
54 &lt;td&gt;Ja&lt;/td&gt;
55 &lt;/tr&gt;
56
57 &lt;tr&gt;
58 &lt;td&gt;Stemmegjenkjenning&lt;/td&gt;
59 &lt;td&gt;Ja&lt;/td&gt;
60 &lt;td&gt;Nei&lt;/td&gt;
61 &lt;/tr&gt;
62
63 &lt;tr&gt;
64 &lt;td&gt;Posisjons-sporing av mobiltelefoner&lt;/td&gt;
65 &lt;td&gt;Ja&lt;/td&gt;
66 &lt;td&gt;Ja&lt;/td&gt;
67 &lt;/tr&gt;
68
69 &lt;tr&gt;
70 &lt;td&gt;Posisjons-sporing av biler&lt;/td&gt;
71 &lt;td&gt;Ja&lt;/td&gt;
72 &lt;td&gt;Ja&lt;/td&gt;
73 &lt;/tr&gt;
74
75 &lt;/table&gt;
76
77 &lt;p&gt;I Norge har jo situasjonen rundt Folkehelseinstituttets lagring av
78 DNA-informasjon på vegne av politiet, der de nektet å slette
79 informasjon politiet ikke hadde lov til å ta vare på, gjort det klart
80 at DNA tar vare på ganske lenge. I tillegg finnes det utallige
81 biobanker som lagres til evig tid, og det er planer om å innføre
82 &lt;a href=&quot;https://www.aftenposten.no/norge/i/75E9/4-av-10-mener-staten-bor-lagre-DNA-profiler-pa-alle-nyfodte&quot;&gt;evig
83 lagring av DNA-materiale fra alle spebarn som fødes&lt;/a&gt; (med mulighet
84 for å be om sletting).&lt;/p&gt;
85
86 &lt;p&gt;I Norge er det system på plass for ansiktsgjenkjenning, som
87 &lt;a href=&quot;https://www.nrk.no/norge/kun-gardermoen-har-teknologi-for-ansiktsgjenkjenning-i-norge-1.12719461&quot;&gt;en
88 NRK-artikkel fra 2015&lt;/a&gt; forteller er aktiv på Gardermoen, samt
89 &lt;a href=&quot;https://www.dagbladet.no/nyheter/inntil-27-000-bor-i-norge-under-falsk-id/60500781&quot;&gt;brukes
90 til å analysere bilder innsamlet av myndighetene&lt;/a&gt;. Brukes det også
91 flere plasser? Det er tett med overvåkningskamera kontrollert av
92 politi og andre myndigheter i Oslo sentrum.&lt;/p&gt;
93
94 &lt;p&gt;Jeg er ikke kjent med at Norge har noe system for identifisering av
95 personer ved hjelp av stemmegjenkjenning.&lt;/p&gt;
96
97 &lt;p&gt;Posisjons-sporing av mobiltelefoner er ruinemessig tilgjengelig for
98 blant annet politi, NAV og Finanstilsynet, i tråd med krav i
99 telefonselskapenes konsesjon. I tillegg rapporterer smarttelefoner
100 sin posisjon til utviklerne av utallige mobil-apper, der myndigheter
101 og andre kan hente ut informasjon ved behov. Det er intet behov for
102 noen egen app for dette.&lt;/p&gt;
103
104 &lt;p&gt;Posisjons-sporing av biler er rutinemessig tilgjengelig via et tett
105 nett av målepunkter på veiene (automatiske bomstasjoner,
106 køfribrikke-registrering, automatiske fartsmålere og andre veikamera).
107 Det er i tillegg vedtatt at alle nye biler skal selges med utstyr for
108 GPS-sporing (eCall).&lt;/p&gt;
109
110 &lt;p&gt;Det er jammen godt vi lever i et liberalt demokrati, og ikke en
111 overvåkningsstat, eller?&lt;/p&gt;
112 </description>
113 </item>
114
115 <item>
116 <title>How hard can æ, ø and å be?</title>
117 <link>http://people.skolelinux.org/pere/blog/How_hard_can______and___be_.html</link>
118 <guid isPermaLink="true">http://people.skolelinux.org/pere/blog/How_hard_can______and___be_.html</guid>
119 <pubDate>Sun, 11 Feb 2018 17:10:00 +0100</pubDate>
120 <description>&lt;img src=&quot;http://people.skolelinux.org/pere/blog/images/2018-02-11-peppes-unicode.jpeg&quot; align=&quot;right&quot;/&gt;
121
122 &lt;p&gt;We write 2018, and it is 30 years since Unicode was introduced.
123 Most of us in Norway have come to expect the use of our alphabet to
124 just work with any computer system. But it is apparently beyond reach
125 of the computers printing recites at a restaurant. Recently I visited
126 a Peppes pizza resturant, and noticed a few details on the recite.
127 Notice how &#39;ø&#39; and &#39;å&#39; are replaced with strange symbols in
128 &#39;Servitør&#39;, &#39;Å BETALE&#39;, &#39;Beløp pr. gjest&#39;, &#39;Takk for besøket.&#39; and &#39;Vi
129 gleder oss til å se deg igjen&#39;.&lt;/p&gt;
130
131 &lt;p&gt;I would say that this state is passed sad and over in embarrassing.&lt;/p&gt;
132
133 &lt;p&gt;I removed personal and private information to be nice.&lt;/p&gt;
134 </description>
135 </item>
136
137 <item>
138 <title>Legal to share more than 11,000 movies listed on IMDB?</title>
139 <link>http://people.skolelinux.org/pere/blog/Legal_to_share_more_than_11_000_movies_listed_on_IMDB_.html</link>
140 <guid isPermaLink="true">http://people.skolelinux.org/pere/blog/Legal_to_share_more_than_11_000_movies_listed_on_IMDB_.html</guid>
141 <pubDate>Sun, 7 Jan 2018 23:30:00 +0100</pubDate>
142 <description>&lt;p&gt;I&#39;ve continued to track down list of movies that are legal to
143 distribute on the Internet, and identified more than 11,000 title IDs
144 in The Internet Movie Database (IMDB) so far. Most of them (57%) are
145 feature films from USA published before 1923. I&#39;ve also tracked down
146 more than 24,000 movies I have not yet been able to map to IMDB title
147 ID, so the real number could be a lot higher. According to the front
148 web page for &lt;a href=&quot;https://retrofilmvault.com/&quot;&gt;Retro Film
149 Vault&lt;/A&gt;, there are 44,000 public domain films, so I guess there are
150 still some left to identify.&lt;/p&gt;
151
152 &lt;p&gt;The complete data set is available from
153 &lt;a href=&quot;https://github.com/petterreinholdtsen/public-domain-free-imdb&quot;&gt;a
154 public git repository&lt;/a&gt;, including the scripts used to create it.
155 Most of the data is collected using web scraping, for example from the
156 &quot;product catalog&quot; of companies selling copies of public domain movies,
157 but any source I find believable is used. I&#39;ve so far had to throw
158 out three sources because I did not trust the public domain status of
159 the movies listed.&lt;/p&gt;
160
161 &lt;p&gt;Anyway, this is the summary of the 28 collected data sources so
162 far:&lt;/p&gt;
163
164 &lt;p&gt;&lt;pre&gt;
165 2352 entries ( 66 unique) with and 15983 without IMDB title ID in free-movies-archive-org-search.json
166 2302 entries ( 120 unique) with and 0 without IMDB title ID in free-movies-archive-org-wikidata.json
167 195 entries ( 63 unique) with and 200 without IMDB title ID in free-movies-cinemovies.json
168 89 entries ( 52 unique) with and 38 without IMDB title ID in free-movies-creative-commons.json
169 344 entries ( 28 unique) with and 655 without IMDB title ID in free-movies-fesfilm.json
170 668 entries ( 209 unique) with and 1064 without IMDB title ID in free-movies-filmchest-com.json
171 830 entries ( 21 unique) with and 0 without IMDB title ID in free-movies-icheckmovies-archive-mochard.json
172 19 entries ( 19 unique) with and 0 without IMDB title ID in free-movies-imdb-c-expired-gb.json
173 6822 entries ( 6669 unique) with and 0 without IMDB title ID in free-movies-imdb-c-expired-us.json
174 137 entries ( 0 unique) with and 0 without IMDB title ID in free-movies-imdb-externlist.json
175 1205 entries ( 57 unique) with and 0 without IMDB title ID in free-movies-imdb-pd.json
176 84 entries ( 20 unique) with and 167 without IMDB title ID in free-movies-infodigi-pd.json
177 158 entries ( 135 unique) with and 0 without IMDB title ID in free-movies-letterboxd-looney-tunes.json
178 113 entries ( 4 unique) with and 0 without IMDB title ID in free-movies-letterboxd-pd.json
179 182 entries ( 100 unique) with and 0 without IMDB title ID in free-movies-letterboxd-silent.json
180 229 entries ( 87 unique) with and 1 without IMDB title ID in free-movies-manual.json
181 44 entries ( 2 unique) with and 64 without IMDB title ID in free-movies-openflix.json
182 291 entries ( 33 unique) with and 474 without IMDB title ID in free-movies-profilms-pd.json
183 211 entries ( 7 unique) with and 0 without IMDB title ID in free-movies-publicdomainmovies-info.json
184 1232 entries ( 57 unique) with and 1875 without IMDB title ID in free-movies-publicdomainmovies-net.json
185 46 entries ( 13 unique) with and 81 without IMDB title ID in free-movies-publicdomainreview.json
186 698 entries ( 64 unique) with and 118 without IMDB title ID in free-movies-publicdomaintorrents.json
187 1758 entries ( 882 unique) with and 3786 without IMDB title ID in free-movies-retrofilmvault.json
188 16 entries ( 0 unique) with and 0 without IMDB title ID in free-movies-thehillproductions.json
189 63 entries ( 16 unique) with and 141 without IMDB title ID in free-movies-vodo.json
190 11583 unique IMDB title IDs in total, 8724 only in one list, 24647 without IMDB title ID
191 &lt;/pre&gt;&lt;/p&gt;
192
193 &lt;p&gt; I keep finding more data sources. I found the cinemovies source
194 just a few days ago, and as you can see from the summary, it extended
195 my list with 63 movies. Check out the mklist-* scripts in the git
196 repository if you are curious how the lists are created. Many of the
197 titles are extracted using searches on IMDB, where I look for the
198 title and year, and accept search results with only one movie listed
199 if the year matches. This allow me to automatically use many lists of
200 movies without IMDB title ID references at the cost of increasing the
201 risk of wrongly identify a IMDB title ID as public domain. So far my
202 random manual checks have indicated that the method is solid, but I
203 really wish all lists of public domain movies would include unique
204 movie identifier like the IMDB title ID. It would make the job of
205 counting movies in the public domain a lot easier.&lt;/p&gt;
206
207 &lt;p&gt;As usual, if you use Bitcoin and want to show your support of my
208 activities, please send Bitcoin donations to my address
209 &lt;b&gt;&lt;a href=&quot;bitcoin:15oWEoG9dUPovwmUL9KWAnYRtNJEkP1u1b&quot;&gt;15oWEoG9dUPovwmUL9KWAnYRtNJEkP1u1b&lt;/a&gt;&lt;/b&gt;.&lt;/p&gt;
210 </description>
211 </item>
212
213 <item>
214 <title>Kommentarer til «Evaluation of (il)legality» for Popcorn Time</title>
215 <link>http://people.skolelinux.org/pere/blog/Kommentarer_til__Evaluation_of__il_legality__for_Popcorn_Time.html</link>
216 <guid isPermaLink="true">http://people.skolelinux.org/pere/blog/Kommentarer_til__Evaluation_of__il_legality__for_Popcorn_Time.html</guid>
217 <pubDate>Wed, 20 Dec 2017 11:40:00 +0100</pubDate>
218 <description>&lt;p&gt;I går var jeg i Follo tingrett som sakkyndig vitne og presenterte
219 mine undersøkelser rundt
220 &lt;a href=&quot;https://github.com/petterreinholdtsen/public-domain-free-imdb&quot;&gt;telling
221 av filmverk i det fri&lt;/a&gt;, relatert til
222 &lt;a href=&quot;https://www.nuug.no/&quot;&gt;foreningen NUUG&lt;/a&gt;s involvering i
223 &lt;a href=&quot;https://www.nuug.no/news/tags/dns-domenebeslag/&quot;&gt;saken om
224 Økokrims beslag og senere inndragning av DNS-domenet
225 popcorn-time.no&lt;/a&gt;. Jeg snakket om flere ting, men mest om min
226 vurdering av hvordan filmbransjen har målt hvor ulovlig Popcorn Time
227 er. Filmbransjens måling er så vidt jeg kan se videreformidlet uten
228 endringer av norsk politi, og domstolene har lagt målingen til grunn
229 når de har vurdert Popcorn Time både i Norge og i utlandet (tallet
230 99% er referert også i utenlandske domsavgjørelser).&lt;/p&gt;
231
232 &lt;p&gt;I forkant av mitt vitnemål skrev jeg et notat, mest til meg selv,
233 med de punktene jeg ønsket å få frem. Her er en kopi av notatet jeg
234 skrev og ga til aktoratet. Merkelig nok ville ikke dommerene ha
235 notatet, så hvis jeg forsto rettsprosessen riktig ble kun
236 histogram-grafen lagt inn i dokumentasjonen i saken. Dommerne var
237 visst bare interessert i å forholde seg til det jeg sa i retten,
238 ikke det jeg hadde skrevet i forkant. Uansett så antar jeg at flere
239 enn meg kan ha glede av teksten, og publiserer den derfor her.
240 Legger ved avskrift av dokument 09,13, som er det sentrale
241 dokumentet jeg kommenterer.&lt;/p&gt;
242
243 &lt;p&gt;&lt;strong&gt;Kommentarer til «Evaluation of (il)legality» for Popcorn
244 Time&lt;/strong&gt;&lt;/p&gt;
245
246 &lt;p&gt;&lt;strong&gt;Oppsummering&lt;/strong&gt;&lt;/p&gt;
247
248 &lt;p&gt;Målemetoden som Økokrim har lagt til grunn når de påstår at 99% av
249 filmene tilgjengelig fra Popcorn Time deles ulovlig har
250 svakheter.&lt;/p&gt;
251
252 &lt;p&gt;De eller den som har vurdert hvorvidt filmer kan lovlig deles har
253 ikke lyktes med å identifisere filmer som kan deles lovlig og har
254 tilsynelatende antatt at kun veldig gamle filmer kan deles lovlig.
255 Økokrim legger til grunn at det bare finnes èn film, Charlie
256 Chaplin-filmen «The Circus» fra 1928, som kan deles fritt blant de
257 som ble observert tilgjengelig via ulike Popcorn Time-varianter.
258 Jeg finner tre flere blant de observerte filmene: «The Brain That
259 Wouldn&#39;t Die» fra 1962, «God’s Little Acre» fra 1958 og «She Wore a
260 Yellow Ribbon» fra 1949. Det er godt mulig det finnes flere. Det
261 finnes dermed minst fire ganger så mange filmer som lovlig kan deles
262 på Internett i datasettet Økokrim har lagt til grunn når det påstås
263 at mindre enn 1 % kan deles lovlig.&lt;/p&gt;
264
265 &lt;p&gt;Dernest, utplukket som gjøres ved søk på tilfeldige ord hentet fra
266 ordlisten til Dale-Chall avviker fra årsfordelingen til de brukte
267 filmkatalogene som helhet, hvilket påvirker fordelingen mellom
268 filmer som kan lovlig deles og filmer som ikke kan lovlig deles. I
269 tillegg gir valg av øvre del (de fem første) av søkeresultatene et
270 avvik fra riktig årsfordeling, hvilket påvirker fordelingen av verk
271 i det fri i søkeresultatet.&lt;/p&gt;
272
273 &lt;p&gt;Det som måles er ikke (u)lovligheten knyttet til bruken av Popcorn
274 Time, men (u)lovligheten til innholdet i bittorrent-filmkataloger
275 som vedlikeholdes uavhengig av Popcorn Time.&lt;/p&gt;
276
277 &lt;p&gt;Omtalte dokumenter: 09,12, &lt;a href=&quot;#dok-09-13&quot;&gt;09,13&lt;/a&gt;, 09,14,
278 09,18, 09,19, 09,20.&lt;/p&gt;
279
280 &lt;p&gt;&lt;strong&gt;Utfyllende kommentarer&lt;/strong&gt;&lt;/p&gt;
281
282 &lt;p&gt;Økokrim har forklart domstolene at minst 99% av alt som er
283 tilgjengelig fra ulike Popcorn Time-varianter deles ulovlig på
284 Internet. Jeg ble nysgjerrig på hvordan de er kommet frem til dette
285 tallet, og dette notatet er en samling kommentarer rundt målingen
286 Økokrim henviser til. Litt av bakgrunnen for at jeg valgte å se på
287 saken er at jeg er interessert i å identifisere og telle hvor mange
288 kunstneriske verk som er falt i det fri eller av andre grunner kan
289 lovlig deles på Internett, og dermed var interessert i hvordan en
290 hadde funnet den ene prosenten som kanskje deles lovlig.&lt;/p&gt;
291
292 &lt;p&gt;Andelen på 99% kommer fra et ukreditert og udatert notatet som tar
293 mål av seg å dokumentere en metode for å måle hvor (u)lovlig ulike
294 Popcorn Time-varianter er.&lt;/p&gt;
295
296 &lt;p&gt;Raskt oppsummert, så forteller metodedokumentet at på grunn av at
297 det ikke er mulig å få tak i komplett liste over alle filmtitler
298 tilgjengelig via Popcorn Time, så lages noe som skal være et
299 representativt utvalg ved å velge 50 søkeord større enn tre tegn fra
300 ordlisten kjent som Dale-Chall. For hvert søkeord gjøres et søk og
301 de første fem filmene i søkeresultatet samles inn inntil 100 unike
302 filmtitler er funnet. Hvis 50 søkeord ikke var tilstrekkelig for å
303100 unike filmtitler ble flere filmer fra hvert søkeresultat lagt
304 til. Hvis dette heller ikke var tilstrekkelig, så ble det hentet ut
305 og søkt på flere tilfeldig valgte søkeord inntil 100 unike
306 filmtitler var identifisert.&lt;/p&gt;
307
308 &lt;p&gt;Deretter ble for hver av filmtitlene «vurdert hvorvidt det var
309 rimelig å forvente om at verket var vernet av copyright, ved å se på
310 om filmen var tilgjengelig i IMDB, samt se på regissør,
311 utgivelsesår, når det var utgitt for bestemte markedsområder samt
312 hvilke produksjons- og distribusjonsselskap som var registrert» (min
313 oversettelse).&lt;/p&gt;
314
315 &lt;p&gt;Metoden er gjengitt både i de ukrediterte dokumentene 09,13 og
316 09,19, samt beskrevet fra side 47 i dokument 09,20, lysark datert
317 2017-02-01. Sistnevnte er kreditert Geerart Bourlon fra Motion
318 Picture Association EMEA. Metoden virker å ha flere svakheter som
319 gir resultatene en slagside. Den starter med å slå fast at det ikke
320 er mulig å hente ut en komplett liste over alle filmtitler som er
321 tilgjengelig, og at dette er bakgrunnen for metodevalget. Denne
322 forutsetningen er ikke i tråd med det som står i dokument 09,12, som
323 ikke heller har oppgitt forfatter og dato. Dokument 09,12 forteller
324 hvordan hele kataloginnholdet ble lasted ned og talt opp. Dokument
325 09,12 er muligens samme rapport som ble referert til i dom fra Oslo
326 Tingrett 2017-11-03
327 (&lt;a href=&quot;https://www.domstol.no/no/Enkelt-domstol/Oslo--tingrett/Nyheter/ma-sperre-for-popcorn-time/&quot;&gt;sak
328 17-093347TVI-OTIR/05&lt;/a&gt;) som rapport av 1. juni 2017 av Alexander
329 Kind Petersen, men jeg har ikke sammenlignet dokumentene ord for ord
330 for å kontrollere dette.&lt;/p&gt;
331
332 &lt;p&gt;IMDB er en forkortelse for The Internet Movie Database, en
333 anerkjent kommersiell nettjeneste som brukes aktivt av både
334 filmbransjen og andre til å holde rede på hvilke spillefilmer (og
335 endel andre filmer) som finnes eller er under produksjon, og
336 informasjon om disse filmene. Datakvaliteten er høy, med få feil og
337 få filmer som mangler. IMDB viser ikke informasjon om
338 opphavsrettslig status for filmene på infosiden for hver film. Som
339 del av IMDB-tjenesten finnes det lister med filmer laget av
340 frivillige som lister opp det som antas å være verk i det fri.&lt;/p&gt;
341
342 &lt;p&gt;Det finnes flere kilder som kan brukes til å finne filmer som er
343 allemannseie (public domain) eller har bruksvilkår som gjør det
344 lovlig for alleå dele dem på Internett. Jeg har de siste ukene
345 forsøkt å samle og krysskoble disse listene for å forsøke å telle
346 antall filmer i det fri. Ved å ta utgangspunkt i slike lister (og
347 publiserte filmer for Internett-arkivets del), har jeg så langt
348 klart å identifisere over 11 000 filmer, hovedsaklig spillefilmer.
349
350 &lt;p&gt;De aller fleste oppføringene er hentet fra IMDB selv, basert på det
351 faktum at alle filmer laget i USA før 1923 er falt i det fri.
352 Tilsvarende tidsgrense for Storbritannia er 1912-07-01, men dette
353 utgjør bare veldig liten del av spillefilmene i IMDB (19 totalt).
354 En annen stor andel kommer fra Internett-arkivet, der jeg har
355 identifisert filmer med referanse til IMDB. Internett-arkivet, som
356 holder til i USA, har som
357 &lt;a href=&quot;https://archive.org/about/terms.php&quot;&gt;policy å kun publisere
358 filmer som det er lovlig å distribuere&lt;/a&gt;. Jeg har under arbeidet
359 kommet over flere filmer som har blitt fjernet fra
360 Internett-arkivet, hvilket gjør at jeg konkluderer med at folkene
361 som kontrollerer Internett-arkivet har et aktivt forhold til å kun
362 ha lovlig innhold der, selv om det i stor grad er drevet av
363 frivillige. En annen stor liste med filmer kommer fra det
364 kommersielle selskapet Retro Film Vault, som selger allemannseide
365 filmer til TV- og filmbransjen, Jeg har også benyttet meg av lister
366 over filmer som hevdes å være allemannseie, det være seg Public
367 Domain Review, Public Domain Torrents og Public Domain Movies (.net
368 og .info), samt lister over filmer med Creative Commons-lisensiering
369 fra Wikipedia, VODO og The Hill Productions. Jeg har gjort endel
370 stikkontroll ved å vurdere filmer som kun omtales på en liste. Der
371 jeg har funnet feil som har gjort meg i tvil om vurderingen til de
372 som har laget listen har jeg forkastet listen fullstendig (gjelder
373 en liste fra IMDB).&lt;/p&gt;
374
375 &lt;p&gt;Ved å ta utgangspunkt i verk som kan antas å være lovlig delt på
376 Internett (fra blant annet Internett-arkivet, Public Domain
377 Torrents, Public Domain Reivew og Public Domain Movies), og knytte
378 dem til oppføringer i IMDB, så har jeg så langt klart å identifisere
379 over 11 000 filmer (hovedsaklig spillefilmer) det er grunn til å tro
380 kan lovlig distribueres av alle på Internett. Som ekstra kilder er
381 det brukt lister over filmer som antas/påstås å være allemannseie.
382 Disse kildene kommer fra miljøer som jobber for å gjøre tilgjengelig
383 for almennheten alle verk som er falt i det fri eller har
384 bruksvilkår som tillater deling.
385
386 &lt;p&gt;I tillegg til de over 11 000 filmene der tittel-ID i IMDB er
387 identifisert, har jeg funnet mer enn 20 000 oppføringer der jeg ennå
388 ikke har hatt kapasitet til å spore opp tittel-ID i IMDB. Noen av
389 disse er nok duplikater av de IMDB-oppføringene som er identifisert
390 så langt, men neppe alle. Retro Film Vault hevder å ha 44 000
391 filmverk i det fri i sin katalog, så det er mulig at det reelle
392 tallet er betydelig høyere enn de jeg har klart å identifisere så
393 langt. Konklusjonen er at tallet 11 000 er nedre grense for hvor
394 mange filmer i IMDB som kan lovlig deles på Internett. I følge &lt;a
395 href=&quot;http://www.imdb.com/stats&quot;&gt;statistikk fra IMDB&lt;/a&gt; er det 4.6
396 millioner titler registrert, hvorav 3 millioner er TV-serieepisoder.
397 Jeg har ikke funnet ut hvordan de fordeler seg per år.&lt;/p&gt;
398
399 &lt;p&gt;Hvis en fordeler på år alle tittel-IDene i IMDB som hevdes å lovlig
400 kunne deles på Internett, får en følgende histogram:&lt;/p&gt;
401
402 &lt;p align=&quot;center&quot;&gt;&lt;img width=&quot;80%&quot; src=&quot;http://people.skolelinux.org/pere/blog/images/2017-12-20-histogram-year.png&quot;&gt;&lt;/p&gt;
403
404 &lt;p&gt;En kan i histogrammet se at effekten av manglende registrering
405 eller fornying av registrering er at mange filmer gitt ut i USA før
406 1978 er allemannseie i dag. I tillegg kan en se at det finnes flere
407 filmer gitt ut de siste årene med bruksvilkår som tillater deling,
408 muligens på grunn av fremveksten av
409 &lt;a href=&quot;https://creativecommons.org/&quot;&gt;Creative
410 Commons&lt;/a&gt;-bevegelsen..&lt;/p&gt;
411
412 &lt;p&gt;For maskinell analyse av katalogene har jeg laget et lite program
413 som kobler seg til bittorrent-katalogene som brukes av ulike Popcorn
414 Time-varianter og laster ned komplett liste over filmer i
415 katalogene, noe som bekrefter at det er mulig å hente ned komplett
416 liste med alle filmtitler som er tilgjengelig. Jeg har sett på fire
417 bittorrent-kataloger. Den ene brukes av klienten tilgjengelig fra
418 www.popcorntime.sh og er navngitt &#39;sh&#39; i dette dokumentet. Den
419 andre brukes i følge dokument 09,12 av klienten tilgjengelig fra
420 popcorntime.ag og popcorntime.sh og er navngitt &#39;yts&#39; i dette
421 dokumentet. Den tredje brukes av websidene tilgjengelig fra
422 popcorntime-online.tv og er navngitt &#39;apidomain&#39; i dette dokumentet.
423 Den fjerde brukes av klienten tilgjenglig fra popcorn-time.to i
424 følge dokument 09,12, og er navngitt &#39;ukrfnlge&#39; i dette
425 dokumentet.&lt;/p&gt;
426
427 &lt;p&gt;Metoden Økokrim legger til grunn skriver i sitt punkt fire at
428 skjønn er en egnet metode for å finne ut om en film kan lovlig deles
429 på Internett eller ikke, og sier at det ble «vurdert hvorvidt det
430 var rimelig å forvente om at verket var vernet av copyright». For
431 det første er det ikke nok å slå fast om en film er «vernet av
432 copyright» for å vite om det er lovlig å dele den på Internett eller
433 ikke, da det finnes flere filmer med opphavsrettslige bruksvilkår
434 som tillater deling på Internett. Eksempler på dette er Creative
435 Commons-lisensierte filmer som Citizenfour fra 2014 og Sintel fra
436 2010. I tillegg til slike finnes det flere filmer som nå er
437 allemannseie (public domain) på grunn av manglende registrering
438 eller fornying av registrering selv om både regisør,
439 produksjonsselskap og distributør ønsker seg vern. Eksempler på
440 dette er Plan 9 from Outer Space fra 1959 og Night of the Living
441 Dead fra 1968. Alle filmer fra USA som var allemannseie før
442 1989-03-01 forble i det fri da Bern-konvensjonen, som tok effekt i
443 USA på det tidspunktet, ikke ble gitt tilbakevirkende kraft. Hvis
444 det er noe
445 &lt;a href=&quot;http://www.latimes.com/local/lanow/la-me-ln-happy-birthday-song-lawsuit-decision-20150922-story.html&quot;&gt;historien
446 om sangen «Happy birthday»&lt;/a&gt; forteller oss, der betaling for bruk
447 har vært krevd inn i flere tiår selv om sangen ikke egentlig var
448 vernet av åndsverksloven, så er det at hvert enkelt verk må vurderes
449 nøye og i detalj før en kan slå fast om verket er allemannseie eller
450 ikke, det holder ikke å tro på selverklærte rettighetshavere. Flere
451 eksempel på verk i det fri som feilklassifiseres som vernet er fra
452 dokument 09,18, som lister opp søkeresultater for klienten omtalt
453 som popcorntime.sh og i følge notatet kun inneholder en film (The
454 Circus fra 1928) som under tvil kan antas å være allemannseie.&lt;/p&gt;
455
456 &lt;p&gt;Ved rask gjennomlesning av dokument 09,18, som inneholder
457 skjermbilder fra bruk av en Popcorn Time-variant, fant jeg omtalt
458 både filmen «The Brain That Wouldn&#39;t Die» fra 1962 som er
459 &lt;a href=&quot;https://archive.org/details/brain_that_wouldnt_die&quot;&gt;tilgjengelig
460 fra Internett-arkivet&lt;/a&gt; og som
461 &lt;a href=&quot;https://en.wikipedia.org/wiki/List_of_films_in_the_public_domain_in_the_United_States&quot;&gt;i
462 følge Wikipedia er allemannseie i USA&lt;/a&gt; da den ble gitt ut i
463 1962 uten &#39;copyright&#39;-merking, og filmen «God’s Little Acre» fra
464 1958 &lt;a href=&quot;https://en.wikipedia.org/wiki/God%27s_Little_Acre_%28film%29&quot;&gt;som
465 er lagt ut på Wikipedia&lt;/a&gt;, der det fortelles at
466 sort/hvit-utgaven er allemannseie. Det fremgår ikke fra dokument
467 09,18 om filmen omtalt der er sort/hvit-utgaven. Av
468 kapasitetsårsaker og på grunn av at filmoversikten i dokument 09,18
469 ikke er maskinlesbart har jeg ikke forsøkt å sjekke alle filmene som
470 listes opp der om mot liste med filmer som er antatt lovlig kan
471 distribueres på Internet.&lt;/p&gt;
472
473 &lt;p&gt;Ved maskinell gjennomgang av listen med IMDB-referanser under
474 regnearkfanen &#39;Unique titles&#39; i dokument 09.14, fant jeg i tillegg
475 filmen «She Wore a Yellow Ribbon» fra 1949) som nok også er
476 feilklassifisert. Filmen «She Wore a Yellow Ribbon» er tilgjengelig
477 fra Internett-arkivet og markert som allemannseie der. Det virker
478 dermed å være minst fire ganger så mange filmer som kan lovlig deles
479 på Internett enn det som er lagt til grunn når en påstår at minst
480 99% av innholdet er ulovlig. Jeg ser ikke bort fra at nærmere
481 undersøkelser kan avdekke flere. Poenget er uansett at metodens
482 punkt om «rimelig å forvente om at verket var vernet av copyright»
483 gjør metoden upålitelig.&lt;/p&gt;
484
485 &lt;p&gt;Den omtalte målemetoden velger ut tilfeldige søketermer fra
486 ordlisten Dale-Chall. Den ordlisten inneholder 3000 enkle engelske
487 som fjerdeklassinger i USA er forventet å forstå. Det fremgår ikke
488 hvorfor akkurat denne ordlisten er valgt, og det er uklart for meg
489 om den er egnet til å få et representativt utvalg av filmer. Mange
490 av ordene gir tomt søkeresultat. Ved å simulerte tilsvarende søk
491 ser jeg store avvik fra fordelingen i katalogen for enkeltmålinger.
492 Dette antyder at enkeltmålinger av 100 filmer slik målemetoden
493 beskriver er gjort, ikke er velegnet til å finne andel ulovlig
494 innhold i bittorrent-katalogene.&lt;/p&gt;
495
496 &lt;p&gt;En kan motvirke dette store avviket for enkeltmålinger ved å gjøre
497 mange søk og slå sammen resultatet. Jeg har testet ved å
498 gjennomføre 100 enkeltmålinger (dvs. måling av (100x100=) 10 000
499 tilfeldig valgte filmer) som gir mindre, men fortsatt betydelig
500 avvik, i forhold til telling av filmer pr år i hele katalogen.&lt;/p&gt;
501
502 &lt;p&gt;Målemetoden henter ut de fem øverste i søkeresultatet.
503 Søkeresultatene er sortert på antall bittorrent-klienter registrert
504 som delere i katalogene, hvilket kan gi en slagside mot hvilke
505 filmer som er populære blant de som bruker bittorrent-katalogene,
506 uten at det forteller noe om hvilket innhold som er tilgjengelig
507 eller hvilket innhold som deles med Popcorn Time-klienter. Jeg har
508 forsøkt å måle hvor stor en slik slagside eventuelt er ved å
509 sammenligne fordelingen hvis en tar de 5 nederste i søkeresultatet i
510 stedet. Avviket for disse to metodene for endel kataloger er godt
511 synlig på histogramet. Her er histogram over filmer funnet i den
512 komplette katalogen (grønn strek), og filmer funnet ved søk etter
513 ord i Dale-Chall. Grafer merket &#39;top&#39; henter fra de 5 første i
514 søkeresultatet, mens de merket &#39;bottom&#39; henter fra de 5 siste. En
515 kan her se at resultatene påvirkes betydelig av hvorvidt en ser på
516 de første eller de siste filmene i et søketreff.&lt;/p&gt;
517
518 &lt;p align=&quot;center&quot;&gt;
519 &lt;img width=&quot;40%&quot; src=&quot;http://people.skolelinux.org/pere/blog/images/2017-12-20-histogram-year-sh-top.png&quot;/&gt;
520 &lt;img width=&quot;40%&quot; src=&quot;http://people.skolelinux.org/pere/blog/images/2017-12-20-histogram-year-sh-bottom.png&quot;/&gt;
521 &lt;br&gt;
522 &lt;img width=&quot;40%&quot; src=&quot;http://people.skolelinux.org/pere/blog/images/2017-12-20-histogram-year-yts-top.png&quot;/&gt;
523 &lt;img width=&quot;40%&quot; src=&quot;http://people.skolelinux.org/pere/blog/images/2017-12-20-histogram-year-yts-bottom.png&quot;/&gt;
524 &lt;br&gt;
525 &lt;img width=&quot;40%&quot; src=&quot;http://people.skolelinux.org/pere/blog/images/2017-12-20-histogram-year-ukrfnlge-top.png&quot;/&gt;
526 &lt;img width=&quot;40%&quot; src=&quot;http://people.skolelinux.org/pere/blog/images/2017-12-20-histogram-year-ukrfnlge-bottom.png&quot;/&gt;
527 &lt;br&gt;
528 &lt;img width=&quot;40%&quot; src=&quot;http://people.skolelinux.org/pere/blog/images/2017-12-20-histogram-year-apidomain-top.png&quot;/&gt;
529 &lt;img width=&quot;40%&quot; src=&quot;http://people.skolelinux.org/pere/blog/images/2017-12-20-histogram-year-apidomain-bottom.png&quot;/&gt;
530 &lt;/p&gt;
531
532 &lt;p&gt;Det er verdt å bemerke at de omtalte bittorrent-katalogene ikke er
533 laget for bruk med Popcorn Time. Eksempelvis tilhører katalogen
534 YTS, som brukes av klientet som ble lastes ned fra popcorntime.sh,
535 et selvstendig fildelings-relatert nettsted YTS.AG med et separat
536 brukermiljø. Målemetoden foreslått av Økokrim måler dermed ikke
537 (u)lovligheten rundt bruken av Popcorn Time, men (u)lovligheten til
538 innholdet i disse katalogene.&lt;/p&gt;
539
540 &lt;hr&gt;
541
542 &lt;p id=&quot;dok-09-13&quot;&gt;Metoden fra Økokrims dokument 09,13 i straffesaken
543 om DNS-beslag.&lt;/p&gt;
544
545 &lt;p&gt;&lt;strong&gt;1. Evaluation of (il)legality&lt;/strong&gt;&lt;/p&gt;
546
547 &lt;p&gt;&lt;strong&gt;1.1. Methodology&lt;/strong&gt;
548
549 &lt;p&gt;Due to its technical configuration, Popcorn Time applications don&#39;t
550 allow to make a full list of all titles made available. In order to
551 evaluate the level of illegal operation of PCT, the following
552 methodology was applied:&lt;/p&gt;
553
554 &lt;ol&gt;
555
556 &lt;li&gt;A random selection of 50 keywords, greater than 3 letters, was
557 made from the Dale-Chall list that contains 3000 simple English
558 words1. The selection was made by using a Random Number
559 Generator2.&lt;/li&gt;
560
561 &lt;li&gt;For each keyword, starting with the first randomly selected
562 keyword, a search query was conducted in the movie section of the
563 respective Popcorn Time application. For each keyword, the first
564 five results were added to the title list until the number of 100
565 unique titles was reached (duplicates were removed).&lt;/li&gt;
566
567 &lt;li&gt;For one fork, .CH, insufficient titles were generated via this
568 approach to reach 100 titles. This was solved by adding any
569 additional query results above five for each of the 50 keywords.
570 Since this still was not enough, another 42 random keywords were
571 selected to finally reach 100 titles.&lt;/li&gt;
572
573 &lt;li&gt;It was verified whether or not there is a reasonable expectation
574 that the work is copyrighted by checking if they are available on
575 IMDb, also verifying the director, the year when the title was
576 released, the release date for a certain market, the production
577 company/ies of the title and the distribution company/ies.&lt;/li&gt;
578
579 &lt;/ol&gt;
580
581 &lt;p&gt;&lt;strong&gt;1.2. Results&lt;/strong&gt;&lt;/p&gt;
582
583 &lt;p&gt;Between 6 and 9 June 2016, four forks of Popcorn Time were
584 investigated: popcorn-time.to, popcorntime.ag, popcorntime.sh and
585 popcorntime.ch. An excel sheet with the results is included in
586 Appendix 1. Screenshots were secured in separate Appendixes for each
587 respective fork, see Appendix 2-5.&lt;/p&gt;
588
589 &lt;p&gt;For each fork, out of 100, de-duplicated titles it was possible to
590 retrieve data according to the parameters set out above that indicate
591 that the title is commercially available. Per fork, there was 1 title
592 that presumably falls within the public domain, i.e. the 1928 movie
593 &quot;The Circus&quot; by and with Charles Chaplin.&lt;/p&gt;
594
595 &lt;p&gt;Based on the above it is reasonable to assume that 99% of the movie
596 content of each fork is copyright protected and is made available
597 illegally.&lt;/p&gt;
598
599 &lt;p&gt;This exercise was not repeated for TV series, but considering that
600 besides production companies and distribution companies also
601 broadcasters may have relevant rights, it is reasonable to assume that
602 at least a similar level of infringement will be established.&lt;/p&gt;
603
604 &lt;p&gt;Based on the above it is reasonable to assume that 99% of all the
605 content of each fork is copyright protected and are made available
606 illegally.&lt;/p&gt;
607 </description>
608 </item>
609
610 <item>
611 <title>Cura, the nice 3D print slicer, is now in Debian Unstable</title>
612 <link>http://people.skolelinux.org/pere/blog/Cura__the_nice_3D_print_slicer__is_now_in_Debian_Unstable.html</link>
613 <guid isPermaLink="true">http://people.skolelinux.org/pere/blog/Cura__the_nice_3D_print_slicer__is_now_in_Debian_Unstable.html</guid>
614 <pubDate>Sun, 17 Dec 2017 07:00:00 +0100</pubDate>
615 <description>&lt;p&gt;After several months of working and waiting, I am happy to report
616 that the nice and user friendly 3D printer slicer software Cura just
617 entered Debian Unstable. It consist of five packages,
618 &lt;a href=&quot;https://tracker.debian.org/pkg/cura&quot;&gt;cura&lt;/a&gt;,
619 &lt;a href=&quot;https://tracker.debian.org/pkg/cura-engine&quot;&gt;cura-engine&lt;/a&gt;,
620 &lt;a href=&quot;https://tracker.debian.org/pkg/libarcus&quot;&gt;libarcus&lt;/a&gt;,
621 &lt;a href=&quot;https://tracker.debian.org/pkg/fdm-materials&quot;&gt;fdm-materials&lt;/a&gt;,
622 &lt;a href=&quot;https://tracker.debian.org/pkg/libsavitar&quot;&gt;libsavitar&lt;/a&gt; and
623 &lt;a href=&quot;https://tracker.debian.org/pkg/uranium&quot;&gt;uranium&lt;/a&gt;. The last
624 two, uranium and cura, entered Unstable yesterday. This should make
625 it easier for Debian users to print on at least the Ultimaker class of
626 3D printers. My nearest 3D printer is an Ultimaker 2+, so it will
627 make life easier for at least me. :)&lt;/p&gt;
628
629 &lt;p&gt;The work to make this happen was done by Gregor Riepl, and I was
630 happy to assist him in sponsoring the packages. With the introduction
631 of Cura, Debian is up to three 3D printer slicers at your service,
632 Cura, Slic3r and Slic3r Prusa. If you own or have access to a 3D
633 printer, give it a go. :)&lt;/p&gt;
634
635 &lt;p&gt;The 3D printer software is maintained by the 3D printer Debian
636 team, flocking together on the
637 &lt;a href=&quot;http://lists.alioth.debian.org/cgi-bin/mailman/listinfo/3dprinter-general&quot;&gt;3dprinter-general&lt;/a&gt;
638 mailing list and the
639 &lt;a href=&quot;irc://irc.debian.org/#debian-3dprinting&quot;&gt;#debian-3dprinting&lt;/a&gt;
640 IRC channel.&lt;/p&gt;
641
642 &lt;p&gt;The next step for Cura in Debian is to update the cura package to
643 version 3.0.3 and then update the entire set of packages to version
644 3.1.0 which showed up the last few days.&lt;/p&gt;
645 </description>
646 </item>
647
648 <item>
649 <title>Idea for finding all public domain movies in the USA</title>
650 <link>http://people.skolelinux.org/pere/blog/Idea_for_finding_all_public_domain_movies_in_the_USA.html</link>
651 <guid isPermaLink="true">http://people.skolelinux.org/pere/blog/Idea_for_finding_all_public_domain_movies_in_the_USA.html</guid>
652 <pubDate>Wed, 13 Dec 2017 10:15:00 +0100</pubDate>
653 <description>&lt;p&gt;While looking at
654 &lt;a href=&quot;http://onlinebooks.library.upenn.edu/cce/&quot;&gt;the scanned copies
655 for the copyright renewal entries for movies published in the USA&lt;/a&gt;,
656 an idea occurred to me. The number of renewals are so few per year, it
657 should be fairly quick to transcribe them all and add references to
658 the corresponding IMDB title ID. This would give the (presumably)
659 complete list of movies published 28 years earlier that did _not_
660 enter the public domain for the transcribed year. By fetching the
661 list of USA movies published 28 years earlier and subtract the movies
662 with renewals, we should be left with movies registered in IMDB that
663 are now in the public domain. For the year 1955 (which is the one I
664 have looked at the most), the total number of pages to transcribe is
665 21. For the 28 years from 1950 to 1978, it should be in the range
666 500-600 pages. It is just a few days of work, and spread among a
667 small group of people it should be doable in a few weeks of spare
668 time.&lt;/p&gt;
669
670 &lt;p&gt;A typical copyright renewal entry look like this (the first one
671 listed for 1955):&lt;/p&gt;
672
673 &lt;p&gt;&lt;blockquote&gt;
674 ADAM AND EVIL, a photoplay in seven reels by Metro-Goldwyn-Mayer
675 Distribution Corp. (c) 17Aug27; L24293. Loew&#39;s Incorporated (PWH);
676 10Jun55; R151558.
677 &lt;/blockquote&gt;&lt;/p&gt;
678
679 &lt;p&gt;The movie title as well as registration and renewal dates are easy
680 enough to locate by a program (split on first comma and look for
681 DDmmmYY). The rest of the text is not required to find the movie in
682 IMDB, but is useful to confirm the correct movie is found. I am not
683 quite sure what the L and R numbers mean, but suspect they are
684 reference numbers into the archive of the US Copyright Office.&lt;/p&gt;
685
686 &lt;p&gt;Tracking down the equivalent IMDB title ID is probably going to be
687 a manual task, but given the year it is fairly easy to search for the
688 movie title using for example
689 &lt;a href=&quot;http://www.imdb.com/find?q=adam+and+evil+1927&amp;s=all&quot;&gt;http://www.imdb.com/find?q=adam+and+evil+1927&amp;s=all&lt;/a&gt;.
690 Using this search, I find that the equivalent IMDB title ID for the
691 first renewal entry from 1955 is
692 &lt;a href=&quot;http://www.imdb.com/title/tt0017588/&quot;&gt;http://www.imdb.com/title/tt0017588/&lt;/a&gt;.&lt;/p&gt;
693
694 &lt;p&gt;I suspect the best way to do this would be to make a specialised
695 web service to make it easy for contributors to transcribe and track
696 down IMDB title IDs. In the web service, once a entry is transcribed,
697 the title and year could be extracted from the text, a search in IMDB
698 conducted for the user to pick the equivalent IMDB title ID right
699 away. By spreading out the work among volunteers, it would also be
700 possible to make at least two persons transcribe the same entries to
701 be able to discover any typos introduced. But I will need help to
702 make this happen, as I lack the spare time to do all of this on my
703 own. If you would like to help, please get in touch. Perhaps you can
704 draft a web service for crowd sourcing the task?&lt;/p&gt;
705
706 &lt;p&gt;Note, Project Gutenberg already have some
707 &lt;a href=&quot;http://www.gutenberg.org/ebooks/search/?query=copyright+office+renewals&quot;&gt;transcribed
708 copies of the US Copyright Office renewal protocols&lt;/a&gt;, but I have
709 not been able to find any film renewals there, so I suspect they only
710 have copies of renewal for written works. I have not been able to find
711 any transcribed versions of movie renewals so far. Perhaps they exist
712 somewhere?&lt;/p&gt;
713
714 &lt;p&gt;I would love to figure out methods for finding all the public
715 domain works in other countries too, but it is a lot harder. At least
716 for Norway and Great Britain, such work involve tracking down the
717 people involved in making the movie and figuring out when they died.
718 It is hard enough to figure out who was part of making a movie, but I
719 do not know how to automate such procedure without a registry of every
720 person involved in making movies and their death year.&lt;/p&gt;
721
722 &lt;p&gt;As usual, if you use Bitcoin and want to show your support of my
723 activities, please send Bitcoin donations to my address
724 &lt;b&gt;&lt;a href=&quot;bitcoin:15oWEoG9dUPovwmUL9KWAnYRtNJEkP1u1b&quot;&gt;15oWEoG9dUPovwmUL9KWAnYRtNJEkP1u1b&lt;/a&gt;&lt;/b&gt;.&lt;/p&gt;
725 </description>
726 </item>
727
728 <item>
729 <title>Is the short movie «Empty Socks» from 1927 in the public domain or not?</title>
730 <link>http://people.skolelinux.org/pere/blog/Is_the_short_movie__Empty_Socks__from_1927_in_the_public_domain_or_not_.html</link>
731 <guid isPermaLink="true">http://people.skolelinux.org/pere/blog/Is_the_short_movie__Empty_Socks__from_1927_in_the_public_domain_or_not_.html</guid>
732 <pubDate>Tue, 5 Dec 2017 12:30:00 +0100</pubDate>
733 <description>&lt;p&gt;Three years ago, a presumed lost animation film,
734 &lt;a href=&quot;https://en.wikipedia.org/wiki/Empty_Socks&quot;&gt;Empty Socks from
735 1927&lt;/a&gt;, was discovered in the Norwegian National Library. At the
736 time it was discovered, it was generally assumed to be copyrighted by
737 The Walt Disney Company, and I blogged about
738 &lt;a href=&quot;http://people.skolelinux.org/pere/blog/Opphavsretts_status_for__Empty_Socks__fra_1927_.html&quot;&gt;my
739 reasoning to conclude&lt;/a&gt; that it would would enter the Norwegian
740 equivalent of the public domain in 2053, based on my understanding of
741 Norwegian Copyright Law. But a few days ago, I came across
742 &lt;a href=&quot;http://www.toonzone.net/forums/threads/exposed-disneys-repurchase-of-oswald-the-rabbit-a-sham.4792291/&quot;&gt;a
743 blog post claiming the movie was already in the public domain&lt;/a&gt;, at
744 least in USA. The reasoning is as follows: The film was released in
745 November or Desember 1927 (sources disagree), and presumably
746 registered its copyright that year. At that time, right holders of
747 movies registered by the copyright office received government
748 protection for there work for 28 years. After 28 years, the copyright
749 had to be renewed if the wanted the government to protect it further.
750 The blog post I found claim such renewal did not happen for this
751 movie, and thus it entered the public domain in 1956. Yet someone
752 claim the copyright was renewed and the movie is still copyright
753 protected. Can anyone help me to figure out which claim is correct?
754 I have not been able to find Empty Socks in Catalog of copyright
755 entries. Ser.3 pt.12-13 v.9-12 1955-1958 Motion Pictures
756 &lt;a href=&quot;http://onlinebooks.library.upenn.edu/cce/1955r.html#film&quot;&gt;available
757 from the University of Pennsylvania&lt;/a&gt;, neither in
758 &lt;a href=&quot;https://babel.hathitrust.org/cgi/pt?id=mdp.39015084451130;page=root;view=image;size=100;seq=83;num=45&quot;&gt;page
759 45 for the first half of 1955&lt;/a&gt;, nor in
760 &lt;a href=&quot;https://babel.hathitrust.org/cgi/pt?id=mdp.39015084451130;page=root;view=image;size=100;seq=175;num=119&quot;&gt;page
761 119 for the second half of 1955&lt;/a&gt;. It is of course possible that
762 the renewal entry was left out of the printed catalog by mistake. Is
763 there some way to rule out this possibility? Please help, and update
764 the wikipedia page with your findings.
765
766 &lt;p&gt;As usual, if you use Bitcoin and want to show your support of my
767 activities, please send Bitcoin donations to my address
768 &lt;b&gt;&lt;a href=&quot;bitcoin:15oWEoG9dUPovwmUL9KWAnYRtNJEkP1u1b&quot;&gt;15oWEoG9dUPovwmUL9KWAnYRtNJEkP1u1b&lt;/a&gt;&lt;/b&gt;.&lt;/p&gt;
769 </description>
770 </item>
771
772 <item>
773 <title>Metadata proposal for movies on the Internet Archive</title>
774 <link>http://people.skolelinux.org/pere/blog/Metadata_proposal_for_movies_on_the_Internet_Archive.html</link>
775 <guid isPermaLink="true">http://people.skolelinux.org/pere/blog/Metadata_proposal_for_movies_on_the_Internet_Archive.html</guid>
776 <pubDate>Tue, 28 Nov 2017 12:00:00 +0100</pubDate>
777 <description>&lt;p&gt;It would be easier to locate the movie you want to watch in
778 &lt;a href=&quot;https://www.archive.org/&quot;&gt;the Internet Archive&lt;/a&gt;, if the
779 metadata about each movie was more complete and accurate. In the
780 archiving community, a well known saying state that good metadata is a
781 love letter to the future. The metadata in the Internet Archive could
782 use a face lift for the future to love us back. Here is a proposal
783 for a small improvement that would make the metadata more useful
784 today. I&#39;ve been unable to find any document describing the various
785 standard fields available when uploading videos to the archive, so
786 this proposal is based on my best quess and searching through several
787 of the existing movies.&lt;/p&gt;
788
789 &lt;p&gt;I have a few use cases in mind. First of all, I would like to be
790 able to count the number of distinct movies in the Internet Archive,
791 without duplicates. I would further like to identify the IMDB title
792 ID of the movies in the Internet Archive, to be able to look up a IMDB
793 title ID and know if I can fetch the video from there and share it
794 with my friends.&lt;/p&gt;
795
796 &lt;p&gt;Second, I would like the Butter data provider for The Internet
797 archive
798 (&lt;a href=&quot;https://github.com/butterproviders/butter-provider-archive&quot;&gt;available
799 from github&lt;/a&gt;), to list as many of the good movies as possible. The
800 plugin currently do a search in the archive with the following
801 parameters:&lt;/p&gt;
802
803 &lt;p&gt;&lt;pre&gt;
804 collection:moviesandfilms
805 AND NOT collection:movie_trailers
806 AND -mediatype:collection
807 AND format:&quot;Archive BitTorrent&quot;
808 AND year
809 &lt;/pre&gt;&lt;/p&gt;
810
811 &lt;p&gt;Most of the cool movies that fail to show up in Butter do so
812 because the &#39;year&#39; field is missing. The &#39;year&#39; field is populated by
813 the year part from the &#39;date&#39; field, and should be when the movie was
814 released (date or year). Two such examples are
815 &lt;a href=&quot;https://archive.org/details/SidneyOlcottsBen-hur1905&quot;&gt;Ben Hur
816 from 1905&lt;/a&gt; and
817 &lt;a href=&quot;https://archive.org/details/Caminandes2GranDillama&quot;&gt;Caminandes
818 2: Gran Dillama from 2013&lt;/a&gt;, where the year metadata field is
819 missing.&lt;/p&gt;
820
821 So, my proposal is simply, for every movie in The Internet Archive
822 where an IMDB title ID exist, please fill in these metadata fields
823 (note, they can be updated also long after the video was uploaded, but
824 as far as I can tell, only by the uploader):
825
826 &lt;dl&gt;
827
828 &lt;dt&gt;mediatype&lt;/dt&gt;
829 &lt;dd&gt;Should be &#39;movie&#39; for movies.&lt;/dd&gt;
830
831 &lt;dt&gt;collection&lt;/dt&gt;
832 &lt;dd&gt;Should contain &#39;moviesandfilms&#39;.&lt;/dd&gt;
833
834 &lt;dt&gt;title&lt;/dt&gt;
835 &lt;dd&gt;The title of the movie, without the publication year.&lt;/dd&gt;
836
837 &lt;dt&gt;date&lt;/dt&gt;
838 &lt;dd&gt;The data or year the movie was released. This make the movie show
839 up in Butter, as well as make it possible to know the age of the
840 movie and is useful to figure out copyright status.&lt;/dd&gt;
841
842 &lt;dt&gt;director&lt;/dt&gt;
843 &lt;dd&gt;The director of the movie. This make it easier to know if the
844 correct movie is found in movie databases.&lt;/dd&gt;
845
846 &lt;dt&gt;publisher&lt;/dt&gt;
847 &lt;dd&gt;The production company making the movie. Also useful for
848 identifying the correct movie.&lt;/dd&gt;
849
850 &lt;dt&gt;links&lt;/dt&gt;
851
852 &lt;dd&gt;Add a link to the IMDB title page, for example like this: &amp;lt;a
853 href=&quot;http://www.imdb.com/title/tt0028496/&quot;&amp;gt;Movie in
854 IMDB&amp;lt;/a&amp;gt;. This make it easier to find duplicates and allow for
855 counting of number of unique movies in the Archive. Other external
856 references, like to TMDB, could be added like this too.&lt;/dd&gt;
857
858 &lt;/dl&gt;
859
860 &lt;p&gt;I did consider proposing a Custom field for the IMDB title ID (for
861 example &#39;imdb_title_url&#39;, &#39;imdb_code&#39; or simply &#39;imdb&#39;, but suspect it
862 will be easier to simply place it in the links free text field.&lt;/p&gt;
863
864 &lt;p&gt;I created
865 &lt;a href=&quot;https://github.com/petterreinholdtsen/public-domain-free-imdb&quot;&gt;a
866 list of IMDB title IDs for several thousand movies in the Internet
867 Archive&lt;/a&gt;, but I also got a list of several thousand movies without
868 such IMDB title ID (and quite a few duplicates). It would be great if
869 this data set could be integrated into the Internet Archive metadata
870 to be available for everyone in the future, but with the current
871 policy of leaving metadata editing to the uploaders, it will take a
872 while before this happen. If you have uploaded movies into the
873 Internet Archive, you can help. Please consider following my proposal
874 above for your movies, to ensure that movie is properly
875 counted. :)&lt;/p&gt;
876
877 &lt;p&gt;The list is mostly generated using wikidata, which based on
878 Wikipedia articles make it possible to link between IMDB and movies in
879 the Internet Archive. But there are lots of movies without a
880 Wikipedia article, and some movies where only a collection page exist
881 (like for &lt;a href=&quot;https://en.wikipedia.org/wiki/Caminandes&quot;&gt;the
882 Caminandes example above&lt;/a&gt;, where there are three movies but only
883 one Wikidata entry).&lt;/p&gt;
884
885 &lt;p&gt;As usual, if you use Bitcoin and want to show your support of my
886 activities, please send Bitcoin donations to my address
887 &lt;b&gt;&lt;a href=&quot;bitcoin:15oWEoG9dUPovwmUL9KWAnYRtNJEkP1u1b&quot;&gt;15oWEoG9dUPovwmUL9KWAnYRtNJEkP1u1b&lt;/a&gt;&lt;/b&gt;.&lt;/p&gt;
888 </description>
889 </item>
890
891 <item>
892 <title>Legal to share more than 3000 movies listed on IMDB?</title>
893 <link>http://people.skolelinux.org/pere/blog/Legal_to_share_more_than_3000_movies_listed_on_IMDB_.html</link>
894 <guid isPermaLink="true">http://people.skolelinux.org/pere/blog/Legal_to_share_more_than_3000_movies_listed_on_IMDB_.html</guid>
895 <pubDate>Sat, 18 Nov 2017 21:20:00 +0100</pubDate>
896 <description>&lt;p&gt;A month ago, I blogged about my work to
897 &lt;a href=&quot;http://people.skolelinux.org/pere/blog/Locating_IMDB_IDs_of_movies_in_the_Internet_Archive_using_Wikidata.html&quot;&gt;automatically
898 check the copyright status of IMDB entries&lt;/a&gt;, and try to count the
899 number of movies listed in IMDB that is legal to distribute on the
900 Internet. I have continued to look for good data sources, and
901 identified a few more. The code used to extract information from
902 various data sources is available in
903 &lt;a href=&quot;https://github.com/petterreinholdtsen/public-domain-free-imdb&quot;&gt;a
904 git repository&lt;/a&gt;, currently available from github.&lt;/p&gt;
905
906 &lt;p&gt;So far I have identified 3186 unique IMDB title IDs. To gain
907 better understanding of the structure of the data set, I created a
908 histogram of the year associated with each movie (typically release
909 year). It is interesting to notice where the peaks and dips in the
910 graph are located. I wonder why they are placed there. I suspect
911 World War II caused the dip around 1940, but what caused the peak
912 around 2010?&lt;/p&gt;
913
914 &lt;p align=&quot;center&quot;&gt;&lt;img src=&quot;http://people.skolelinux.org/pere/blog/images/2017-11-18-verk-i-det-fri-filmer.png&quot; /&gt;&lt;/p&gt;
915
916 &lt;p&gt;I&#39;ve so far identified ten sources for IMDB title IDs for movies in
917 the public domain or with a free license. This is the statistics
918 reported when running &#39;make stats&#39; in the git repository:&lt;/p&gt;
919
920 &lt;pre&gt;
921 249 entries ( 6 unique) with and 288 without IMDB title ID in free-movies-archive-org-butter.json
922 2301 entries ( 540 unique) with and 0 without IMDB title ID in free-movies-archive-org-wikidata.json
923 830 entries ( 29 unique) with and 0 without IMDB title ID in free-movies-icheckmovies-archive-mochard.json
924 2109 entries ( 377 unique) with and 0 without IMDB title ID in free-movies-imdb-pd.json
925 291 entries ( 122 unique) with and 0 without IMDB title ID in free-movies-letterboxd-pd.json
926 144 entries ( 135 unique) with and 0 without IMDB title ID in free-movies-manual.json
927 350 entries ( 1 unique) with and 801 without IMDB title ID in free-movies-publicdomainmovies.json
928 4 entries ( 0 unique) with and 124 without IMDB title ID in free-movies-publicdomainreview.json
929 698 entries ( 119 unique) with and 118 without IMDB title ID in free-movies-publicdomaintorrents.json
930 8 entries ( 8 unique) with and 196 without IMDB title ID in free-movies-vodo.json
931 3186 unique IMDB title IDs in total
932 &lt;/pre&gt;
933
934 &lt;p&gt;The entries without IMDB title ID are candidates to increase the
935 data set, but might equally well be duplicates of entries already
936 listed with IMDB title ID in one of the other sources, or represent
937 movies that lack a IMDB title ID. I&#39;ve seen examples of all these
938 situations when peeking at the entries without IMDB title ID. Based
939 on these data sources, the lower bound for movies listed in IMDB that
940 are legal to distribute on the Internet is between 3186 and 4713.
941
942 &lt;p&gt;It would be great for improving the accuracy of this measurement,
943 if the various sources added IMDB title ID to their metadata. I have
944 tried to reach the people behind the various sources to ask if they
945 are interested in doing this, without any replies so far. Perhaps you
946 can help me get in touch with the people behind VODO, Public Domain
947 Torrents, Public Domain Movies and Public Domain Review to try to
948 convince them to add more metadata to their movie entries?&lt;/p&gt;
949
950 &lt;p&gt;Another way you could help is by adding pages to Wikipedia about
951 movies that are legal to distribute on the Internet. If such page
952 exist and include a link to both IMDB and The Internet Archive, the
953 script used to generate free-movies-archive-org-wikidata.json should
954 pick up the mapping as soon as wikidata is updates.&lt;/p&gt;
955
956 &lt;p&gt;As usual, if you use Bitcoin and want to show your support of my
957 activities, please send Bitcoin donations to my address
958 &lt;b&gt;&lt;a href=&quot;bitcoin:15oWEoG9dUPovwmUL9KWAnYRtNJEkP1u1b&quot;&gt;15oWEoG9dUPovwmUL9KWAnYRtNJEkP1u1b&lt;/a&gt;&lt;/b&gt;.&lt;/p&gt;
959 </description>
960 </item>
961
962 <item>
963 <title>Some notes on fault tolerant storage systems</title>
964 <link>http://people.skolelinux.org/pere/blog/Some_notes_on_fault_tolerant_storage_systems.html</link>
965 <guid isPermaLink="true">http://people.skolelinux.org/pere/blog/Some_notes_on_fault_tolerant_storage_systems.html</guid>
966 <pubDate>Wed, 1 Nov 2017 15:35:00 +0100</pubDate>
967 <description>&lt;p&gt;If you care about how fault tolerant your storage is, you might
968 find these articles and papers interesting. They have formed how I
969 think of when designing a storage system.&lt;/p&gt;
970
971 &lt;ul&gt;
972
973 &lt;li&gt;USENIX :login; &lt;a
974 href=&quot;https://www.usenix.org/publications/login/summer2017/ganesan&quot;&gt;Redundancy
975 Does Not Imply Fault Tolerance. Analysis of Distributed Storage
976 Reactions to Single Errors and Corruptions&lt;/a&gt; by Aishwarya Ganesan,
977 Ramnatthan Alagappan, Andrea C. Arpaci-Dusseau, and Remzi
978 H. Arpaci-Dusseau&lt;/li&gt;
979
980 &lt;li&gt;ZDNet
981 &lt;a href=&quot;http://www.zdnet.com/article/why-raid-5-stops-working-in-2009/&quot;&gt;Why
982 RAID 5 stops working in 2009&lt;/a&gt; by Robin Harris&lt;/li&gt;
983
984 &lt;li&gt;ZDNet
985 &lt;a href=&quot;http://www.zdnet.com/article/why-raid-6-stops-working-in-2019/&quot;&gt;Why
986 RAID 6 stops working in 2019&lt;/a&gt; by Robin Harris&lt;/li&gt;
987
988 &lt;li&gt;USENIX FAST&#39;07
989 &lt;a href=&quot;http://research.google.com/archive/disk_failures.pdf&quot;&gt;Failure
990 Trends in a Large Disk Drive Population&lt;/a&gt; by Eduardo Pinheiro,
991 Wolf-Dietrich Weber and Luiz André Barroso&lt;/li&gt;
992
993 &lt;li&gt;USENIX ;login: &lt;a
994 href=&quot;https://www.usenix.org/system/files/login/articles/hughes12-04.pdf&quot;&gt;Data
995 Integrity. Finding Truth in a World of Guesses and Lies&lt;/a&gt; by Doug
996 Hughes&lt;/li&gt;
997
998 &lt;li&gt;USENIX FAST&#39;08
999 &lt;a href=&quot;https://www.usenix.org/events/fast08/tech/full_papers/bairavasundaram/bairavasundaram_html/&quot;&gt;An
1000 Analysis of Data Corruption in the Storage Stack&lt;/a&gt; by
1001 L. N. Bairavasundaram, G. R. Goodson, B. Schroeder, A. C.
1002 Arpaci-Dusseau, and R. H. Arpaci-Dusseau&lt;/li&gt;
1003
1004 &lt;li&gt;USENIX FAST&#39;07 &lt;a
1005 href=&quot;https://www.usenix.org/legacy/events/fast07/tech/schroeder/schroeder_html/&quot;&gt;Disk
1006 failures in the real world: what does an MTTF of 1,000,000 hours mean
1007 to you?&lt;/a&gt; by B. Schroeder and G. A. Gibson.&lt;/li&gt;
1008
1009 &lt;li&gt;USENIX ;login: &lt;a
1010 href=&quot;https://www.usenix.org/events/fast08/tech/full_papers/jiang/jiang_html/&quot;&gt;Are
1011 Disks the Dominant Contributor for Storage Failures? A Comprehensive
1012 Study of Storage Subsystem Failure Characteristics&lt;/a&gt; by Weihang
1013 Jiang, Chongfeng Hu, Yuanyuan Zhou, and Arkady Kanevsky&lt;/li&gt;
1014
1015 &lt;li&gt;SIGMETRICS 2007
1016 &lt;a href=&quot;http://research.cs.wisc.edu/adsl/Publications/latent-sigmetrics07.pdf&quot;&gt;An
1017 analysis of latent sector errors in disk drives&lt;/a&gt; by
1018 L. N. Bairavasundaram, G. R. Goodson, S. Pasupathy, and J. Schindler&lt;/li&gt;
1019
1020 &lt;/ul&gt;
1021
1022 &lt;p&gt;Several of these research papers are based on data collected from
1023 hundred thousands or millions of disk, and their findings are eye
1024 opening. The short story is simply do not implicitly trust RAID or
1025 redundant storage systems. Details matter. And unfortunately there
1026 are few options on Linux addressing all the identified issues. Both
1027 ZFS and Btrfs are doing a fairly good job, but have legal and
1028 practical issues on their own. I wonder how cluster file systems like
1029 Ceph do in this regard. After all, there is an old saying, you know
1030 you have a distributed system when the crash of a computer you have
1031 never heard of stops you from getting any work done. The same holds
1032 true if fault tolerance do not work.&lt;/p&gt;
1033
1034 &lt;p&gt;Just remember, in the end, it do not matter how redundant, or how
1035 fault tolerant your storage is, if you do not continuously monitor its
1036 status to detect and replace failed disks.&lt;/p&gt;
1037
1038 &lt;p&gt;As usual, if you use Bitcoin and want to show your support of my
1039 activities, please send Bitcoin donations to my address
1040 &lt;b&gt;&lt;a href=&quot;bitcoin:15oWEoG9dUPovwmUL9KWAnYRtNJEkP1u1b&quot;&gt;15oWEoG9dUPovwmUL9KWAnYRtNJEkP1u1b&lt;/a&gt;&lt;/b&gt;.&lt;/p&gt;
1041 </description>
1042 </item>
1043
1044 </channel>
1045 </rss>