]> pere.pagekite.me Git - homepage.git/commitdiff
Generated.
authorPetter Reinholdtsen <pere@hungry.com>
Sat, 18 Nov 2017 20:20:11 +0000 (21:20 +0100)
committerPetter Reinholdtsen <pere@hungry.com>
Sat, 18 Nov 2017 20:20:11 +0000 (21:20 +0100)
blog/archive/2017/11/11.rss
blog/archive/2017/11/index.html
blog/data/2017-11-18-verk-i-det-fri-filmer.txt [new file with mode: 0644]
blog/index.html
blog/index.rss
blog/tags/english/english.rss
blog/tags/english/index.html
blog/tags/opphavsrett/index.html
blog/tags/opphavsrett/opphavsrett.rss

index 40c3bb276262569be162e888622bf8152cd517c9..6f80d4d27188eb537e841a0d1ade6c43510f6cbd 100644 (file)
                 <pubDate>Sat, 18 Nov 2017 21:20:00 +0100</pubDate>
                <description>&lt;p&gt;A month ago, I blogged about my work to automatically check the
 copyright status of IMDB entries, and try to count the number of
-movies listed in IMDB where it is legal to distribute it the Internet.
-have continued to look for good data sources, and identified a few
+movies listed in IMDB that is legal to distribute on the Internet.  I
+have continued to look for good data sources, and identified a few
 more.  The code used to extract information from various data sources
 is available in
-&lt;ahref=&quot;https://github.com/petterreinholdtsen/public-domain-free-imdb&quot;&gt;a
+&lt;a href=&quot;https://github.com/petterreinholdtsen/public-domain-free-imdb&quot;&gt;a
 git repository&lt;/a&gt;, currently available from github.&lt;/p&gt;
 
 &lt;p&gt;So far I have identified 3186 unique IMDB title IDs.  To gain
index 5784377e734d1c8ca8d56fc52354ce9ebd70e7aa..860730285e16a5910d998e28996b7649ec584699 100644 (file)
       <div class="body">
         <p>A month ago, I blogged about my work to automatically check the
 copyright status of IMDB entries, and try to count the number of
-movies listed in IMDB where it is legal to distribute it the Internet.
-have continued to look for good data sources, and identified a few
+movies listed in IMDB that is legal to distribute on the Internet.  I
+have continued to look for good data sources, and identified a few
 more.  The code used to extract information from various data sources
 is available in
-<ahref="https://github.com/petterreinholdtsen/public-domain-free-imdb">a
+<a href="https://github.com/petterreinholdtsen/public-domain-free-imdb">a
 git repository</a>, currently available from github.</p>
 
 <p>So far I have identified 3186 unique IMDB title IDs.  To gain
diff --git a/blog/data/2017-11-18-verk-i-det-fri-filmer.txt b/blog/data/2017-11-18-verk-i-det-fri-filmer.txt
new file mode 100644 (file)
index 0000000..3070e14
--- /dev/null
@@ -0,0 +1,62 @@
+Title: Legal to share more than 3000 movies listed on IMDB?
+Tags: english, opphavsrett
+Date: 2017-11-18 21:20
+
+<p>A month ago, I blogged about my work to automatically check the
+copyright status of IMDB entries, and try to count the number of
+movies listed in IMDB that is legal to distribute on the Internet.  I
+have continued to look for good data sources, and identified a few
+more.  The code used to extract information from various data sources
+is available in
+<a href="https://github.com/petterreinholdtsen/public-domain-free-imdb">a
+git repository</a>, currently available from github.</p>
+
+<p>So far I have identified 3186 unique IMDB title IDs.  To gain
+better understanding of the structure of the data set, I created a
+histogram of the year associated with each movie (typically release
+year).  It is interesting to notice where the peaks and dips in the
+graph are located.  I wonder why they are placed there.  I suspect
+World Word II caused the dip around 1940, but what caused the peak
+around 2010?</p>
+
+<p align="center"><img src="http://people.skolelinux.org/pere/blog/images/2017-11-18-verk-i-det-fri-filmer.png" /></p>
+
+<p>I've so far identified ten sources for IMDB title IDs for movies in
+the public domain or with a free license.  This is the statistics
+reported when running 'make stats' in the git repository:</p>
+
+<pre>
+  249 entries (    6 unique) with and   288 without IMDB title ID in free-movies-archive-org-butter.json
+ 2301 entries (  540 unique) with and     0 without IMDB title ID in free-movies-archive-org-wikidata.json
+  830 entries (   29 unique) with and     0 without IMDB title ID in free-movies-icheckmovies-archive-mochard.json
+ 2109 entries (  377 unique) with and     0 without IMDB title ID in free-movies-imdb-pd.json
+  291 entries (  122 unique) with and     0 without IMDB title ID in free-movies-letterboxd-pd.json
+  144 entries (  135 unique) with and     0 without IMDB title ID in free-movies-manual.json
+  350 entries (    1 unique) with and   801 without IMDB title ID in free-movies-publicdomainmovies.json
+    4 entries (    0 unique) with and   124 without IMDB title ID in free-movies-publicdomainreview.json
+  698 entries (  119 unique) with and   118 without IMDB title ID in free-movies-publicdomaintorrents.json
+    8 entries (    8 unique) with and   196 without IMDB title ID in free-movies-vodo.json
+ 3186 unique IMDB title IDs in total
+</pre>
+
+<p>The entries without IMDB title ID are candidates to increase the
+data set, but might equally well be duplicates of entries already
+listed with IMDB title ID in one of the other sources, or represent
+movies that lack a IMDB title ID.  I've seen examples of all these
+situations when peeking at the entries without IMDB title ID.  Based
+on these data sources, the lower bound for movies listed in IMDB that
+are legal to distribute on the Internet is between 3186 and 4713.
+
+<p>It would be great for improving the accuracy of this measurement,
+if the various sources added IMDB title ID to their metadata.  I have
+tried to reach the people behind the various sources to ask if they
+are interested in doing this, without any replies so far.  Perhaps you
+can help me get in touch with the people behind VODO, Public Domain
+Torrents, Public Domain Movies and Public Domain Review to try to
+convince them to add more metadata to their movie entries?</p>
+
+<p>Another way you could help is by adding pages to Wikipedia about
+movies that are legal to distribute on the Internet.  If such page
+exist and include a link to both IMDB and The Internet Archive, the
+script used to generate free-movies-archive-org-wikidata.json should
+pick up the mapping as soon as wikidata is updates.</p>
index 006bf5f6c3c4e52db0505afb7acfb141bec78d96..8570aa6d9b6f7d0619d0bd7dbd01185b58b773be 100644 (file)
       <div class="date">18th November 2017</div>
       <div class="body"><p>A month ago, I blogged about my work to automatically check the
 copyright status of IMDB entries, and try to count the number of
-movies listed in IMDB where it is legal to distribute it the Internet.
-have continued to look for good data sources, and identified a few
+movies listed in IMDB that is legal to distribute on the Internet.  I
+have continued to look for good data sources, and identified a few
 more.  The code used to extract information from various data sources
 is available in
-<ahref="https://github.com/petterreinholdtsen/public-domain-free-imdb">a
+<a href="https://github.com/petterreinholdtsen/public-domain-free-imdb">a
 git repository</a>, currently available from github.</p>
 
 <p>So far I have identified 3186 unique IMDB title IDs.  To gain
index 12c558eafa6557112429bb7d2e399499545d41c5..edab48138fdb550cb67a41482a7610a4bef3158d 100644 (file)
                 <pubDate>Sat, 18 Nov 2017 21:20:00 +0100</pubDate>
                <description>&lt;p&gt;A month ago, I blogged about my work to automatically check the
 copyright status of IMDB entries, and try to count the number of
-movies listed in IMDB where it is legal to distribute it the Internet.
-have continued to look for good data sources, and identified a few
+movies listed in IMDB that is legal to distribute on the Internet.  I
+have continued to look for good data sources, and identified a few
 more.  The code used to extract information from various data sources
 is available in
-&lt;ahref=&quot;https://github.com/petterreinholdtsen/public-domain-free-imdb&quot;&gt;a
+&lt;a href=&quot;https://github.com/petterreinholdtsen/public-domain-free-imdb&quot;&gt;a
 git repository&lt;/a&gt;, currently available from github.&lt;/p&gt;
 
 &lt;p&gt;So far I have identified 3186 unique IMDB title IDs.  To gain
index 6c7c1c7b913c9f08262cec0eb7c34fcc04071dd1..f9a2f48c1d86acb6aba962525baa84895b8df047 100644 (file)
                 <pubDate>Sat, 18 Nov 2017 21:20:00 +0100</pubDate>
                <description>&lt;p&gt;A month ago, I blogged about my work to automatically check the
 copyright status of IMDB entries, and try to count the number of
-movies listed in IMDB where it is legal to distribute it the Internet.
-have continued to look for good data sources, and identified a few
+movies listed in IMDB that is legal to distribute on the Internet.  I
+have continued to look for good data sources, and identified a few
 more.  The code used to extract information from various data sources
 is available in
-&lt;ahref=&quot;https://github.com/petterreinholdtsen/public-domain-free-imdb&quot;&gt;a
+&lt;a href=&quot;https://github.com/petterreinholdtsen/public-domain-free-imdb&quot;&gt;a
 git repository&lt;/a&gt;, currently available from github.&lt;/p&gt;
 
 &lt;p&gt;So far I have identified 3186 unique IMDB title IDs.  To gain
index c09cc83da81a70e79e6409e4735f547fab8d0dcc..32a1785f528d228f7561aaa93b6eac935b60977c 100644 (file)
       <div class="body">
         <p>A month ago, I blogged about my work to automatically check the
 copyright status of IMDB entries, and try to count the number of
-movies listed in IMDB where it is legal to distribute it the Internet.
-have continued to look for good data sources, and identified a few
+movies listed in IMDB that is legal to distribute on the Internet.  I
+have continued to look for good data sources, and identified a few
 more.  The code used to extract information from various data sources
 is available in
-<ahref="https://github.com/petterreinholdtsen/public-domain-free-imdb">a
+<a href="https://github.com/petterreinholdtsen/public-domain-free-imdb">a
 git repository</a>, currently available from github.</p>
 
 <p>So far I have identified 3186 unique IMDB title IDs.  To gain
index a510f9a9bfd0120fe0a94444b4ca38badf5c87f8..fb4cf94fea916fc14ff24aff00d00f4643c1d6c1 100644 (file)
       <div class="body">
         <p>A month ago, I blogged about my work to automatically check the
 copyright status of IMDB entries, and try to count the number of
-movies listed in IMDB where it is legal to distribute it the Internet.
-have continued to look for good data sources, and identified a few
+movies listed in IMDB that is legal to distribute on the Internet.  I
+have continued to look for good data sources, and identified a few
 more.  The code used to extract information from various data sources
 is available in
-<ahref="https://github.com/petterreinholdtsen/public-domain-free-imdb">a
+<a href="https://github.com/petterreinholdtsen/public-domain-free-imdb">a
 git repository</a>, currently available from github.</p>
 
 <p>So far I have identified 3186 unique IMDB title IDs.  To gain
index b9a2b3ba4aff2a4f6fd8e746883fe5f02c46bdc9..21918499bcec5192183edea07176bbfe3db9a72d 100644 (file)
                 <pubDate>Sat, 18 Nov 2017 21:20:00 +0100</pubDate>
                <description>&lt;p&gt;A month ago, I blogged about my work to automatically check the
 copyright status of IMDB entries, and try to count the number of
-movies listed in IMDB where it is legal to distribute it the Internet.
-have continued to look for good data sources, and identified a few
+movies listed in IMDB that is legal to distribute on the Internet.  I
+have continued to look for good data sources, and identified a few
 more.  The code used to extract information from various data sources
 is available in
-&lt;ahref=&quot;https://github.com/petterreinholdtsen/public-domain-free-imdb&quot;&gt;a
+&lt;a href=&quot;https://github.com/petterreinholdtsen/public-domain-free-imdb&quot;&gt;a
 git repository&lt;/a&gt;, currently available from github.&lt;/p&gt;
 
 &lt;p&gt;So far I have identified 3186 unique IMDB title IDs.  To gain