]> pere.pagekite.me Git - homepage.git/blobdiff - blog/archive/2013/11/index.html
Generated.
[homepage.git] / blog / archive / 2013 / 11 / index.html
index 7a98fc8b98f9db4b15cad76c290116d95cfb7e30..e65ebb4c71a33a7df5e7b120275e205e765c57af 100644 (file)
 
     <h3>Entries from November 2013.</h3>
     
+    <div class="entry">
+      <div class="title">
+        <a href="http://people.skolelinux.org/pere/blog/RSS_kilde_for_friteksts_k_i_offentlige_anbud_hos_Doffin.html">RSS-kilde for fritekstsøk i offentlige anbud hos Doffin</a>
+      </div>
+      <div class="date">
+        22nd November 2013
+      </div>
+      <div class="body">
+        <p>I fjor sommer lagde jeg en
+<a href="http://people.skolelinux.org/pere/blog/SQL_database_med_anbud_publisert_p__Doffin.html">offentlig
+tilgjengelig SQL-database over offentlig anbud</a> basert på skraping
+av HTML-data fra Doffin.  Den har stått og gått siden da, og har nå
+ca. 28000 oppføringer.  Jeg oppdaget da jeg tittet innom at noen
+oppføringer var ikke blitt med, antagelig på grunn av at de fikk
+tildelt sekvensnummer i Doffin en godt stund før de ble publisert,
+slik at min nettsideskraper som fortsatte skrapingen der den slapp
+sist ikke fikk dem med seg.  Jeg har fikset litt slik at skraperen nå
+ser litt tilbake i tid for å se om den har gått glipp av noen
+oppføringer, og har skrapet på nytt fra midten av september 2013 og
+fremover.  Det bør dermed bli en mer komplett database for kommende
+måneder.  Hvis jeg får tid skal jeg forsøke å skrape "glemte" data fra
+før midten av september 2013, men tør ikke garantere at det blir
+prioritert med det første. </p>
+
+<p>Men målet med denne bloggposten er å vise hvordan denne
+Doffin-databasen kan brukes og integreres med en RSS-leser, slik at en
+kan la datamaskinen holde et øye med Doffin-annonseringer etter
+nøkkelord.  En kan lage sitt eget søk ved å besøke
+<ahref="https://classic.scraperwiki.com/docs/api?name=norwegian-doffin#sqlite">API-et
+hos Scraperwiki</a>, velge format rss2 og så legge inn noe ala dette i
+"query in SQL":</p>
+
+<p><pre>
+select title, scrapedurl as link, abstract as description,
+       publishdate as pubDate from 'swdata'
+   where abstract like '%linux%' or title like '%linux%'
+   order by seq desc limit 20
+</pre></p>
+
+<p>Dette vil søke opp alle anbud med ordet linux i oppsummering eller
+tittel.  En kan lage mer avanserte søk hvis en ønsker det.  URL-en som
+dukker opp nederst på siden kan en så gi til sin RSS-leser (jeg bruker
+akregator selv), og så automatisk få beskjed hvis det dukker opp anbud
+med det aktuelle nøkkelordet i teksten.  Merk at kapasiteten hos
+Scraperwiki er begrenset, så be RSS-leseren kun hente ned en gang hver
+dag eller noe slikt.</p>
+
+<p>Du lurer kanskje på hva slags informasjon en kan få ut fra denne
+databasen.  Her er to RSS-kilder, med søkeordet
+"<a href="https://api.scraperwiki.com/api/1.0/datastore/sqlite?format=rss2&name=norwegian-doffin&query=select%20title%2C%20scrapedurl%20as%20link%2C%20abstract%20as%20description%2C%0A%20%20%20%20%20%20%20publishdate%20as%20pubDate%20from%20'swdata'%0A%20%20%20where%20abstract%20like%20'%25linux%25'%20or%20title%20like%20'%25linux%25'%0A%20%20%20order%20by%20seq%20desc%20limit%2020">linux</a>",
+søkeordet
+"<a href="https://api.scraperwiki.com/api/1.0/datastore/sqlite?format=rss2&name=norwegian-doffin&query=select%20title%2C%20scrapedurl%20as%20link%2C%20abstract%20as%20description%2C%0A%20%20%20%20%20%20%20publishdate%20as%20pubDate%20from%20'swdata'%0A%20%20%20where%20abstract%20like%20'%25fri%20programvare%25'%20or%20title%20like%20'%25fri%20programvare%25'%0A%20%20%20order%20by%20seq%20desc%20limit%2020">fri
+programvare</a>"
+og søkeordet
+"<a href="https://api.scraperwiki.com/api/1.0/datastore/sqlite?format=rss2&name=norwegian-doffin&query=select%20title%2C%20scrapedurl%20as%20link%2C%20abstract%20as%20description%2C%0A%20%20%20%20%20%20%20publishdate%20as%20pubDate%20from%20'swdata'%0A%20%20%20where%20abstract%20like%20'%25odf%25'%20or%20title%20like%20'%25odf%25'%0A%20%20%20order%20by%20seq%20desc%20limit%2020">odf</a>".
+Det er bare å søke på det en er interessert i.  Kopier gjerne
+datasettet og sett opp din egen tjeneste hvis du vil gjøre mer
+avanserte søk.  SQLite-filen med Doffin-oppføringer kan lastes med fra
+Scraperwiki for de som vil grave dypere.</p>
+<!-- nov 625, okt 1080, sep 1120 -->
+
+      </div>
+      <div class="tags">
+        
+        
+        Tags: <a href="http://people.skolelinux.org/pere/blog/tags/norsk">norsk</a>, <a href="http://people.skolelinux.org/pere/blog/tags/nuug">nuug</a>, <a href="http://people.skolelinux.org/pere/blog/tags/offentlig innsyn">offentlig innsyn</a>.
+        
+        
+      </div>
+    </div>
+    <div class="padding"></div>
+    
     <div class="entry">
       <div class="title">
         <a href="http://people.skolelinux.org/pere/blog/All_drones_should_be_radio_marked_with_what_they_do_and_who_they_belong_to.html">All drones should be radio marked with what they do and who they belong to</a>
@@ -532,7 +604,7 @@ NEW.  I hope it will be available in Debian in a few days.</p>
 
 <li><a href="http://people.skolelinux.org/pere/blog/archive/2013/10/">October (7)</a></li>
 
-<li><a href="http://people.skolelinux.org/pere/blog/archive/2013/11/">November (5)</a></li>
+<li><a href="http://people.skolelinux.org/pere/blog/archive/2013/11/">November (6)</a></li>
 
 </ul></li>
 
@@ -720,11 +792,11 @@ NEW.  I hope it will be available in Debian in a few days.</p>
 
  <li><a href="http://people.skolelinux.org/pere/blog/tags/multimedia">multimedia (25)</a></li>
 
- <li><a href="http://people.skolelinux.org/pere/blog/tags/norsk">norsk (236)</a></li>
+ <li><a href="http://people.skolelinux.org/pere/blog/tags/norsk">norsk (237)</a></li>
 
- <li><a href="http://people.skolelinux.org/pere/blog/tags/nuug">nuug (158)</a></li>
+ <li><a href="http://people.skolelinux.org/pere/blog/tags/nuug">nuug (159)</a></li>
 
- <li><a href="http://people.skolelinux.org/pere/blog/tags/offentlig innsyn">offentlig innsyn (8)</a></li>
+ <li><a href="http://people.skolelinux.org/pere/blog/tags/offentlig innsyn">offentlig innsyn (9)</a></li>
 
  <li><a href="http://people.skolelinux.org/pere/blog/tags/open311">open311 (2)</a></li>