]> pere.pagekite.me Git - homepage.git/blobdiff - blog/archive/2013/11/11.rss
Generated.
[homepage.git] / blog / archive / 2013 / 11 / 11.rss
index 10c9457157fc9868d2c78eb7894a8390ed3965a2..a855eaa074db0dd36ac9778d3c3450981039b7fa 100644 (file)
@@ -6,6 +6,66 @@
                 <link>http://people.skolelinux.org/pere/blog/</link>
 
        
+       <item>
+               <title>RSS-kilde for fritekstsøk i offentlige anbud hos Doffin</title>
+               <link>http://people.skolelinux.org/pere/blog/RSS_kilde_for_friteksts_k_i_offentlige_anbud_hos_Doffin.html</link>        
+               <guid isPermaLink="true">http://people.skolelinux.org/pere/blog/RSS_kilde_for_friteksts_k_i_offentlige_anbud_hos_Doffin.html</guid>
+                <pubDate>Fri, 22 Nov 2013 13:40:00 +0100</pubDate>
+               <description>&lt;p&gt;I fjor sommer lagde jeg en
+&lt;a href=&quot;http://people.skolelinux.org/pere/blog/SQL_database_med_anbud_publisert_p__Doffin.html&quot;&gt;offentlig
+tilgjengelig SQL-database over offentlig anbud&lt;/a&gt; basert på skraping
+av HTML-data fra Doffin.  Den har stått og gått siden da, og har nå
+ca. 28000 oppføringer.  Jeg oppdaget da jeg tittet innom at noen
+oppføringer var ikke blitt med, antagelig på grunn av at de fikk
+tildelt sekvensnummer i Doffin en godt stund før de ble publisert,
+slik at min nettsideskraper som fortsatte skrapingen der den slapp
+sist ikke fikk dem med seg.  Jeg har fikset litt slik at skraperen nå
+ser litt tilbake i tid for å se om den har gått glipp av noen
+oppføringer, og har skrapet på nytt fra midten av september 2013 og
+fremover.  Det bør dermed bli en mer komplett database for kommende
+måneder.  Hvis jeg får tid skal jeg forsøke å skrape &quot;glemte&quot; data fra
+før midten av september 2013, men tør ikke garantere at det blir
+prioritert med det første. &lt;/p&gt;
+
+&lt;p&gt;Men målet med denne bloggposten er å vise hvordan denne
+Doffin-databasen kan brukes og integreres med en RSS-leser, slik at en
+kan la datamaskinen holde et øye med Doffin-annonseringer etter
+nøkkelord.  En kan lage sitt eget søk ved å besøke
+&lt;ahref=&quot;https://classic.scraperwiki.com/docs/api?name=norwegian-doffin#sqlite&quot;&gt;API-et
+hos Scraperwiki&lt;/a&gt;, velge format rss2 og så legge inn noe ala dette i
+&quot;query in SQL&quot;:&lt;/p&gt;
+
+&lt;p&gt;&lt;pre&gt;
+select title, scrapedurl as link, abstract as description,
+       publishdate as pubDate from &#39;swdata&#39;
+   where abstract like &#39;%linux%&#39; or title like &#39;%linux%&#39;
+   order by seq desc limit 20
+&lt;/pre&gt;&lt;/p&gt;
+
+&lt;p&gt;Dette vil søke opp alle anbud med ordet linux i oppsummering eller
+tittel.  En kan lage mer avanserte søk hvis en ønsker det.  URL-en som
+dukker opp nederst på siden kan en så gi til sin RSS-leser (jeg bruker
+akregator selv), og så automatisk få beskjed hvis det dukker opp anbud
+med det aktuelle nøkkelordet i teksten.  Merk at kapasiteten hos
+Scraperwiki er begrenset, så be RSS-leseren kun hente ned en gang hver
+dag eller noe slikt.&lt;/p&gt;
+
+&lt;p&gt;Du lurer kanskje på hva slags informasjon en kan få ut fra denne
+databasen.  Her er to RSS-kilder, med søkeordet
+&quot;&lt;a href=&quot;https://api.scraperwiki.com/api/1.0/datastore/sqlite?format=rss2&amp;name=norwegian-doffin&amp;query=select%20title%2C%20scrapedurl%20as%20link%2C%20abstract%20as%20description%2C%0A%20%20%20%20%20%20%20publishdate%20as%20pubDate%20from%20&#39;swdata&#39;%0A%20%20%20where%20abstract%20like%20&#39;%25linux%25&#39;%20or%20title%20like%20&#39;%25linux%25&#39;%0A%20%20%20order%20by%20seq%20desc%20limit%2020&quot;&gt;linux&lt;/a&gt;&quot;,
+søkeordet
+&quot;&lt;a href=&quot;https://api.scraperwiki.com/api/1.0/datastore/sqlite?format=rss2&amp;name=norwegian-doffin&amp;query=select%20title%2C%20scrapedurl%20as%20link%2C%20abstract%20as%20description%2C%0A%20%20%20%20%20%20%20publishdate%20as%20pubDate%20from%20&#39;swdata&#39;%0A%20%20%20where%20abstract%20like%20&#39;%25fri%20programvare%25&#39;%20or%20title%20like%20&#39;%25fri%20programvare%25&#39;%0A%20%20%20order%20by%20seq%20desc%20limit%2020&quot;&gt;fri
+programvare&lt;/a&gt;&quot;
+og søkeordet
+&quot;&lt;a href=&quot;https://api.scraperwiki.com/api/1.0/datastore/sqlite?format=rss2&amp;name=norwegian-doffin&amp;query=select%20title%2C%20scrapedurl%20as%20link%2C%20abstract%20as%20description%2C%0A%20%20%20%20%20%20%20publishdate%20as%20pubDate%20from%20&#39;swdata&#39;%0A%20%20%20where%20abstract%20like%20&#39;%25odf%25&#39;%20or%20title%20like%20&#39;%25odf%25&#39;%0A%20%20%20order%20by%20seq%20desc%20limit%2020&quot;&gt;odf&lt;/a&gt;&quot;.
+Det er bare å søke på det en er interessert i.  Kopier gjerne
+datasettet og sett opp din egen tjeneste hvis du vil gjøre mer
+avanserte søk.  SQLite-filen med Doffin-oppføringer kan lastes med fra
+Scraperwiki for de som vil grave dypere.&lt;/p&gt;
+&lt;!-- nov 625, okt 1080, sep 1120 --&gt;
+</description>
+       </item>
+       
        <item>
                <title>All drones should be radio marked with what they do and who they belong to</title>
                <link>http://people.skolelinux.org/pere/blog/All_drones_should_be_radio_marked_with_what_they_do_and_who_they_belong_to.html</link>