- <item>
- <title>RSS-kilde for fritekstsøk i offentlige anbud hos Doffin</title>
- <link>http://people.skolelinux.org/pere/blog/RSS_kilde_for_friteksts_k_i_offentlige_anbud_hos_Doffin.html</link>
- <guid isPermaLink="true">http://people.skolelinux.org/pere/blog/RSS_kilde_for_friteksts_k_i_offentlige_anbud_hos_Doffin.html</guid>
- <pubDate>Fri, 22 Nov 2013 13:40:00 +0100</pubDate>
- <description><p>I fjor sommer lagde jeg en
-<a href="http://people.skolelinux.org/pere/blog/SQL_database_med_anbud_publisert_p__Doffin.html">offentlig
-tilgjengelig SQL-database over offentlig anbud</a> basert på skraping
-av HTML-data fra Doffin. Den har stått og gått siden da, og har nå
-ca. 28000 oppføringer. Jeg oppdaget da jeg tittet innom at noen
-oppføringer var ikke blitt med, antagelig på grunn av at de fikk
-tildelt sekvensnummer i Doffin en godt stund før de ble publisert,
-slik at min nettsideskraper som fortsatte skrapingen der den slapp
-sist ikke fikk dem med seg. Jeg har fikset litt slik at skraperen nå
-ser litt tilbake i tid for å se om den har gått glipp av noen
-oppføringer, og har skrapet på nytt fra midten av september 2013 og
-fremover. Det bør dermed bli en mer komplett database for kommende
-måneder. Hvis jeg får tid skal jeg forsøke å skrape "glemte" data fra
-før midten av september 2013, men tør ikke garantere at det blir
-prioritert med det første. </p>
-
-<p>Men målet med denne bloggposten er å vise hvordan denne
-Doffin-databasen kan brukes og integreres med en RSS-leser, slik at en
-kan la datamaskinen holde et øye med Doffin-annonseringer etter
-nøkkelord. En kan lage sitt eget søk ved å besøke
-<ahref="https://classic.scraperwiki.com/docs/api?name=norwegian-doffin#sqlite">API-et
-hos Scraperwiki</a>, velge format rss2 og så legge inn noe ala dette i
-"query in SQL":</p>
-
-<p><pre>
-select title, scrapedurl as link, abstract as description,
- publishdate as pubDate from 'swdata'
- where abstract like '%linux%' or title like '%linux%'
- order by seq desc limit 20
-</pre></p>
-
-<p>Dette vil søke opp alle anbud med ordet linux i oppsummering eller
-tittel. En kan lage mer avanserte søk hvis en ønsker det. URL-en som
-dukker opp nederst på siden kan en så gi til sin RSS-leser (jeg bruker
-akregator selv), og så automatisk få beskjed hvis det dukker opp anbud
-med det aktuelle nøkkelordet i teksten. Merk at kapasiteten og
-ytelsen hos Scraperwiki er begrenset, så ikke be RSS-leseren hente ned
-oftere enn en gang hver dag.</p>
-
-<p>Du lurer kanskje på hva slags informasjon en kan få ut fra denne
-databasen. Her er to RSS-kilder, med søkeordet
-"<a href="https://api.scraperwiki.com/api/1.0/datastore/sqlite?format=rss2&name=norwegian-doffin&query=select%20title%2C%20scrapedurl%20as%20link%2C%20abstract%20as%20description%2C%0A%20%20%20%20%20%20%20publishdate%20as%20pubDate%20from%20'swdata'%0A%20%20%20where%20abstract%20like%20'%25linux%25'%20or%20title%20like%20'%25linux%25'%0A%20%20%20order%20by%20seq%20desc%20limit%2020">linux</a>",
-søkeordet
-"<a href="https://api.scraperwiki.com/api/1.0/datastore/sqlite?format=rss2&name=norwegian-doffin&query=select%20title%2C%20scrapedurl%20as%20link%2C%20abstract%20as%20description%2C%0A%20%20%20%20%20%20%20publishdate%20as%20pubDate%20from%20'swdata'%0A%20%20%20where%20abstract%20like%20'%25fri%20programvare%25'%20or%20title%20like%20'%25fri%20programvare%25'%0A%20%20%20order%20by%20seq%20desc%20limit%2020">fri
-programvare</a>"
-og søkeordet
-"<a href="https://api.scraperwiki.com/api/1.0/datastore/sqlite?format=rss2&name=norwegian-doffin&query=select%20title%2C%20scrapedurl%20as%20link%2C%20abstract%20as%20description%2C%0A%20%20%20%20%20%20%20publishdate%20as%20pubDate%20from%20'swdata'%0A%20%20%20where%20abstract%20like%20'%25odf%25'%20or%20title%20like%20'%25odf%25'%0A%20%20%20order%20by%20seq%20desc%20limit%2020">odf</a>".
-Det er bare å søke på det en er interessert i. Kopier gjerne
-datasettet og sett opp din egen tjeneste hvis du vil gjøre mer
-avanserte søk. SQLite-filen med Doffin-oppføringer kan lastes med fra
-Scraperwiki for de som vil grave dypere.</p>
-</description>
- </item>
-