X-Git-Url: https://pere.pagekite.me/gitweb/homepage.git/blobdiff_plain/f5ef4a6d1f8266f22f65706f4554138b98e6826a..0f48df8106ad866e7572f0f0961dd7735c80766b:/blog/index.rss diff --git a/blog/index.rss b/blog/index.rss index 3c9f4c5a6e..8a0826dec4 100644 --- a/blog/index.rss +++ b/blog/index.rss @@ -6,6 +6,66 @@ http://people.skolelinux.org/pere/blog/ + + RSS-kilde for fritekstsøk i offentlige anbud hos Doffin + http://people.skolelinux.org/pere/blog/RSS_kilde_for_friteksts_k_i_offentlige_anbud_hos_Doffin.html + http://people.skolelinux.org/pere/blog/RSS_kilde_for_friteksts_k_i_offentlige_anbud_hos_Doffin.html + Fri, 22 Nov 2013 13:40:00 +0100 + <p>I fjor sommer lagde jeg en +<a href="http://people.skolelinux.org/pere/blog/SQL_database_med_anbud_publisert_p__Doffin.html">offentlig +tilgjengelig SQL-database over offentlig anbud</a> basert på skraping +av HTML-data fra Doffin. Den har stått og gått siden da, og har nå +ca. 28000 oppføringer. Jeg oppdaget da jeg tittet innom at noen +oppføringer var ikke blitt med, antagelig på grunn av at de fikk +tildelt sekvensnummer i Doffin en godt stund før de ble publisert, +slik at min nettsideskraper som fortsatte skrapingen der den slapp +sist ikke fikk dem med seg. Jeg har fikset litt slik at skraperen nå +ser litt tilbake i tid for å se om den har gått glipp av noen +oppføringer, og har skrapet på nytt fra midten av september 2013 og +fremover. Det bør dermed bli en mer komplett database for kommende +måneder. Hvis jeg får tid skal jeg forsøke å skrape "glemte" data fra +før midten av september 2013, men tør ikke garantere at det blir +prioritert med det første. </p> + +<p>Men målet med denne bloggposten er å vise hvordan denne +Doffin-databasen kan brukes og integreres med en RSS-leser, slik at en +kan la datamaskinen holde et øye med Doffin-annonseringer etter +nøkkelord. En kan lage sitt eget søk ved å besøke +<ahref="https://classic.scraperwiki.com/docs/api?name=norwegian-doffin#sqlite">API-et +hos Scraperwiki</a>, velge format rss2 og så legge inn noe ala dette i +"query in SQL":</p> + +<p><pre> +select title, scrapedurl as link, abstract as description, + publishdate as pubDate from 'swdata' + where abstract like '%linux%' or title like '%linux%' + order by seq desc limit 20 +</pre></p> + +<p>Dette vil søke opp alle anbud med ordet linux i oppsummering eller +tittel. En kan lage mer avanserte søk hvis en ønsker det. URL-en som +dukker opp nederst på siden kan en så gi til sin RSS-leser (jeg bruker +akregator selv), og så automatisk få beskjed hvis det dukker opp anbud +med det aktuelle nøkkelordet i teksten. Merk at kapasiteten hos +Scraperwiki er begrenset, så be RSS-leseren kun hente ned en gang hver +dag eller noe slikt.</p> + +<p>Du lurer kanskje på hva slags informasjon en kan få ut fra denne +databasen. Her er to RSS-kilder, med søkeordet +"<a href="https://api.scraperwiki.com/api/1.0/datastore/sqlite?format=rss2&name=norwegian-doffin&query=select%20title%2C%20scrapedurl%20as%20link%2C%20abstract%20as%20description%2C%0A%20%20%20%20%20%20%20publishdate%20as%20pubDate%20from%20'swdata'%0A%20%20%20where%20abstract%20like%20'%25linux%25'%20or%20title%20like%20'%25linux%25'%0A%20%20%20order%20by%20seq%20desc%20limit%2020">linux</a>", +søkeordet +"<a href="https://api.scraperwiki.com/api/1.0/datastore/sqlite?format=rss2&name=norwegian-doffin&query=select%20title%2C%20scrapedurl%20as%20link%2C%20abstract%20as%20description%2C%0A%20%20%20%20%20%20%20publishdate%20as%20pubDate%20from%20'swdata'%0A%20%20%20where%20abstract%20like%20'%25fri%20programvare%25'%20or%20title%20like%20'%25fri%20programvare%25'%0A%20%20%20order%20by%20seq%20desc%20limit%2020">fri +programvare</a>" +og søkeordet +"<a href="https://api.scraperwiki.com/api/1.0/datastore/sqlite?format=rss2&name=norwegian-doffin&query=select%20title%2C%20scrapedurl%20as%20link%2C%20abstract%20as%20description%2C%0A%20%20%20%20%20%20%20publishdate%20as%20pubDate%20from%20'swdata'%0A%20%20%20where%20abstract%20like%20'%25odf%25'%20or%20title%20like%20'%25odf%25'%0A%20%20%20order%20by%20seq%20desc%20limit%2020">odf</a>". +Det er bare å søke på det en er interessert i. Kopier gjerne +datasettet og sett opp din egen tjeneste hvis du vil gjøre mer +avanserte søk. SQLite-filen med Doffin-oppføringer kan lastes med fra +Scraperwiki for de som vil grave dypere.</p> +<!-- nov 625, okt 1080, sep 1120 --> + + + All drones should be radio marked with what they do and who they belong to http://people.skolelinux.org/pere/blog/All_drones_should_be_radio_marked_with_what_they_do_and_who_they_belong_to.html @@ -691,38 +751,5 @@ libspykee-perl github repository</a>.</p> - - Good causes: Debian Outreach Program for Women, EFF documenting the spying and Open access in Norway - http://people.skolelinux.org/pere/blog/Good_causes__Debian_Outreach_Program_for_Women__EFF_documenting_the_spying_and_Open_access_in_Norway.html - http://people.skolelinux.org/pere/blog/Good_causes__Debian_Outreach_Program_for_Women__EFF_documenting_the_spying_and_Open_access_in_Norway.html - Tue, 15 Oct 2013 21:30:00 +0200 - <p>The last few days I came across a few good causes that should get -wider attention. I recommend signing and donating to each one of -these. :)</p> - -<p>Via <a href="http://www.debian.org/News/weekly/2013/18/">Debian -Project News for 2013-10-14</a> I came across the Outreach Program for -Women program which is a Google Summer of Code like initiative to get -more women involved in free software. One debian sponsor has offered -to match <a href="http://debian.ch/opw2013">any donation done to Debian -earmarked</a> for this initiative. I donated a few minutes ago, and -hope you will to. :)</p> - -<p>And the Electronic Frontier Foundation just announced plans to -create <a href="https://supporters.eff.org/donate/nsa-videos">video -documentaries about the excessive spying</a> on every Internet user that -take place these days, and their need to fund the work. I've already -donated. Are you next?</p> - -<p>For my Norwegian audience, the organisation Studentenes og -Akademikernes Internasjonale Hjelpefond is collecting signatures for a -statement under the heading -<a href="http://saih.no/Bloggers_United/">Bloggers United for Open -Access</a> for those of us asking for more focus on open access in the -Norwegian government. So far 499 signatures. I hope you will sign it -too.</p> - - -