]> pere.pagekite.me Git - homepage.git/blobdiff - blog/data/2015-02-12-fronter-scraper.txt
Generated.
[homepage.git] / blog / data / 2015-02-12-fronter-scraper.txt
index db6b681380893985b96a9b43174ae0a4949dbc72..d7dd3e097165d37fbed24ee20cdbb9a18e71ec4c 100644 (file)
@@ -23,25 +23,25 @@ brukbart, og jeg er dermed klar til å dele det med deg.</p>
 
 <p>Jeg startet med å skrive programmet i Python, og hadde en versjon
 som logget inn og hentet ned enkeltsider fra Fronter.  Men
-Fronter-websidene suger golfballer gjennom en hangeslange, med
+Fronter-websidene suger golfballer gjennom en hageslange, med
 uleselig HTML, flere nivåer av iframes og en struktur på innholdet som
 er svært vanskelig å finne ut av, så jeg ga til slutt opp lxml-parsing
-med python og forsøkte meg med WWW::Mechanize for Perl som jeg kjente
+med Python og forsøkte meg med WWW::Mechanize for Perl som jeg kjente
 fra før.  I ettertid har jeg oppdaget at WWW:Mechanize også finnes for
-python, så jeg kunne antagelig droppet språkbyttet.  Men da jeg
+Python, så jeg kunne antagelig droppet språkbyttet.  Men da jeg
 oppdaget det hadde jeg kommet så langt med Perl-utgaven, så jeg hoppet
 ikke tilbake.</p>
 
 <p>For å logge inn i Fronter besøker en enten skolens websider eller
-den sentrale innlogginsiden <tt>https://fronter.com/osloskoler/</tt>.
+den sentrale innloggingsiden <tt>https://fronter.com/osloskoler/</tt>.
 Perl-koden for å logge inn ser slik ut:</p>
 
 <pre>
 my $mech = WWW::Mechanize->new();
 $mech->get('https://fronter.com/osloskoler/');
 $mech->submit_form(fields => {
-    username    => $username,
-     password    => $password,
+    username => $username,
+    password => $password,
 } );
 </pre>
 
@@ -49,7 +49,7 @@ $mech->submit_form(fields => {
 På vår skole er det rom for skolen, biblioteket, elevrådet,
 aktivitetsskolen og klasser der en har unger, og dette vil være
 forskjellig fra person til person.  Etter å ha romstert rundt i
-Fronter-grensesnittet endel kom jeg over en grei HTMl-side med
+Fronter-grensesnittet endel kom jeg over en grei HTML-side med
 oversikt over rommene,
 <tt>https://fronter.com/osloskoler/adm/projects.phtml?mode=displayRoomchooser</tt>,
 så jeg bruker denne til å hente ut romoversikt med rom-ID.</p>
@@ -73,7 +73,7 @@ iframes, og en må tre nivåer ned i iframes før en får tak i
 HTML-informasjonen som vises frem når en ser på det aktuelle rommet.
 Her ga jeg opp den robuste parsingen og hardkodet endel URL-er som i
 stedet bør spores opp maskinelt.  HTML-informasjonen som vises lagres
-i en fil etter at sessjons- og innloggs-nøkkel er fjernet og deretter
+i en fil etter at økt- og innloggings-nøkkel er fjernet og deretter
 bruker jeg <tt>lynx --dump --nolist</tt> for å hente ut en tekstlig
 utgave av websiden.  Denne tekstlige utgaven sammenlignes med forrige
 versjon og oversikt over endringer kan så sendes ut på egnet vis.</p>
@@ -83,7 +83,9 @@ sjekker inn HTML og tekst-utgaver i git og bruker git til å vise frem
 endringene i tekstutgavene.  Programvaren for å gjøre dette er testet
 på Debian GNU/Linux og kan
 <a href="https://github.com/petterreinholdtsen/fronter-scraper-oslo">lastes
-ned fra github</a>.  For å bruke det, kjør følgende kommandoer på din
+ned fra github</a>.</p>
+
+<p>For å bruke dette selv, kjør følgende kommandoer på din
 Debian-maskin (forutsetter sudo-tilgang for installasjon av
 programvare):</p>
 
@@ -95,11 +97,13 @@ cd fronter-scraper-oslo
 ./update-git
 </pre>
 
-<p>Det gjenstår endel, men systemet er allerede nyttig.  Jeg ønsker at
-systemet skal laste ned PDF-er og slikt som er lagt ut på sidene, slik
-at f.eks. ukeplaner kommer inn i git-arkivet automatisk og jeg får
-beskjed når ny ukeplan er lagt ut.  Kanskje du kan bidra med å få det
-på plass?  Jeg tar gjerne imot endringer og forbedringer.  Det er mye
-som kan gjøres bedre, og scriptet er ikke veldig robust mot endringer
-hos Fronter.  Jeg regner dermed med at det vil trengs oppdateringer
-jevnlig etter hvert som Fronter-løsningen endrer seg.</p>
+<p>Det gjenstår endel, men systemet er allerede nyttig for meg.  Jeg
+ønsker at systemet også skal laste ned PDF-er og slikt som er lagt ut
+for nedlasting på sidene, slik at f.eks. ukeplaner kommer inn i
+git-arkivet mitt automatisk og jeg får automatisk beskjed når ny
+ukeplan er lagt ut.  Kanskje du kan bidra med å få det på plass, eller
+kanskje du har andre ting du vil fikse?  Jeg tar gjerne imot endringer
+og forbedringer.  Det er mye som kan gjøres bedre, og scriptet er ikke
+veldig robust mot endringer hos nettsidene til Fronter.  Jeg regner
+dermed med at det vil trengs oppdateringer jevnlig etter hvert som
+Fronter-løsningen endrer seg.</p>