Petter Reinholdtsen

Entries tagged "stavekontroll".

Trengs flere frivillige til korrektur av den frie norske stavekontrollen
13th October 2012

Den frie norske stavekontrollen består av ca. 1,3 millioner bokmåls- og nynorskord. Det er mange kilder til ordene, f.eks. den norske ordbanken, norske nett-aviser, stavekontrollbrukere og korrekturlesere, og endel feil har sneket seg inn i databasen over ord. For å finne og fikse feilene trengs det korrekturlesing. Her kommer frivillige inn.

Hvis du vil bidra med korrektur av orddatabasen, kan du melde deg frivillig som bokmåls- eller nynorskkorrekturleser og få tilsendt en liten bunke ord på epost hver dag, lese over og sende inn på epost tilbake til korrekturlesing-systemet. Jo flere som sjekker, jo raskere kommer vi igjennom hele databasen. Så langt har vi oppdaget 341 bokmålsord og 50 nynorskord som ikke skal vært med i databasen. Det er nok noen flere. I tillegg har korrekturleserne oppdaget flere ord som manglet, og fått lagt dem inn i stavekontrollen.

Hvis du vil bidra, følg instruksene på prosjektsidene for nye bidragsytere, og ta kontakt med Håvard eller epostlisten i18n-no. Gode norskkunnskaper er en fordel, og vilje til å sjekke ordboka et krav!

Tags: debian edu, norsk, stavekontroll.
Ny utgave (v2.1) av den frie norske stavekontrollen gitt ut
2nd October 2012

I helga fikk jeg endelig pakket sammen en ny versjon av den norske stavekontrollen, og gikk ut versjon 2.1 etter at det var gått fire og et halvt år siden sist. I dag fikk vi sendt ut annonseringen. Her er det vi sendte ut:

Oslo, 2012-10-02

Pressemelding: Ny utgave av norsk stavekontroll med synonymordliste

Mer enn fire år etter at forrige utgave av den frie norske stavekontrollen ble utgitt, er en ny og forbedret versjon klar. Dette er noe utviklerne er veldig glade for.

Den største endringen er at byggesystemet for stavekontrollen er skrevet om til å akseptere ord med bindestrek (f.eks. «e-post»). Litt over 10.000 slike ordformer er lagt til i orddatabasen. I tillegg er det kommet en del nye ord og rettelser rapportert inn av de frivillige som gjennomfører korrektur av orddatabasen i prosjektet. For å få fortgang i dette korrekturarbeidet er det fint med flere frivillige som kan bidra i prosjektet.

- En god og fritt tilgjengelig stavekontroll er en viktig byggestein for å fremme bruken av korrekt norsk språk, sier prosjektdeltager Petter Reinholdtsen.

Takket være samarbeidet med synonymordlisteprosjektet er synonymordlista for bokmål tilgjengelig sammen med ordlista for bokmål og nynorsk. En synonymordliste for nynorsk er også med, men den er på prøvestadiet og meget liten.

Stavekontrollpakken og synonymordlistene brukes i LibreOffice/OpenOffice.org, Koffice, Mozilla Thunderbird, Firefox og en rekke andre programmer, og på både Windows, Mac OS X, Linux og BSD.

Det hele utgis under den frie lisensen GPL og kan fritt lastes ned fra prosjektsidene på no.speling.org. Ferdige pakker for LibreOffice/OpenOffice.org er også tilgjengelige fra samme sted.

Det norske stavekontrollprosjektet er i kontakt med lignende prosjekter for blant annet å forbedre stavekontrollteknologien, å utveksle verktøy for vedlikehold av orddatabasen og å få tilgang til relevante datasett. Et av disse prosjektene er et separat prosjekt ved Sametinget som er i gang med å utvikle samisk stavekontroll for blant annet Microsoft Word og OpenOffice.org.

Et søsterprosjekt for å lage grammatikk-kontroll for LibreOffice/OpenOffice.org er igangsatt, men har ennå ikke kommet langt nok til å brukes. Frivillige til å bidra i dette prosjektet er også svært velkomne.

Kontaktperson

Axel Bojer, prosjektdeltager
E-post: fri_programvare (at) bojer.no
Tlf: +47 954 32 417

Referanser

Fra NEWS-fila i kildekodepakken

Release 2.1 (2012-09-30)

Tags: debian edu, norsk, stavekontroll.
Endelig norsk stavekontroll med støtte for ord med bindestrek
26th December 2008

Etter flere års mislykkede forsøk på å skrive om byggesystemet for den norske stavekontrollen for bokmål og nynorsk til å ikke bruke bindestrek som ordskillemarkør, lyktes jeg endelig første juledag. Bruken av bindestrek som ordskillemarkør har gjort det umulig å få med ord med bindestrek i stavekontrolldatagrunnlaget, slik at ord som e-post og CD-spiller ikke kunne godtas av stavekontrollen. Hadde litt tid til overs å bruke på stavekontrollen, og satte meg ned med to kopier av byggsystemet og en liten testdatafil, og byttet ut - med = på utvalgte steder i byggsystemet og datafilen helt til jeg fikk samme resultat med det gamle og det nye byggsystemet. Dette tror jeg var forsøk 4, der de foregående har feilet uten at jeg klarte å forstå hvorfor. Det sier kanskje litt om kompleksiteten i det originale byggsystemet som Rune Kleveland laget i sin tid.

Etter å ha endret byggsystemet, var neste steg å importere ordene med bindestrek. Vi har en rekke slike i databasene for bokmål og nynorsk for korrektur av datagrunnlaget for stavekontrollen, og etter importen skulle nå 10350 nye ord bli godkjent som korrekt stavede ord av stavekontrollen.

Tags: debian edu, norsk, stavekontroll.

RSS Feed

Created by Chronicle v4.6