8. Voorstellen tot andere werkwijzes#

In Doel en bereik van het onderzoek hebben we naast het onderzoek naar de stand van zaken ook een aantal snel door te voeren technische aanbevelingen beloofd. Die zetten we in dit hoofdstuk op een rijtje. De meeste zijn work in progress waar het Woogle team op dit moment samen met vooroplopende bestuursorganen aan werkt. Actuele informatie over de activiteiten van dit team zijn te vinden op het wooverheid blog. Hier vind men ook contactgegevens.

Onze voorstellen zijn in 3 groepen verdeeld. De eerste verbeteren primair de vindbaarheid, de tweede de toegankelijkheid, en de derde eigenlijk alle vier de FAIR principes.

8.1. Maak echt werk van die machine leesbaarheid#

Dit is de makkelijkst uitvoerbare groep, met een enorm groot effect op de waarde van de openbaar gemaakte stukken: ze worden echt goed (terug)vindbaar. Alles wat we hier beschrijvan valt onder het vermijden van de SCAN en OCR.

8.1.1. Anonimiseer by design#

Heel veel stukken, waaronder Woo besluiten, worden gemaakt vanuit een sjabloon. Dit is veelal een MS Word bestand met lege velden die ingevuld worden, stukken tekst die geselecteerd of juist verwijderd worden, met daarnaast natuurlijk ruimte om het stuk aan de omstandigheid aan te passen. Tijdens dit proces kan direct in Word aangegeven worden wat weggelakt moet worden en onder welke grond. Juist bij een besluit, een beslisnota of een convenant zien we maar erg weinig tekst-redactie en veelal is dit volkomen gestandaardiseerd[1]. Op dit moment doet wooverheid onderzoek naar deze vorm van anonimiseren in samenwerking met een aantal lagere bestuursorganen.

8.1.2. Maak in Word, lak digitaal#

Voor stukken zoals een besluit of een convenant waarvan de bron in MS Word beschikbaar is, maar waar zaken in weggelakt moeten worden bevelen we de volgende werkwijze aan als het niet direct in MS Word kan: 1) bewaar het bestand in MS Word als PDF en kies dan “best for electronic publishing and accessibility”; 2) doe het weghalen van de tekst in Adobe Acrobat Pro, volgens de door Adobe gegeven richtlijnen.

8.1.3. Lak digitaal#

Is een document alleen beschikbaar als PDF, en is dit een niet gescande PDF (zoals waarschijnlijk de overgrote meerderheid van opgevraagde documenten), doe het lakken dan digitaal. Dat kan bijvoorbeeld in Adobe Acrobat Pro, maar ook in andere laksoftware die ook meehelpt bij het vinden van te lakken stukjes (zoals persoonsgegevens). Dit Woo-besluit van het Ministerie van VWS dat Zylab gebruikt voor het lakken is een voorbeeld van een document waaruit alle mens-leesbare tekst weggehaald is. Er is geen enkel machine leesbaar karakter overgebleven. Een onwenselijke situatie die ook niet voldoet aan artikel 2.4.3 van de Woo.

8.1.4. Repareer al openbaar gemaakte niet of slecht leesbare PDFs#

Dit rapport laat zien hoeveel van de stukken totaal niet of slecht machine leesbaar zijn. Dat is voor een groot deel heel makkelijk op te lossen door de OCR opnieuw met kwalitatief hoogstaande software uit te voeren. Dat kan zelfs gratis, met de open source Tesseract OCR software, die bijvoorbeeld ook is ingezet om de Woo stukken vrijgegeven na Covid 19 gerelateerde Woo-verzoeken goed machine leesbaar te maken[2].

8.2. Produceer toegankelijke documenten volgens de WCAG norm.#

Het is in de regel niet leuk om nadat een document eindelijk (en natuurlijk net op tijd) inhoudelijk af is nog eens te gaan zorgen dat het toegankelijk is voor mensen met een beperking en voldoet aan de WCAG normen. Maar het moet, en voor een groot deel kan het ook best makkelijk, mits meegenomen in de gebruikte werkwijze[3].

8.2.1. Neem de tips en tricks mee in de gehanteerde werkwijze#

Een hoop van de fouten die pdfchecker.nl aangeeft zijn heel goed te voorkomen door een (vaak éénmalige) verandering in de werkwijze. Zo is de taal waarin het document gesteld is en metadata als de auteur en de titel bijvoorbeeld al in te stellen in het sjabloon, en worden deze heel veel voorkomende fouten dus vermeden by design. Op pdfchecker.nl en de website digitoegankelijk.nl van het ministerie BZK staan goede en vaak makkelijk uitvoerbare tips. Wooverheid werkt samen met de provincie Zuid Holland en de BAR gemeentes aan dit soort sjablonen.

8.2.2. Maak een HTML versie erbij#

De overheid maakt haar documenten op tal van plekken openbaar, waaronder de website officielebekendmakingen.nl. Hier wordt vrijwel elk document, naast het vaak officiële PDF stuk, ook in een goed toegankelijke HTML versie getoond. Het is vele malen makkelijker om een HTML versie te maken die aan de WCAG eisen voldoet dan een PDF. Veel mensen met een beperking geven sowieso de voorkeur aan HTML, dus dit is een eenvoudige oplossing met hoog rendement. Vanuit MS Word kan men exporteren naar HTML, en er bestaan ook sterke transformatie programmas zoals pandoc. Woogle en wooverheid bieden voor elk PDF document een preview versie in HTML aan, waarin geprobeerd wordt zoveel mogelijk van zowel de inhoud als de vorm (opmaak als kopjes, paragrafen, opsommingen, hyperlinks, nadruk door middel van schuin of vet-gedrukt, etc) te behouden in het omzetten van (een heel vaak ingescande) PDF naar HTML. Daarmee komen we op de volgende technische aanbeveling:

8.2.3. Repareer al bestaande PDFs zo veel mogelijk#

De vorige tips gingen uit van een document wiens bronbestand in handen was. Als dat niet zo is, en het stuk is alleen beschikbaar als PDF, dan kan de PDF alleen nog gerepareerd worden. Dit kan prima. Wees hierbij realistisch en doel- en rendements-gericht. Als voor een fractie van de kosten al 80% van de WCAG fouten geheel automatisch opgelost kunnen worden, doe dat dan liever voor heel veel documenten dan slechts een beperkt aantal documenten handmatig en daardoor dus erg duur 100% goed (WCAG compliant) te krijgen. Woogle werkt volgens dit kostenefficiënte principe en repareert niet alleen de PDF maar maakt in één handeling door ook een zo goed mogelijk toegankelijke HTML versie

Heel veel van de stukken heeft helemaal niet zo’n lastige opmaak. Die kunnen voor een groot deel goed automatisch gerepareerd worden zodat ze prima kunnen worden voorgelezen.

8.3. Hergebruik en publiceer slim#

8.3.1. Maak het eigen interne systeem publiek toegankelijk#

Niet voor niets zijn informatiehuishouding en openbaarmaking samengebracht in één adviescollege. Een slim bestuursorgaan maakt gebruik van hun interacties. Zo kunnen gemeenten die het ibabs vergadersysteem gebruiken dit op allerlei manieren “openzetten voor iedereen” (via de \(<\)bestuursorgaan\(>\).bestuurlijkeinformatie.nl websites)[4]. We kunnen verwachten dat iedereen die professioneel bezig is met de Woo-documenten de makkelijk toegankelijke open versie gaat gebruiken. Er is dus direct een prikkel om dat portaal zo goed en zo open mogelijk te krijgen. Als gratis bij-effect wordt de burger dan (bijna) net zo goed bedient als de ambtenaren.

8.3.2. Lokaal is een view van een centraal systeem#

Lokale bestuursorganen als gemeentes en waterschappen zijn vaak trots op hun website en willen die er speciaal en uniek uit laten zien. Dit zien we terug in al de verschillende versies van het bestuurlijkeinformatie.nl systeem van ibabs, en vergelijkbaar voor Notubiz en de Openwebconcept gemeentes. De kracht achter die sites is dat ze eigenlijk een gelokaliseerde view zijn van een enorm database systeem dat ook de gegevens van tientallen andere bestuursorganen bevat. Met deze opzet worden twee vliegen in één klap geslagen. Ten eerste blijft de centrale database actueel, volledig en wordt gecontroleerd op fouten en omissies. Ten tweede is dit enorm kostenefficiënt: het meeste verkeer gaat lokaal, maar er is maar één infrastructuur nodig. Daarnaast kan dit draaien op een commons gedachte: verbeteringen doorgevoerd voor en betaald door één of een paar organen komen ook meteen gratis beschikbaar voor de anderen.

De Woogle database is al volledig klaar voor deze opzet: alle interactie kan gelokaliseerd worden tot een selectie van bestuursorganen en kan lopen via APIs. In feite is het maken van een op één bestuursorgaan toegesneden en totaal zelf vormgegeven Woogle een kwestie van het samenvoegen van de gebruikers-interacties via de API met de huisstijl van het bestuursorgaan. Op het moment van schrijven is Woogle dit aan het uittesten samen met de gemeente Nijmegen. Zij gebruikt nu nog de Woogle huisstijl voor haar pagina met Woo besluiten.