AIR: OCR, herkenning en verrijking van facturen – Hoe werkt het precies?

Met ClearFacts AIR (Automatic Invoice Recognition) is het mogelijk om verkoop- en aankoopfacturen te verwerken door middel van een geïntegreerde module voor gegevensherkenning. Deze module zorgt er voor dat de relevante gegevens van een factuur machinaal worden afgelezen, herkend en verrijkt.

Facturen worden zo met een minimale inspanning omgezet in ‘te valideren boekingsvoorstellen’.

Elke factuur doorloopt 4 stappen in het AIR-verwerkingsproces. Na het aanklikken van de blauwe <Verwerken> of <Verzenden> knop in de betreffende postbus (Aankoop en Verkoop) worden achtereenvolgens volgende stappen doorlopen:

AIR Factuurverwerking

1 – Het omzetten van de factuur in een bestand met digitale tekst (OCR)

OCR staat voor Optical Character Recognition. OCR is een proces dat een afbeelding met tekst kan verwerken door de pixels om te zetten in karakters. Het scannen van een factuur kan vergeleken worden met het maken van een foto van de factuur. De computer kan hierin nog geen tekst aflezen. Via OCR- software wordt de tekst in de afbeelding herkend en wordt het ingescande document omgezet naar een bestand met digitale tekst.

De OCR binnen ClearFacts wordt online en in real-time uitgevoerd door de krachtige OCR-software van ABBYY.

2 – Het herkennen van de basisgegevens van de factuur

In de tweede stap worden aan de hand van honderden herkenningsalgoritmes de relevante basisgegevens van de factuur uit de digitale tekst gehaald.

Het betreft: Het BTW/Ondernemingsnummer van de klant/leverancier, de factuurdatum, het factuurbedrag, het factuurnummer, de vervaldatum, het IBAN Bankrekeningnummer, de gestructureerde mededeling (OGM).

Indien er een BTW/Ondernemingsnummer wordt gevonden op de factuur, worden via VIES de NAW-gegevens opgehaald van de betreffende Tegenpartij. Met name: Naam en rechtsvorm van de Leverancier of Klant, Adres en Woonplaats.

3 – Het verrijken van de basisgegevens tot een boekingsvoorstel

In de derde stap wordt de factuur omgezet in een boekingsvoorstel. Om het boekingsvoorstel te kunnen samenstellen worden de basisgegevens van de factuur gekoppeld aan de beschikbare dossiergegevens uit de boekhoudsofware.

Enkele van de acties die vervolgens worden uitgevoerd tijdens de verrijking (Stap 3):

  • Bepalen van de Tegenpartij
  • Bepalen van de Grootboekrekening
  • Bepalen van de BTW-code

Bepalen van de Tegenpartij (cascade):

Indien het [1] BTW/Ondernemingsnummer van de Tegenpartij op de factuur reeds bestaat en aanwezig is in de fiches van het betreffende dossier, wordt de Tegenpartij uit het dossier geselecteerd en overgenomen (met de NAW gegevens uit het dossier).

Indien het BTW/Ondernemingsnummer (nog) niet voorhanden is in het dossier, wordt alsnog getracht de Tegenpartij in het dossier te vinden adhv [2] een gevonden IBAN-nummer (uit Stap 2) [3] de Naam van de Tegenpartij (zoals opgehaald uit VIES – NAW) en [4] de Adresgegevens (VIES – NAW).

Indien de Tegenpartij niet kon worden teruggevonden in het dossier en een BTW/Ondernemingsnummer kon worden afgelezen van de factuur, zal een nieuwe Tegenpartij worden aangemaakt en voorgesteld op basis van de NAW gegevens die aangereikt werden door VIES (zie stap 2)

Indien er geen BTW/Ondernemingsnummer van de Tegenpartij kon worden afgelezen op de factuur (in het geval van een slecht leesbaar nummer of factuur aan een particulier), wordt er geen Tegenpartij aangemaakt in het boekingsvoorstel. Afhankelijk van de dossierinstelling [Verrijken – 

Bepalen van de Grootboekrekening (cascade):

Om de Grootboekrekening te bepalen wordt achtereenvolgens gekeken naar [1] de aanwezigheid van een standaard-rekening ingesteld op de Klant- of Leveranciersfiche binnen de boekhoudsoftware, [2] de combinatie van meest en recentst gebruikte rekening in de transactiehistoriek van de boekhoudsoftware voor de betreffende Tegenparij, [3] de laatste Grootboekrekening gebruikt in de ClearFacts boekingsvoorstellen.

Voor de verwerking van Verkoopfacturen kan een standaard verkooprekening worden ingesteld waarop geboekt zal worden indien geen andere gegevens werden gevonden via bovenstaande cascade (zie [Dossierinstellingen – Verrijken: Standaard verkooprekening]).

Wanneer er, na toepassing van de regels, toch geen Grootboekrekening kan voorgesteld worden, wordt het boekingsvoorstel aangemaakt op een Wachtrekening (999999, 499999, 499000). De Wachtrekening dient dan tijdens de validatie/correctie van het boekingsvoorstel te worden aangepast.

Bepalen van de BTW-code (cascade):

Om de BTW-code te bepalen wordt achtereenvolgens gekeken naar [1] de standaard vatcode ingesteld op 1) grootboekrekening / 2) klant- of leveranciersfiche (opgelet: voorlopig alleen in de WinBooks-connector) [2] de BTW-code gekoppeld aan de corresponderende rubriek/rekening in het ClearFacts-rubriekenschema van het dossier [Configuratie – Rubrieken resultatenrekeningen]  met de geselecteerde grootboekrekening.

Verder wordt nog een algoritme toegepast op basis van de landcode van de klant of leverancier en de klasse van de geselecteerde grootboekrekening.

Voorbeelden: Aankoop uit BE & 61 -> Goederen & diensten binnenland 21%;   Aankoop uit NL & 60 -> Intracommunautair aankopen handelsgoederen 21%

4 – Het valideren en/of corrigeren van het boekingsvoorstel

Tenslotte wordt het boekingsvoorstel gecontroleerd en gevalideerd. Afhankelijk van het resultaat wordt het voorstel in de Verzenden- of Werkllijst aangeduid met een specifieke validatiecode:

Valdiatie-codes Werklijst

. Groen – Ok: Het was technisch mogelijk om een boekingsvoorstel op te stellen dat kan ingelezen worden in de boekhoudsoftware. De basisgegevens van de factuur werden herkend en de verrijking tot boekingsvoorstel kon worden uitgevoerd.

Opgelet: deze OK-code geeft geen indicatie van de correctheid van de machinale herkenning.

. Oranje – Ok nieuw: Het was technisch mogelijk om een boekingsvoorstel op te stellen dat kan ingelezen worden in de boekhoudsoftware. De basisgegevens van de factuur werden herkend en de verrijking tot boekingsvoorstel kon worden uitgevoerd. Tijdens de verrijking werd er echter een nieuwe Tegenpartij (klant of leverancier) geïdentificeerd en aangemaakt obv het afgelezen BTW-nummer en VIES. Het verzenden van deze boekingsvoorstellen blijft mogelijk.

. Rood – OCR: Tijdens de verwerking van het document werd een technisch probleem vastgesteld in Stap 1 of 2. Hierdoor kon de verrijking (Stap 3) niet uitgevoerd worden. Er kon geen boekingsvoorstel opgesteld worden.

. Rood – Empty: De OCR (Stap 1) kon worden uitgevoerd op het document maar op basis van het resultaat van de OCR kon geen enkel basisgegeven van de factuur worden herkend (Stap 2). Er kon geen boekingsvoorstel opgesteld worden.

Ter info: De validatiecode Empty zal ook verschijnen indien het digitale pdf-document dermate beveiligd is dat er geen digitale tekst kon worden afgelezen en als gevolg daarvan ook geen van de basisgegevens herkend kon worden.

. Rood – Nok: De OCR (Stap 1) kon worden uitgevoerd op het document maar op basis van het resultaat van de OCR konden onvoldoende basisgegevens van de factuur worden herkend (Stap 2). Er kon geen volledig boekingsvoorstel opgesteld worden.

>> De annotering of opmaak van het boekingsvoorstel dient in de 3 gevallen met rode validatie-code manueel te worden afgewerkt.

. [Enkel Werklijst] Groen – Checked: Het boekingsvoorstel werd reeds geopend en nagekeken door een (kantoor)medewerker. Hierdoor wordt verondersteld dat zowel de factuurherkenning als verrijking werd gevalideerd. Deze validatiecode volgt steeds op een eerste code die werd toegekend na de automatische verwerking.

Belangrijke aanbevelingen

  • Goed leesbare scans zijn cruciaal. Het resultaat van de OCR en gegevensherkenning (Stap 1 en 2) hangt immers sterk af van de kwaliteit van de gedigitaliseerde fysieke documenten. Documenten worden bij voorkeur gescand aan 300 dpi.
  • Voorlopig worden enkel Nederlandstalige en Franstalige facturen herkend en verwerkt. Andere talen behoeven dus steeds (aanvullende) manuele annotering.
  • Vermijd de aanmaak van nieuwe klanten en leveranciers waar mogelijk. Bij de aanmaak van een nieuwe klant of leverancier door ClearFacts AIR (omdat het gevonden BTW-nummer op de factuur niet kon teruggevonden worden in het dossier – Validatiecode Ok – nieuw) kan er via de manuele annotering alsnog een bestaande tegenpartij geselecteerd worden uit de lijst van klanten of leveranciers van het dossier. Zorg in dat geval wel voor de aanvulling van de correcte BTW informatie in het dossier in de boekhoudsoftware (in de fiche van de betreffende Tegenpartij). Op die manier zal een volgende herkenning en verrijking correct gebeuren op basis van het BTW-nummer.
  • Documenten die moeilijk als factuur kunnen worden herkend en verwerkt (horeca, carwash, uitgavenstaat, …), worden best manueel geannoteerd omwille van de slechte of onvolledige gegevensherkenning.

Opgelet:

ClearFacts AIR is een volledig geautomatiseerde dienst waardoor de correctheid en volledigheid van het resultaat niet kan worden gegarandeerd voor elke verwerkte factuur.

De intelligente gegevensherkenning vervat in de ClearFacts AIR-module wordt regelmatig bijgestuurd en geoptimaliseerd met als doel de kwaliteit en de betrouwbaarheid van herkenning stap voor stap te verbeteren.

Geef een reactie