OCR - Océrisation
Reconnaissance de caractères - LAD - RAD
L’OCR est à l’imprimé ce que la LAD est au manuscrit… contraint.
En quoi consiste la reconnaissance automatique de textes OCR ou océrisation ?
Il existe deux types de textes, l'imprimé ou le manuscrit.
La reconnaissance de l'un et de l'autre ne met pas en oeuvre les mêmes technologies.
• L'imprimé
Beaucoup d'entre nous savent utiliser un OCR. C'est un outil, de plus en plus performant, qui reconnaîtra des lettres, des signes ou des espaces, et ce, par la présence ou l'absence sur une grille de ces points noirs que l'on appelle pixels. L'OCR les transformera alors en caractères informatiques.
• Le manuscrit
La simple analyse d'un point sur une abscisse et une ordonnée ne suffit plus ! Il faut alors prendre en considération une troisième dimension qui est celle du temps, ou du déplacement.
La reconnaissance des textes manuscrits fait appel à des technologies de pointe (réseaux de neurones, modèles de markov, réseaux bagésieus...) élaborées dans les laboratoires de recherche dont le leader est notre éminent confrère ITESOFT.

