OCR - Océrisation
En quoi consiste
la reconnaissance automatique de textes ( OCR ou océrisation ) ?
Il existe deux types de textes l'imprimé ou le manuscrit. La reconnaissance de
l'un et de l'autre ne met pas en uvre les mêmes technologies.
L'imprimé
Beaucoup d'entre nous savent utiliser un OCR. C'est un outil, plus ou moins performant qui
reconnaîtra des lettres, des signes ou des espaces, et ce, par la présence
ou l'absence sur une grille de ces points noirs que l'on appelle pixels. L'OCR les transformera
alors en caractères informatiques.
Le manuscrit
La simple analyse d'un point sur une abscisse et une ordonnée ne suffit plus ! Il
faut alors prendre en considération une troisième dimension qui est celle
du temps, ou du déplacement. La reconnaissance des textes manuscrits fait appel à
des technologies de pointe (réseaux de neurones, modèles de markov, réseaux
bagésieus...) élaborées dans les laboratoires de recherche.
|