DETOURAGE TRAITEMENT DE L' INFORMATION TEXTUELLENPAI SAMWEBCRYPTAGE

Traitement de l'information textuelle

Le traitement de l'information textuelle et les diiférentes analyses

Dans le premier atelier, vous avez découvert ou redécouvert l'étendue des savoir-faire de API en ce qui concerne le traitement de l'image numérisée. Dans ce second atelier, nous vous proposons maintenant d'entrer dans le document, c'est-à-dire d'en extraire le texte utile et pertinent. Imaginez un instant pouvoir mettre en place une veille concurrentielle (sur des entreprises ou des acteurs politiques) à partir de piges de presse. Les informations seraient ainsi recueillies intelligemment et automatiquement. Ce résultat peut être obtenu avec l'utilisation de traitements sur l'information textuelle. A partir d'une image numérisée, une étape préalable d'OCR est nécessaire.

1. L'OCR, reconnaissance automatique de caractères, consiste à analyser des ensembles de points pour les rapprocher de formes de caractères utilisés. C'est un traitement qui tend maintenant à se généraliser et vous trouvez sur le marché des logiciels performants. Nous ne voulons pas perdre de temps à écrire de nouveaux logiciels. Notre expertise en OCR réside dans l'adaptation et l'usage combiné de ces outils pour atteindre un résultat optimal de façon automatisée.

2. C'est ensuite l'étape du traitement textuel.
C'est une étape à forte valeur ajoutée qui se décompose en trois opérations ( " morphologique ", " syntaxique " et " sémantique ") :

  • l'analyse morphologique permet de reconstituer des mots à partir des lettres identifiées et de référentiels orthographiques
  • l'analyse syntaxique permet de reconstituer des phrases à partir des mots identifiés (en fonction de la place qu'un mot occupe dans la phrase, on peut déduire s'il s'agit de sujet, de verbe ou de complément)
  • l'analyse sémantique permet d'analyser le sens de la phrase en fonction des mots employés et du contexte de la phrase

Ces opérations de traitement de l'information textuelle vont permettre de baliser et d'indexer le document. L'automate pourra alors appliquer automatiquement une mise en forme et créer des résumés.

3. Après ces traitements, nous re-matérialisons l'information dans le format le plus adapté à l'environnement de nos clients.

Rubrique : ATELIERS Retour : Haut de page
SOCIETE API QUALITÉ METIERS ACTUALITÉS INFOS LÉGALES
Questions et réponses sur la FAQ!

accueil

ateleir mobile




prestation

actulites

Pour visualiser ces vidéos vous devez télécharger le lecteur gratuit Real Player :

Pour visualiser les animations Flash vous pouvez télécharger le lecteur gratuit Flash Player :