Retour à SOLUTIONS

INDEXATION

L’indexation des documents

Au sens large, l’indexation comprend:

  • Des données descriptives de type de document par exemple « facture fournisseur » / « Bulletin de paie »IMG_3082
  • Des données extraites du document : par exemple, pour une facture, nom du fournisseur / date / montant HT / taux de TVA / référence commande / montant TVA / montant TTC / modalités de paiement
  • Des méta-données : date de création, auteur, … et des données spécifiques à la numérisation par scanner (par exemple celles nécessaires au respect de la norme Z42-013)

Plus l’indexation est détaillée, plus l’exploitation du document est facilitée : recherche, consultation, workflow. Ainsi, Une facture fournisseur « totalement » indexée permet la génération automatique des écritures comptables correspondantes grâce à la passerelle ad’ hoc avec le logiciel de comptabilité.

Toutefois, l’indexation n’est pas toujours facile; c’est-à-dire pas toujours « automatique ». Il s’agit donc d’atteindre le meilleur compromis en fonction des utilisations cibles: moyens d’indexation / détails d’indexation.

Les moyens d’indexation des documents « papier » numérisés entrent dans deux grandes catégories :

  • Moyens « automatiques » ou « semi-automatiques »
  • Vidéocodage

Les moyens automatiques : LAD / RAD pour la reconnaissance et la lecture automatique de documents, applicables aux documents de formats structurés ou semi-structurés (composition des pages, présence et localisation d’un logo, …)

Les moyens semi-automatiques : ROC par traitement de blocs de texte (alphanumérique) et recherche de chaînes de caractères. L’application d’un outil de ROC exige une numérisation de qualité (300 dpi)

Les moyens manuels de vidéocodage : capture des informations pertinentes par un opérateur. L’opération est souvent assistée par des saisies sur choix multiples et des contrôles de cohérence.

L’indexation des documents nativement électroniques (fichiers bureautiques) est facilitée par la « lecture » directe des méta-données du document et de son contenu.

La typologie de formats de documents et les modes d’exploitations cibles guident le choix des outils pour atteindre le compromis optimum.

2PY capitalise sur une grande variété d’expériences en tant que prestataire de services de numérisation et d’indexation pour proposer la solution qui convient le mieux au contexte du client.