Abstract:
La numérisation massive des documents patrimoniaux ouvre de nouvelles
perspectives de Recherche comme celle de la restauration des documents dégradés. Ces
dégradations peuvent être dues au mauvais état de conservation du document, comme
elles peuvent être induite à la numérisation elle même. De telles altérations sur les
images quelles soient insignifiantes où complexes, ne peuvent pas être traitées par une
simple transposition des outils traditionnels de restauration numérique. Cette thèse va
aborder le domaine de la restauration numérique des dégradations des images des
documents historiques, et plus particulièrement des dégradations du support papier et
des formes des lettres et des éléments car elles nuisent à la lisibilité des documents
numérisés et empêchent tout traitement automatisé.
Dans ce travail, nous présentons différentes méthodes de binarisation qui sont
utilisées pour la restauration des documents historiques fortement dégradés, en
générale dans ce type de dégradation, l’identification des différentes formes des lettres
et plus en moins difficile. Cette difficulté rend un prétraitement nécessaire afin
d’améliorer la qualité des documents. La première partie de ce travail est consacrée aux
techniques de binarisations des d’images, et la deuxième partie concerne les critères
d’évaluation des méthodes de binarisations.
Pour concevoir une approche capable de restaurer à la fois les dégradations du
support papier et des formes des lettres, nous proposons une combinaison entre la
méthode de sauvola et la méthode de classification pixellaire par maximum de
vraisemblance. Cette combinaison permet de réaliser une meilleur binarisation des
images des documents historiques tout en préservant la forme des traits de texte
surtout dans les régions de faible intensité où la densité est approximative au fond du
document.