Un groupe d’ingénieurs tunisiens a développé une application innovante utilisant l’intelligence artificielle pour convertir d’anciens manuscrits arabes et des écrits manuels en texte modifiable. L’application, appelée “Zinki”, permet également la recherche au sein des documents arabes manuscrits et des anciennes publications arabes qui ne sont pas reconnues par d’autres méthodes de traitement.
Ce projet permettra de mettre en lumière une multitude de trésors parmi des millions de manuscrits arabes anciens qui sont restés enfermés dans des bibliothèques spécialisées depuis des siècles, limités aux seuls chercheurs.
Les manuscrits arabes ont été largement négligés jusqu’à présent, bien qu’ils représentent une richesse inestimable de la civilisation arabo-islamique au cours des siècles de son épanouissement. Selon certaines estimations, il existe au moins 3 millions de manuscrits arabes dans diverses bibliothèques spécialisées à travers le monde. L’accès à ces manuscrits était jusqu’à présent réservé aux chercheurs et aux spécialistes en matière de manuscrits, ce qui signifie que seuls quelques milliers d’entre eux ont été étudiés et imprimés.
Les avancées scientifiques et technologiques ont permis le développement de techniques de “reconnaissance optique de caractères” (OCR) qui permettent la conversion électronique des images de texte écrit, à la main ou imprimé en caractères latins, en texte modifiable.
Cependant, l’utilisation de cette technologie pour reconnaître les caractères arabes écrits à la main dans différentes polices, ou ceux présents dans les images de documents, est jusqu’à présent un sujet de recherche et de développement.
Dans ce contexte, un groupe de chercheurs et d’ingénieurs tunisiens a développé une application basée sur l’intelligence artificielle qui permet une reconnaissance précise des caractères dans les anciens manuscrits arabes, puis les convertit en texte modifiable.
La plateforme, appelée “Zinki.ai”, comprend un moteur de recherche pour les manuscrits arabes et les documents illustrés. Le moteur effectue toutes les étapes du traitement des manuscrits à l’aide de l’intelligence artificielle, allant du traitement initial du document pour améliorer la qualité de l’image à la détection de la mise en page, la division en lignes et la segmentation des mots, puis la reconnaissance optique des caractères.
Enfin, l’application “Zinki” traite le langage, analyse et ajuste le texte avec précision. Le moteur de recherche découvre le sujet du document, extrait les informations utiles et les classe. Il reconnaît également les drapeaux et effectue une correction automatique du texte, ainsi que l’indexation en plus de l’extraction automatisée des versets, des hadiths et des poèmes.
La plateforme “Zinki” offre une solution efficace pour les institutions et les chercheurs qui souhaitent convertir automatiquement les documents arabes avec précision et rapidité, tout en réduisant au minimum le temps et les efforts nécessaires. (Source: Publication en arabe d’Aljazeera)