
Un logicial de ROC permet de trapar lo tèxt d’un fichièr numerizat tal coma un imatge, atal òm pòt trabalhar amb un contengut texutal e realizar de copiar-pegar per exemple. Per dire de tractar los documents numerizats los motors de ROC fan mestièr la lista dels caractèrs de la lenga mas tanben una lista de mots, complèta tan que possible. En emplegant aquesta tièra de mots lo motor pòt ajustar sas prediccions de reconeissença.
Fonts liuras
Per ajudar los motors liures metèm a disposicion sus aqueste site un archiu que conten mai de 1 208 229 entradas traidas del diccionari Hunspell. Generalament demandan una basa d’almens 50 000 entradas per entrainar los motors. Accedissètz als archius vejatz aicí.
Listas dels motors
Nom | Descripcion | |
---|---|---|
Tesseract OCR | Un dels motors mai utilizat pels logicials liures mas tanben comercials. L’universitat de Tolosa Joan Jaurès al Miralh provesís un jòc d’entrainament telecargable aquí | |
EasyOCR | Motor de ROC per 70 lengas, l’occitan ne formava part quand n’i aviá pas que 40. Informacions aquí sul repaus GitHub EasyOCR | |
PaddleOCR | ... |