[Php-it] Riconoscimento del testo

Domenico L. domenico.lorusso at pleiade.it
Thu Sep 13 12:36:34 CEST 2007


Cristiano Verondini ha scritto:
> 	Per come hai posto il problema, credo che la soluzione non sia  
> particolarmente semplice! Soprattutto la parte di riconoscimento e  
> correzione non è banale, visto che gli errori di ortografia possono  
> omettere caratteri, sbagliare caratteri, invertire caratteri e così via.
>
> 	Il fatto che esistano algoritmi non significa che siano di facile  
> implementazione. Pensa solo all'esplosione combinatoria che hai se a  
> partire da una parola devi esplorare tutti i possibili 'errori' che  
> vuoi essere in grado di correggere. Oltretutto questa correzione  
> potrebbe non essere univoca (la stessa parola può essere corretta in  
> modi diversi).
>   
Ma ho un dizionario finito (e molto limitato) di parole da controllare 
es.: se titolo mi scrivi
Amnistratore Delgato (notare la *n* e la mancanza della *e*) vorrei 
correggerlo in Amministratore Delegato

Pensavo di usare una funzione di calcolo di distanza stringa e una 
condizione del tipo:
se distanza inferiore a x sostituisci altrimenti lascia invariato

> 	Secondo me devi partire da specifiche molto ben definite, e in base  
> a queste fare qualche valutazione, ma sinceramente non vedo il  
> problema così semplice! :)
>   
Non è semplicissimo, ma più semplice che trasformare una implementazione 
scalre in una vettoriale... oltre questo, c'è un inserimento guidato 
(che però può non essere utilizzato)


Ho in mente anche una certa precedenza sui controlli:
es.: non riconosco il titolo, ma la riga è ben formattata -> mi fido 
dell'utente, ha usato un titolo lecito ma che non riconosco (cosa possibile)

Quindi mi servirebbe fare i controlli che ho definito prima uno per 
volta e memorizzare il result, poi fare considerazioni su come 
comportarmi (se richiedere l'inserimento, ripulire l'input, accettarlo 
così com'è o una cosa a metà)

Spero di essermi spiegato meglio


Ciao!

-- 
Domenico L.        	 icq: 645 44 861 - msn: strahd a jumpy.it

per stupire mezz'ora basta un libro di storia,
io cercai di imparare la Treccani a memoria... [F.d.A.]



More information about the Php-it mailing list