[Php-it] Riconoscimento del testo
Domenico L.
domenico.lorusso at pleiade.it
Thu Sep 13 12:36:34 CEST 2007
Cristiano Verondini ha scritto:
> Per come hai posto il problema, credo che la soluzione non sia
> particolarmente semplice! Soprattutto la parte di riconoscimento e
> correzione non è banale, visto che gli errori di ortografia possono
> omettere caratteri, sbagliare caratteri, invertire caratteri e così via.
>
> Il fatto che esistano algoritmi non significa che siano di facile
> implementazione. Pensa solo all'esplosione combinatoria che hai se a
> partire da una parola devi esplorare tutti i possibili 'errori' che
> vuoi essere in grado di correggere. Oltretutto questa correzione
> potrebbe non essere univoca (la stessa parola può essere corretta in
> modi diversi).
>
Ma ho un dizionario finito (e molto limitato) di parole da controllare
es.: se titolo mi scrivi
Amnistratore Delgato (notare la *n* e la mancanza della *e*) vorrei
correggerlo in Amministratore Delegato
Pensavo di usare una funzione di calcolo di distanza stringa e una
condizione del tipo:
se distanza inferiore a x sostituisci altrimenti lascia invariato
> Secondo me devi partire da specifiche molto ben definite, e in base
> a queste fare qualche valutazione, ma sinceramente non vedo il
> problema così semplice! :)
>
Non è semplicissimo, ma più semplice che trasformare una implementazione
scalre in una vettoriale... oltre questo, c'è un inserimento guidato
(che però può non essere utilizzato)
Ho in mente anche una certa precedenza sui controlli:
es.: non riconosco il titolo, ma la riga è ben formattata -> mi fido
dell'utente, ha usato un titolo lecito ma che non riconosco (cosa possibile)
Quindi mi servirebbe fare i controlli che ho definito prima uno per
volta e memorizzare il result, poi fare considerazioni su come
comportarmi (se richiedere l'inserimento, ripulire l'input, accettarlo
così com'è o una cosa a metà)
Spero di essermi spiegato meglio
Ciao!
--
Domenico L. icq: 645 44 861 - msn: strahd a jumpy.it
per stupire mezz'ora basta un libro di storia,
io cercai di imparare la Treccani a memoria... [F.d.A.]
More information about the Php-it
mailing list