Trascrizione di testi
Descrivo l’ esperienza fatta nel digitalizzare quaderni scritti a mano indicando alcune linee guida, secondo me ottimali, per ottimizzare l’ operazione.
- Scansione del documento. Questa operazione serve per acquisire il documento in formato immagine (JPG) o in formato PDF. Io ho usato esclusivamente il cellulare. Ho usato anche un supporto per mantenere il cellulare fisso e orizzontale ad una distanza di una trentina di cm dal piano. In un caso ho scattato 26 foto, una per ogni pagina del quaderno. Nell’ altro caso ho utilizzato la “app” Adobe scan per acquisire le 26 immagini in modo sequenziale e salvando il tutto come unico file pdf (vedi allegato). I tempi per portare a termine i due procedimenti sono comparabili e, nel caso in esame, si tratta di 5-10 minuti.
- Trascrizione. Le immagini devono essere convertite in testo editabile. Dico subito che ho provato ad utilizzare Adobe scan plus a pagamento ma il risultato è stato del tutto inutilizzabile. Ho invece ottenuto buoni risultati con l’ AI.
Con Claude, Gemini, Coplilot e ChatGPT ho ottenuto risultati confrontabili, come qualità e prestazioni, mentre più scarsi sono risultati Perplexity e DeepSeek. In tutti i casi si vede che non si può sottoporre l’ intero documento per la trascrizione per limiti di tokens (almeno con i SW gratuiti che ho utilizzato), In sostanza, se si usano le foto, si possono sottoporre 4-5 alla volta. Se si usa il PDF completo si deve chiedere di trascrivere 4-5 pagine alla volta. Ho la sensazione che con le foto la trascrizione sia leggermente più accurata.
Conclusione:
Per la scansione, personalmente, preferisco fare le foto e passarle su PC per operare più agevolmente anche se si può fare tutto col cellulare. Unico vantaggio di Adobe scan è che delimita direttamente l’ area del testo.
Per la trascrizione sottopongo 4 foto a Gemini con il prompt “trascrivi letteralmente, mettendo tra parentesi la traduzione dei termini in dialetto milanese”. Dopo circa un minuto arriva la risposta, che copio e incollo in Word (vedi esempio). Questa operazione può richiedere 4-5 minuti per cui il tempo totale per il quaderno è di circa mezz’ ora.
Naturalmente Gemini, come tutte le AI tende a metterci del suo, per questo è importante la parola “letteralmente”. Ciò non toglie che lo si può sfruttare per avere indici, divisione in macro-argomenti, commenti ecc. come si può vedere nel documento finale che ho ottenuto dal quaderno 2 (documento finale). Questo documento è in Word ma lo ho caricato come pdf per comodità di lettura.
L’ultima operazione consiste nella revisione del testo e nella correzione, specialmente per i termini dialettali. Probabilmente è quella che richiede più tempo. Gli esempi allegati non hanno subito alcuna revisione.
Quaderno n3 con modalità operativa diversa
Ho digitalizzato il quaderno n3 con modalità leggermente diversa. Sono partito sempre dalle foto fatte col cellulare. Poi ho condiviso gruppi di 4 foto alla volta con Gemini sempre sul cellulare. Il risultato lo ho trasmesso a me stesso tramite Gmail. Infine ho trasferito il contenuto delle mail in word. Il risultato grezzo è in questo documento. Naturalmente deve essere rivisto. L’ intera operazione può essere fatta in circa una ora per una ventina di pagine.

