Che usiate Retrieval Augmented Generation o Knowledge Graph, il punto è che la preparazione dei documenti è fondamentale e riflette la qualità dei risultati che otterrete dai modelli.
I PDF sono un pessimo punto di partenza, i formati di MS Office presentano non poche difficoltà e le librerie attualmente disponibili non curano molti dettagli che sono fondamentali per preservare le qualità delle informazioni.
In questa sessione vedremo una serie di tecniche che permettono di distillare le informazioni dai documenti e di come misurarne la qualità.
Questo abstract è stato prodotto con mani e tastiera.