
Il servizio di digitalizzazione dell’archivio storico de “La Stampa” è un progetto di elevato contenuto tecnologico, dal carattere fortemente innovativo e all’avanguardia è stato il primo in Italia e terzo al mondo, dopo il “Times” e il “New York Times”.
Sono state trattare tutte le edizioni del giornale a partire dal 1867 al 2006: circa 2 milioni di pagine, 5 milioni di articoli e 4,4 milioni di immagini tra fotografie, permettendo di fornire online, a qualsiasi utente, la possibilità di consultare 150 anni di storia, sfogliando copie digitali, fedeli all’originale, di ciascuna edizione del giornale, con la possibilità di estrarre interi articoli oppure di effettuare svariate tipologie di ricerche.
Ogni singola pagina è stata scannerizzata, tutte le immagini sono state trattate tramite riconoscitore ottico di caratteri (OCR), producendo files in formato “Word” e ogni singola pagina è stata mappata.
Infine è stato allestito un sito internet in cui da tutto il mondo, chiunque, può interrogare l’archivio digitale, effettuando sia ricerche per parola sia per area tematica, ottenendo oltre agli articoli anche le immagini delle pagine originali. Il sistema fornisce la possibilità di salvare le ricerche, stampare i file d’interesse e di trattarli come un qualunque testo in “Word”.