LE MATERIE DEL DOMANI / 1.

Gli occhiali digitali della Storia

La sovrabbondanza di informazioni apre un’epoca d’oro per gli studi storici. Ma c’è un grande rischio.

Corriere delle Comunicazioni

settembre 2015

di Marco Magrini

ANCHE TIM BERNERS-LEE, prima di diventare il papà del Web, è stato un bambino. Figlio di due ingegneri informatici dell’Università di Manchester, ascoltava spesso i genitori parlare di matematica. Un giorno, rientrando da scuola, trovò il padre intento a scrivere il testo di un discorso: a suo parere, un giorno i computer  sarebbero stati capaci di fare connessioni logiche allo stesso modo di un cervello umano.

Un’intuizione paterna che tornerà utile al figlio. Come racconta lui stesso nel libro «Weaving the Web», sarà quella l’idea alla base della creazione del World Wide Web, durante i suoi anni al Cern: gli hyperlink avrebbero dovuto connettere le informazioni sparse nei server del mondo, proprio come fa il cervello umano quando associa informazioni dislocate in aree diverse dell’architettura neuronale.  

 

Oggi sappiamo che quell’idea ha cambiato la storia dell’umanità: è bastata la scintilla

scoccata da Berners-Lee, a far esplodere la «ragnatela mondiale», che ha messo in rete, attraverso i computer, alcuni miliardi di cervelli umani.

 

A ben vedere però, ha fatto anche di più. In prospettiva, ha cambiato la storia degli storici.

Il modo in cui la civiltà dei secoli a venire guarderà il mondo a noi contemporaneo, sarà profondamente diverso dal passato. Tutti gli studi retrospettivi riguardo l’avventura umana a bordo di questo pianeta, dal Neolitico al Novecento, hanno avuto a che fare con la scarsità dei documenti, dei manufatti, delle testimonianze. Dalla nascita del Web in poi, gli storici – soprattutto quelli che devono ancora nascere – sono entrati nell’era dell’abbondanza. O meglio, della sovrabbondanza.

 

Alvin Toffler aveva anticipato l’inedita circostanza nel libro «Future Shock» del 1970, parlando di information overload, il sovraccarico cognitivo delle informazioni. Cominciato in sordina con l’invenzione dei caratteri mobili, è cresciuto su scala geometrica nei secoli successivi. Al giorno d’oggi, non basterebbe una vita a leggere tutti i libri che sono stati stampati, in prima edizione, il mese scorso.

 

Ogni minuto che passa, vengono mediamente pubblicati 2,5 milioni di post su Facebook, 300mila tweet su Twitter, 72 ore di video su YouTube, 220mila foto su Instagram e vengono spediti 200 milioni di messaggi email. Ogni minuto, Google risponde a oltre quattro milioni di domande che, in definitiva, realizzano il sogno di Berners-Lee: trovare pezzi di informazione disseminati in angoli diversi del pianeta.

 

L’universo digitale. Un anno fa, Idc e Emc avevano stimato che l’«universo digitale» fosse composto da 4.400 exabyte, ovvero 4.400 miliardi di gigabyte. Secondo le loro stime, entro il 2020 si arriverà alla decuplicazione: 44mila exabyte (o 44 zettabyte) con un tasso medio di crescita che prevede un raddoppio ogni due anni. Così, ne discende che tutti i dati digitali creati e replicati fino a oggi, nella seconda metà del 2015, sono nell’ordine dei 6.500-7mila exabyte. È vero che questi includono immagini e soprattutto un’esplosione di contenuti video, che in termini di bit sono molto più “pesanti” di un libro composto di solo testo. Ma resta il fatto che, prima del Web, tutti i contenuti prodotti nella storia del genere umano ammontavano (forse) a due o tre exabyte. Inclusi tutti i film di Hollywood e di Bollywood girati fino ad allora.

Già nel lontano 1944, il bibliotecario Fremont Rider  pubblica «The Scholar and the Future of the Research Library», dove osserva che le biblioteche universitarie raddoppiano di dimensioni ogni sedici anni. Così, secondo i suoi calcoli, nel 2040 la Yale Library avrebbe dovuto avere «circa 200 milioni di volumi che occuperanno 10mila chilometri di scaffali con più di 6mila dipendenti» per gestirli. Adesso sappiamo che le sue stime erano fuori misura. 

Il mestiere dello storico – come quello del bibliotecario – è cambiato per sempre. «Quando la storia è online – scrivono gli storici Daniel Cohen e Roy Rosenzweig – entri in un mondo meno strutturato e controllato della monografia o della rivista di storia, del museo o della classe accademica». In altre parole, lo storico di oggi – e ancor più quello di domani – ha bisogno di diventare un data miner, uno specialista nel rovistare fra i dati, oceani di dati.

 Tuttavia, il modo in cui si evolveranno il pensiero storico e l’interpretazione degli eventi passati è tutto da scoprire: lo decideranno gli storici di domani e il loro approccio, ancora sconosciuto e impensabile, nei confronti delle testimonianze digitali, così interattive, così facili da reperire, ma anche così sovrabbondanti.

La storica Doris Kearns Goodwin ad esempio, ha impiegato dieci anni per scrivere «Team Of Rivals», un libro sul genio politico di Abraham Lincoln, dopo aver pazientemente ricostruito la vita del presidente americano attraverso i suoi carteggi epistolari. Al giorno d’oggi, non soltanto la Casa Bianca possiede tutte le email mandate e ricevute da Barack Obama, ma, a disposizione degli storici di domani, ci saranno anche i filmati YouTube di tutte le apparizioni pubbliche del presidente, inclusa la presentazione alla stampa del suo nuovo cane.

Il rischio di nuovi “secoli bui”. Però non è mica detto. Pergamene, incisioni e miniature rimangono leggibili per millenni. Ma non si può dire altrettanto dei documenti digitali: i supporti sin qui usati, inclusi i nastri magnetici, hanno una vita media compresa fra i 10 e i 30 anni. Tuttavia, se le cose vanno storte, anche un solo bit danneggiato può rendere un testo del tutto illeggibile. Un report del governo americano ha rivelato che le email della Casa Bianca, fra il gennaio 2003 e l’agosto 2005 (ovvero fra la guerra in Iraq e il secondo mandato di George W. Bush) sono andate perse. Ma c’è anche di peggio.

Non il papà del Web, ma uno dei padri fondatori dell’Internet, Vint Cerf, oggi vicepresidente di Google, ha lanciato l’allarme qualche mese fa: c’è il rischio che le future generazioni non potranno disporre di informazioni sull’inizio del ventunesimo secolo, trasformandolo in una nuova e inaspettata «digital dark age». Il motivo? I documenti digitali non possono tenere il passo con il rapido processo di obsolescenza dell’hardware e del software.

Per strano che possa sembrare, non è la prima volta che si leva un simile allarme. Nel 1998, il documentario di Terry Sanders «Into the future: on the preservation of knowledge in the electronic age», aveva dipinto un futuro catastrofico per le informazioni digitali. È vero che alcuni casi di scuola, come i dati del censimento americano del 1960 registrati su nastri magnetici e diventati illeggibili, si sono rivelati una leggenda: nei primi anni 80 sono stati trasferiti su altri mezzi di archiviazione con una perdita irrisoria di dati. Ma resta il fatto che, a volerli conservare ulteriormente, andranno nuovamente trasferiti, con tutte le complicazioni del caso.

Il nuovo mestiere dello storico non sarà più solo quello di scovare le informazioni, ma anche di preservarle. Se oggi tutti i computer del mondo – come profetizzava il papà del papà del Web –funzionano un po’ alla stregua di un cervello umano, sarà bene fare attenzione a non copiare un’altra peculiare caratteristica del sistema cerebrale. Che, invecchiando, dimentica.

BOX

Una macchina del tempo

per rivivere 

la preistoria del Web

 

The Internet Archive, nato dalla preveggenza di Brewster Kahle, cerca di fare il backup della Rete. E anche molto di più.

Al contrario dei manufatti preistorici di milioni di anni fa, la  preistoria del Web era destinata a scomparire per sempre. Le prime rudimentali apparizioni dei futuri giganti Amazon, Google, eBay, ma anche i vagiti dei siti istituzionali o d’informazione italiani – per definizione dinamici – una volta rimossi dai rispettivi server, sarebbero scomparsi per sempre. E invece no. A salvare i manufatti digitali di un’intera generazione, ci ha pensato Brewster Kahle, un ingegnere elettronico che ha avuto la fulminante idea di fare un backup della Rete, già 19 anni fa.

A San Francisco, in Funston Avenue, non troppo lontano dal Golden Gate Park, ha sede The Internet Archive (www.archive.org), una fondazione no-profit fondata da Kahle nel 1996. Il grande palazzo bianco, reso austero dalle colonne neoclassiche, ha decisamente le sembianze di un museo. Da un lato è vero: è il museo del World Wide Web. Ma da un’altro lato, no: non ci sono visitatori a cui staccare il biglietto, perché tutto – come si conviene nel cyberspazio – è a disposizione del mondo digitale.

La porta di accesso si chiama Wayback Machine: un motore di ricerca scritto dal solito Kahle (che non ha caso si è già guadagnato un posto nella Internet Hall of Fame) che consente di digitare un indirizzo web qualsiasi e andare indietro, come in una specie di macchina del tempo. Potete andare a vedere com’erano fatti i primi siti della Apple o di Montecitorio, della Rai o di questo giornale (www.corrierecomunicazioni.it), e intenerirvi di fronte a quelle vestigia digitali del passato. Si può anche osservare come quei siti si siano evoluti nel tempo, anno dopo anno. Ma fino a un certo punto.

The Internet Archive dice di aver immagazzinato finora 427 miliardi di pagine web, che sono un’enormità. Ma ben lontane dalla totalità. Perché la creatura di Brewster Kahle immagazzina periodicamente delle “fotografie” dei siti, solo in determinati momenti. Purtroppo, per salvare ogni pagina nella sua complessità bisognerebbe preservare l’intero Web, perché in teoria ogni pagina è legata a ogni altra.

Per fortuna, e a definitivo plauso di Kahle e della sua preveggenza, The Internet Archive (emulato da altri, inclusa l’europea Internet Memory Foundation) fa anche molto di più, nell’interesse degli storici di domani. Come quella di puntare a digitalizzare tutti i libri analogici del mondo.

Marco Magrini

Creative Commons License

CCommons.png
  • Black Twitter Icon
  • Black LinkedIn Icon
  • Black Amazon Icon
  • Black Vimeo Icon
  • Black YouTube Icon