|
Coordinamento Servizi Informatici Bibliotecari di Ateneo | |
Università degli Studi di Lecce |
BERND WEGNER
Il Progetto
ERAM - Electronic Research Archive in Mathematics
[PowerPoint Slides]
[english version]
Abstract
La longevità è tipica dei risultati della ricerca nel campo della matematica.
Pertanto, allo scopo di migliorare la disponibilità delle pubblicazioni classiche
di quest'area e per favorire un rapido raggiungimento delle informazioni, saranno
necessari servizi elettronici informativi di letteratura e archivi digitali
dei testi completi come importanti strumenti per la ricerca matematica nel futuro.
Ciò avvicinerà il patrimonio degli archivi dei periodici all'utente ed eviterà
la perdita del cartaceo a causa del deterioramento della carta col passare del
tempo.
Scopo di quest’articolo è fare un resoconto più dettagliato e aggiornato di un progetto, chiamato ERAM, che riversa lo "Jahrbuch" come servizio bibliografico classico in una banca dati ed usa quest’attività per selezionare pubblicazioni importanti del periodo Jahrbuch per digitalizzarle e immagazzinarle in un archivio digitale. Ma la banca dati non sarà semplicemente una copia della bibliografia stampata. Conterrà un gran numero di miglioramenti come moderne classificazioni per soggetto, per quanto possibile, parole chiave che diano un'idea sul contenuto in termini moderni e commenti che mettano in relazione risultati classici e moderne aree di ricerca nel campo della matematica. Queste caratteristiche rimarranno aperte ad integrazioni all'interno di un progetto in evoluzione. L'archivio digitale costruito in relazione alla banca dati sarà collegato a questa e fornirà tutti i servizi relativi agli attuali progetti di digitazione. Il contenuto sarà distribuito ai mirror e combinato con attività simili di archiviazione per la matematica.
Allo scopo di comprendere l'importanza della disponibilità di pubblicazioni classiche di matematica per l'attuale ricerca in questo campo, è necessario, all'inizio di questo articolo, fare qualche osservazione relativa all'interesse dei matematici per queste pubblicazioni. Mentre nelle scienze generalmente l'interesse per le opinioni personali dell'autore riguardo ad un topico costituisce la principale motivazione che spinge a consultare una pubblicazione, i matematici cercano invece risultati precisi come enunciati e dimostrazioni di teoremi. Qualsiasi fonte attendibile per trovare tali teoremi sarà loro sufficiente. Ma molti di questi risultati sono dichiarati solo da una parte, vale a dire, dalla rivista in cui sono stati pubblicati per la prima volta. Ma, anche se questi risultati non sono stati successivamente riprodotti in monografie o in rassegne, ciò non vuol dire che siano divenuti obsoleti. La conoscenza matematica non invecchia.
Oltre a questi risultati, alcuni aspetti particolari delle dimostrazioni dei teoremi possono essere interessanti in un secondo momento. Ciò richiede un facile accesso a questi documenti, senza tenere conto della loro età o del loro stato. La ricercabilità sarà un'ulteriore esigenza per consentire al ricercatore di trovare ciò che gli serve nella vasta banca di conoscenza dei risultati nel campo della matematica. Bisogna ammettere che nessun motore di ricerca attuale è in grado di localizzare un enunciato nel suo significato astratto. In alcuni casi il nome può aiutare, mentre i codici di classificazione di particolari aree dell'argomento limiteranno notevolmente la mole di documenti fra cui cercare l'informazione desiderata. Le banche dati della letteratura relativa al periodo classico della matematica sono, pertanto, auspicabili. Esse dovrebbero offrire servizi simili agli attuali servizi di informazione della letteratura matematica, e inoltre, dovrebbero fornire link alle prospettive future offerte dalla moderna matematica. Questo è il punto di partenza del progetto ERAM che sarà anche chiamato progetto Jahrbuch per abbreviare.
L'acronimo ERAM sta per "Electronic Research Archive for Mathematics". Il progetto è finanziato dalla Deutsche Forschungsgemeinschaft (DFG). Le istituzioni che si occupano del progetto sono la Staat-und Universitatsbibliothek Gottingen (SUB) e la Technische Universitat (TUB) di Berlino. Supervisori per entrambe le parti del progetto sono il Prof. Elmar Mittler (SUB) e l'autore di quest’articolo (TUB). Il titolo ufficiale del progetto presso la DFG basta a presentare il programma e può essere tradotto come segue: installazione di un archivio (digitale) di articoli preziosi per la ricerca matematica, piena possibilità di ricerca e di accesso attraverso una banca dati, catturata dallo "Jahrbuch Uber die Fortschritte der Mathematik" (1868-1943) Questa banca dati richiede una cura particolare e la supervisione da parte di scienziati con esperienza nelle banche dati di letteratura matematica. Per questo motivo questa parte del progetto è guidata dal Prof. Dr Keith Dennis (Cornell University, ex editore-capo di Mathematical Reviews) e dall'autore di quest'articolo che è anch'esso editore-capo della banca dati attualmente più completa di letteratura per la matematica, Zentralblatt MATH.
L'attenzione principale in quest'articolo sarà data alla banca dati, essendo questa la parte del progetto scientificamente più stimolante. Tuttavia, sarà necessario investire considerevole lavoro per l'installazione dell'archivio digitale. Ma la parte imprevedibile di quest’affare sono le trattative con gli editori per ottenere le licenze che consentano di offrire il contenuto dell'archivio esclusivamente a costi bassi. Questi introiti potrebbero ricoprire i costi per la manutenzione dell'archivio, ma non quelli dell'installazione.
Lo Jahrbuch Uber Fortschritte der Mathematik (JFM) fu fondato nel 1868 dai matematici Carl Ohrtmann e Felix Muller. Gli autori esprimevano lo scopo di questo servizio nel preambolo al primo numero che, tradotto liberamente, suona così: “Nostro scopo è, da una parte fornire a coloro che non sono in grado di seguire tutte le pubblicazioni nel vasto campo della matematica uno strumento in grado di offrire uno sguardo generale sull'evoluzione delle scienze matematiche. Dall'altra, aiutare lo scienziato attivo a trovare risultati noti nel campo della matematica." Editore dello JFM fu De Gruyter, dall'inizio alla fine. All’ERAM è stato gentilmente concesso di catturare tutto il contenuto dello JFM in una banca dati e di renderla disponibile gratuitamente nel web. La supervisione scientifica fu compito dell’Accademia Prussiana di Scienze.
Lo JFM pubblicò 68 numeri dal 1868 al 1943. In genere un numero conteneva tutte le relazioni degli articoli di matematica pubblicati nel corso dell'anno citato in quel numero, ma alcuni numeri coprivano più di un anno. Nel periodo su citato lo JFM recensì più di 300.000 pubblicazioni di matematica. La pubblicazione dello JFM fu sospesa durante la Seconda Guerra Mondiale e non fu mai ripristinata in seguito. Dal 1931 si trovò a competere con Zentralblatt fur Mathematik, pubblicato da Springer-Verlag. Il particolare metodo dello JFM di uscire solo quando erano disponibili tutte le relazioni sulle pubblicazioni di quell'anno, portò ad un accumulo di lavoro arretrato. In alcuni casi l'utente doveva aspettare quattro anni prima di poter ottenere l'informazione che lo interessava. Zentralblatt pubblicava invece tutte le recensioni disponibili. In un periodo di crescente interesse per la matematica e di maggiori attività di ricerca in questo campo, il metodo di Zentralblatt era più in armonia con le esigenze degli utenti. Pertanto, se un servizio poteva essere ripristinato dopo la Seconda Guerra Mondiale, le maggiori possibilità le aveva Zentralblatt, e Zentralblatt fu in grado di riprendersi piuttosto presto da questo periodo.
Tuttavia, pensando alle esigenze dell'ERAM, lo JFM è una fonte perfetta per costruire un gateway elettronico all'archivio digitale. Dopo tanto tempo il ritardo dello JFM non ha più molta importanza, e la precisione e la completezza dei dati relativi ad un anno è di un livello tale che non potrà essere più raggiunto dagli attuali servizi di recensione per la matematica, che devono affrontare un'enorme mole di articoli, in confronto al lavoro che si trovava ad affrontare lo JFM. Uno svantaggio dello JFM è che, contrariamente a Zentralblatt, tutte le recensioni sono in tedesco. Ma il periodo di sovrapposizione dei due servizi è relativamente breve (dal 1931 al 1943). Pertanto, per un lungo periodo non esiste nessun altro materiale, se non quello dello JFM, se prendiamo in considerazione una documentazione completa nel campo della matematica.
Ci sarà di certo un'accesa discussione riguardo alla questione se le recensioni tedesche debbano essere tradotte in inglese. Fino a questo momento ho respinto tutte queste proposte poiché le difficoltà sono duplici. La matematica del periodo JFM aveva una rappresentazione abbastanza differente da quanto viene oggi pubblicato, e la stessa cosa vale per le recensioni. La traduzione in inglese porterebbe ad un'altra deformazione del contenuto. Persino la traduzione di attuali recensioni dal tedesco/francese in inglese può essere fuorviante, perché‚ normalmente i recensori usano solo la propria lingua madre invece dell'inglese, se vogliono esprimere qualcosa di straordinario. Pertanto, il contenuto di un articolo dovrebbe essere descritto di preferenza con parole chiave in inglese allo scopo di dare un'idea del contenuto dell’opera che non può essere letta in tedesco. Le generazioni future potranno avere un'opinione differente al riguardo, ma allora sarà loro compito prendersi cura del lavoro di traduzione.
Struttura
e miglioramenti della banca dati JFM
La prima fase del progetto ERAM consiste nella produzione di una banca dati
bibliografica, la banca dati JFM, che catturi il contenuto della Jahrbuch Uber
Fortschritte der Mathematik (JFM). Per una questione di principio, la banca
dati JFM dovrebbe essere accessibile con lo stesso software di ricerca
della banca dati Zentralblatt MATH. Pertanto, dovrebbe fornire una struttura
di campi simile a quella della Zentralblatt e dovrebbe implementare gli stessi
standard bibliografici. Ma trasformare semplicemente il contenuto dello JFM
in forma elettronica non sarà sufficiente. Le moderne banche dati di letteratura
forniscono diverse opzioni di ricerca che non riuscirebbero facilmente a ricavare
l’informazione desiderata dal testo della JFM. Saranno necessari dei miglioramenti
editoriali e inoltre bisognerebbe fornire, per quanto possibile, link
storici alla moderna ricerca
In un primo momento, si dovrebbe descrivere il contenuto dei campi e ciò si potrebbe fare prendendo direttamente il testo dello JFM o derivandolo da esso. Si incomincia con il numero di collocazione che è importante per l'identificazione della recensione. E' la chiave per il recupero della recensione nella versione stampata per i link esterni e interni. Ovviamente dovrebbe esserci un campo per l'autore(i) di una pubblicazione e un altro per il titolo. I supplementi e le diverse forme di nomi si possono ritrovare in un campo separato. La sintassi della presentazione di un nome è uguale a quella della banca dati Zentralblatt. Viene assunta una speciale convenzione per le raccolte di opere: considerare come nome dell'autore il nome del curatore della raccolta. Il campo contiene varie forme del nome di un autore. Un esempio di nome differente che si ritrova nella JFM: V. Stekloff e W. Stekloff. Il campo del titolo contiene l'informazione originale relativa al titolo così come riportato nella JFM, e si può trattare sia del titolo originale dell'articolo, di una traduzione del titolo oppure di entrambi.
Un elemento importante per ridurre l'estensione di una ricerca, viene fornito nel campo relativo all'anno di pubblicazione. Si tratta dell'anno in cui sono uscite le pubblicazioni recensite dallo JFM. Come detto in precedenza, si verificava del ritardo fra la distribuzione della pubblicazione originale e l'uscita di una recensione nello JFM, di solito due o tre anni, ma persino fino a sette anni dopo la Prima Guerra Mondiale. Salvo alcune eccezioni, ciascun volume dello JFM conteneva recensioni per tutte le pubblicazioni uscite nello stesso anno. Per cui esiste una stretta relazione fra l'anno di pubblicazione e il numero di un volume JFM. La fonte di una pubblicazione è un campo importante per la lista di reperimento (dell'informazione cercata). In genere il nome delle fonti è abbreviato. Ogni volume dello JFM aveva un capitolo che espandeva le abbreviazioni delle fonti. Tali abbreviazioni cambiavano di tanto in tanto. C'è stata, pertanto, l'esigenza di introdurre un nuovo campo, chiamato "fonte normalizzata" in grado di fornire il nome completo della rivista e le possibili modifiche nel corso del tempo. Nel campo "recensione, abstract della pubblicazione", l'utente troverà la recensione così come stampata nello JFM. In principio le recensioni non erano anonime. Ogni recensione era accompagnata dal nome o dall'abbreviazione del nome del recensore. Anche questo tipo di informazione è conservata in un campo separato.
La sola informazione formalizzata per soggetto nello JFM consiste nelle intestazioni dei soggetti conservate nella banca dati come classificazione approssimativa. Tali voci sono organizzate in tre livelli e sono cambiate nel corso del tempo. Talvolta le voci per soggetto finiscono con il riferimento ad altre importanti pubblicazioni che sono recensite da qualche altra parte nello JFM. Questi link "indipendenti" possono essere usati come ulteriore informazione sul soggetto relativo alle pubblicazioni citate in quei link. Ma è possibile ottenere una descrizione più precisa degli argomenti solo con dell'altro lavoro intellettuale, come descritto qui di seguito.
Questo lavoro deve essere investito nel miglioramento dei dati catturati dallo JFM. Il compito consiste in due parti, una che si basa sul supporto degli esperti matematici mentre l'altra comporta del lavoro di redazione supplementare dei dati da parte dei bibliotecari. Più di 150 matematici di tutto il mondo collaborano nel progetto come esperti volontari. Gli esperti dovrebbero migliorare i dati grezzi al momento disponibili in questo senso: dovrebbero fornire una traduzione inglese del titolo del singolo documento, dovrebbero aggiungere una classificazione per soggetto secondo l'MSC2000 ed assegnare delle parole chiave in inglese; dovrebbero inoltre dare una qualche indicazione sull'importanza dei documenti trattati per lo sviluppo della matematica.
Le parole chiave dovrebbero caratterizzare il contenuto dell'articolo per quanto si può dedurre dal titolo e dalla recensione. Le parole chiave sono non-controllate, vale a dire, non esiste un vocabolario standard (thesaurus) che fornisca un elenco delle parole chiave ammissibili. La classificazione per soggetto sarà l'unica informazione standardizzata relativa al contenuto dell'articolo. Ma questa è relativamente grossolana e divide le attuali attività di ricerca nel campo della matematica in aree di soggetti che in molti casi non coincidono con le corrispondenti divisioni della matematica durante il periodo JFM. Pertanto, per la banca dati JFM, l'assegnazione di codici MSC non funzionerà allo stesso livello di precisione delle attuali banche dati come Zentralblatt MATH.
Oltre a ciò, si effettuerà una valutazione delle pubblicazioni allo scopo di fornire una sorta di graduatoria in base alla loro importanza. Tale graduatoria potrà essere solo superficiale. Il suo unico scopo è quello di decidere sull'importanza dei singoli documenti per la digitalizzazione del full text. Abbiamo tre classi in mente: pubblicazioni di importanza significativa per l'ulteriore sviluppo della matematica, pubblicazioni importanti e tutte le altre pubblicazioni. Le prime due classi non dovrebbero contenere più del 20% degli articoli coperti dallo JFM. Questo solo per rimanere entro i limiti del bilancio del progetto. La valutazione sarà decisiva per la selezione del lavoro da immagazzinare nell'archivio digitale.
Informazioni più dettagliate e aggiornate degli articoli si troveranno alla voce "osservazioni dell’esperto". L'esperto può usare questo campo per un'annotazione di qualsiasi tipo alla pubblicazione. Si potrebbe trattare, ad esempio, di una descrizione verbale dell’importanza della pubblicazione o del riferimento ad altri sviluppi nella matematica. E' nostra speranza che in modo particolare quei documenti classici che hanno dato inizio a un'intera serie di articoli di ricerca o anche a una nuova area nel campo della matematica, possano essere rappresentati nella banca dati JFM con particolare rilievo. Andando avanti e indietro con i link, l'utente deve poter trovare le relazioni fra le attuali pubblicazioni che hanno le stesse radici storiche pur non facendo parte dello stesso argomento matematico moderno. Il contenuto di questo campo dipenderà dalla conoscenza dell'esperto che si occupa del documento corrispondente, ed in genere tali osservazioni, inizialmente, si troveranno solo per pochi articoli della banca dati.
Un altro gruppo di miglioramenti della banca dati JFM sarà il risultato del lavoro di redazione dei dati da parte dei bibliotecari. Questi si prenderanno cura di standardizzare l'informazione disponibile e di fornire link alle versioni digitali del corrispondente articolo o ad una biblioteca dove l'articolo può essere ordinato usando il servizio di invio documenti. Ad esempio, le recensioni della JFM talvolta citano precedenti pubblicazioni che hanno ricevuto un identificatore all'interno della banca dati JFM. Questi riferimenti saranno trasformati in hyperlink. Sono specificate le URL di una forma digitalizzata della pubblicazione originale e le firme della fonte della pubblicazione originale sono aggiunte al SUB. Il SUB fornisce un servizio di invio documenti per queste pubblicazioni.
La standardizzazione si occupa delle fonti normalizzate. Qui vengono forniti nomi supplementari delle fonti, come nel caso di periodici con nomi modificati, allo scopo di fornire forme standard dei titoli dei periodici e le corrispondenti abbreviazioni. Ulteriori sforzi sono spesi per l'identificazione dei nomi degli autori. A differenza dei titoli dei periodici qui è possibile apportare solo dei miglioramenti e la perfezione riguardo all'identificazione dell'autore richiede sforzi immensi e va al di là di quanto si possa ricoprire nell’ambito del bilancio del progetto.
Oltre al suo impiego come fonte d'informazione di alta qualità sulla matematica classica, la banca dati JFM fornirà l'accesso all'archivio digitale che sarà organizzato nell'ambito del progetto. Tale archivio dovrebbe contenere la maggior parte delle pubblicazioni importanti per la matematica dal periodo della JFM (1868 - 1943). Una prima valutazione approssimativa della mole di documenti che l'ERAM dovrebbe ricoprire stimò un indice di circa il 20% del numero totale di pubblicazioni di matematica relative al periodo JFM, vale a dire 1.200.000 pagine in numeri assoluti. Le pubblicazioni vengono scansite (come immagini gif) e immagazzinate in un sistema di gestione dei documenti. All'inizio del progetto non sarà effettuata alcuna conversione delle immagini in file di testo. Allo scopo di consentire le ricerche di testo nell'archivio, i file di testo, in un secondo momento, costituiranno un'importante integrazione alle immagini scannerizzate.
Il contenuto dell'archivio sarà immagazzinato e disponibile presso il SUB. Un accesso diretto è possibile all'URL:
http://www-gdz.sub.uni-goettingen.de/agora:html/docs/
La collaborazione con altri archivi digitali, attraverso l'uso di mirror e lo scambio di documenti, sarà argomento di future discussioni. Una ricerca nella banca dati JFM è il modo più semplice per accedere all'archivio. Con la lista dei risultati della sua ricerca, l'utente otterrà dei link ipertestuali al documento, se questo è disponibile nell'archivio digitale, oppure al buono d'ordine del servizio invio documenti, sempre che il documento sia disponibile nel patrimonio del SUB.
La selezione dei documenti è basata per principio sulle raccomandazioni degli esperti dello JFM. Ma ciò si è rivelato un collo di bottiglia per il progetto. Inoltre, in qualche caso, scansire parti isolate di periodici e altre fonti si è rivelato meno efficiente che scansire un numero di un periodico per intero. Questo ha portato alla conclusione che si dovrebbero applicare altri metodi di selezione, senza ignorare il consiglio degli esperti. Oltre a ciò, la selezione limitata al periodo dello JFM è piuttosto artificiale, anche se ha costituito una buona base di partenza. Il comodo accesso attraverso la banca dati JFM rimarrà una caratteristica importante.
Pertanto i supervisori del progetto hanno iniziato, per proprio conto, ad aggiungere consigli per i documenti da scansire. Il lavoro comprende alcune raccolte di opere e manuali classici, monografie difficili da trovare nel patrimonio delle biblioteche, tesi di dottorati in matematica, pubblicazioni su carta con cattive proprietà di conservazione, intere raccolte di volumi di periodici, ecc. Ad esempio, abbiamo la concessione di inserire nell'archivio versioni digitali del "Mathematische Annalen", ricoprendo tutti i volumi arretrati fino a quelli pubblicati negli anni '50. Alcuni fra i periodici che hanno di recente installato versioni elettroniche nell'EMIS (European Mathematical Information Service) hanno accettato che tutti i loro volumi arretrati di pubblicazioni solo su stampa fossero digitalizzati e offerti all'interno dell'ERAM. Qui si possono trovare, ad esempio, i volumi arretrati di "Beitrage zur Algebra und Geometrie".
Ovviamente, questa parte del progetto comporta sforzi supplementari che vanno al di là del lavoro tecnico necessario per scansire e immagazzinare i documenti. Tenendo in mente che l'accesso all'archivio digitale dovrebbe essere gratuito, a parte una piccola tassa amministrativa, una gran quantità di offerte dell'archivio richiederanno accordi con editore e autore per poter essere gestiti in tal modo dall'ERAM. Ciò comporta trattative alquanto problematiche con editori ed autori, specialmente perché gli editori hanno le proprie idee sui vantaggi che possono derivare dall'installazione di versioni digitali delle proprie pubblicazioni. Questo porta automaticamente a una riduzione dell’insieme di pubblicazioni di documenti nell'archivio rispetto a quanto sarebbe auspicabile.
I dati migliorati catturati dallo JFM costituiranno il contenuto finale dell'offerta WWW della banca dati JFM. Al contrario di quanto avviene per gli articoli dell'archivio, l'input per la banca dati non sarà scansito, ma sarà digitato secondo la struttura su citata. E' stato deciso di offrire i dati nel web a due livelli. Il primo consisterà in dati grezzi, risultanti dalla digitazione senza essere curati. Al secondo livello i dati saranno curati e migliorati dagli esperti. Inoltre, la banca dati rimarrà aperta ad ulteriori miglioramenti, poiché, in particolare la sezione riservata ai commenti, potrà ricevere di continuo importanti input da parte di altri matematici che non appartengono all'attuale comitato di esperti.
Secondo quanto suggeriscono gli utenti di una prima versione di prova, anche l'accesso ai dati grezzi sembra essere un importante servizio per la comunità dei matematici. Pertanto tutto ciò che è stato immesso nel sistema viene reso accessibile gratuitamente, , al seguente URL: http://www.emis.de/projects/cliccando sul riquadro dello Jahrbuch.
Gli utenti sono avvertiti che il contenuto si trova in molti casi solo allo stato preliminare. Circa il 70% del contenuto dello JFM è attualmente immagazzinato in un sistema, a cominciare dal primo numero fin quasi ad arrivare al periodo in cui lo JFM e Zentralblatt MATH iniziarono ad uscire contemporaneamente. La maggior parte dei dati è già stata curata ma per molti mancano ancora i miglioramenti degli esperti. Quella dei miglioramenti sembra essere una procedura più lunga in quanto è difficile trovare molti volontari che se ne prendano cura e la possibilità lavorativa per gli attuali esperti non è tanta a causa dei molti altri impegni.
L'accessibilità alle prime parti dell'archivio è stata già organizzata mentre un'estensione è in corso di preparazione. Quest'ultima ha subito alcuni ritardi per il fatto di avere un insieme di contenuti essenziali nella banca dati JFM. Ma si è anche dovuto discutere e installare le strutture per l'accesso pubblico. Pertanto, l'archivio ha più documenti disponibili di quanto possa sembrare dall'esterno, è il contenuto è in continua crescita. Sono state intraprese altre discussioni per collegare la banca dati JFM ad altre offerte digitali di documenti del periodo JFM e per avviare uno scambio di documenti. Lo scopo è di creare un sistema distribuito di archivi digitali per la matematica, per il quale la banca dati JFM può essere usata come la via più conveniente.
Professor Dr. Bernd Wegner
Scientific Coordinator of EMIS
Fachbereich Mathematik, Technische Universitat Berlin
Strae des 17. Juni 135, D-10623 Berlin, Germany