DOI 10.35948/2532-9006/2022.18751
Licenza CC BY-NC-ND
Copyright: © 2022 Accademia della Crusca
1. Premessa
È nota e alquanto scontata l’importanza che ricoprono oggi i corpora elettronici, i lessici e i dizionari digitali per il lessicografo e lo studioso di lingua italiana come strumenti di consultazione: sono ormai passati più di ottant’anni da quando il linguista e filologo Bruno Migliorini annotava a mano, giorno dopo giorno, preziose schede di ‘anagrafe’ delle parole italiane, nelle quali inseriva la data di prima attestazione in aggiunta a colui che l’aveva utilizzata per primo (Maconi 2020, p. 9). L’idea di creare uno strumento interdisciplinare che accomunasse esigenze di giuristi e linguisti e aiutasse l’attività di consultazione di entrambi è alla base della creazione e dello sviluppo della banca dati IS-LeGI – Indice Semantico del Lessico Giuridico – (Romano-Cammelli 2019, p. 102) attiva dal 2008 e complemento dei due precedenti archivi Vocanet-LGI (Lessico Giuridico Italiano) e LLI (Lingua Legislativa Italiana). Tali archivi, gratuitamente consultabili online1, sono il frutto delle attività svolte dal CNR in vista della redazione di un vocabolario storico della lingua giuridica italiana che, tuttavia, non è mai stato completato (Fiorelli 2007 pp. 191-198). Il presente contributo, indirizzato a chi non conosce ancora l’archivio IS-LeGI e gli strumenti di ricerca disponibili, ha l’obiettivo di mostrare il generale assetto della banca dati, illustrare la modalità di presentazione delle voci, evidenziare i vantaggi d’uso di tale repertorio lessicale, quale valido strumento interdisciplinare per la diffusione del sapere giuridico in prospettiva sincronica e diacronica e per la raccolta lessicografica e l’analisi storico-linguistica dei lemmi (Sagri 2014, pp. 506-508). L’archivio si offre come “strumento che fa ordine e insegna a far ordine in una massa disordinata di dati”, come quella che l’evoluzione di una Rete ci propone (Cammelli-Mariani 2012, p. 223). Infine, la proposta intende descrivere eventuali criticità legate alla banca dati, con lo scopo di mettere nelle mani dell’utente un ‘quadro’ ragionato dei limiti e dei vantaggi d’uso dell’archivio.
2. la banca dati IS-LeGI
La banca dati IS-LeGI è costituita da una selezione di tutte le risorse presenti nella banca dati Lessico Giuridico Italiano (LGI), contenente oltre 900.000 schede-fonte (immagine digitale dei contesti) ottenute dallo spoglio selettivo di circa duemila testi di legislazione, dottrina, prassi e altri documenti d'interesse giuridico redatti dal X al XX secolo ed in grado di rappresentare al meglio la varietà delle fonti giuridiche e dei diversi rami del diritto in cui la lingua giuridica è stata utilizzata.
Tale banca dati fu creata con lo scopo di fornire agli utenti (non esclusivamente studiosi della lingua e del diritto), “una guida per individuare le accezioni principali riconducibili ai termini giuridici consultabili” (Mariani 2008, p. 241).
Negli ultimi anni la banca dati è stata aggiornata con alcune funzionalità che la rendono più amichevole in fase di consultazione e arricchita di nuovi dati. Per quanto riguarda il primo aspetto è stato previsto che l’Indice (e quindi l’elenco delle 1.309 parole che lo costituiscono) sia visibile all’utente dalla maschera di interrogazione, mettendo in evidenza i lemmi già compilati (e quindi corredati di accezioni e fraseologie) rispetto a quelli da compilare. Per quanto riguarda il secondo aspetto, invece, a partire dallo scorso anno sono stati resi visibili all’utente non solo i nomi dei compilatori di ciascun lemma, ma anche le varianti grafiche associate ad un lemma, che in precedenza erano visibili solo dai compilatori.
Si segnalano anche le seguenti criticità: le schede-fonte contenute nella banca dati IS-LeGI sono tratte da circa 2.000 documenti di dottrina, legislazione e prassi giuridica redatti in un periodo compreso tra il X e il XX secolo. Tuttavia, tale campione, seppure ampio e rappresentativo di diverse epoche storiche e tipologie testuali, rimane comunque parziale rispetto a tutta la storia della lingua giuridica. Per questo motivo l’utilizzo di IS-LeGI può essere associato alla consultazione di altre banche dati storiche messe a disposizione sul sito di CNR-IGSG, quali LLI, Gride Milano, Bandi medicei, Gride sanità, oltre ad altre banche dati pubbliche che collezionano norme di diverso rango (il Portale Normattiva e la banca dati normativa del Portale PAeSI).
La finalità originaria di spogliare documenti giuridici ai fini della compilazione di un vocabolario giuridico ha comportato, in qualche caso, uno ‘sbilanciamento’ nel rapporto tra un dato significato del lemma e le relative schede-fonte: può accadere infatti che molte schede-fonte relative allo stesso testo di riferimento attestino numerose occorrenze del lemma con il medesimo significato, mentre può avvenire che una diversa accezione del lemma sia attestata solo in una scheda-fonte. A tale ridondanza il sistema permette di ovviare in fase di redazione di un dato lemma, ricollocando una o più schede ridondanti sotto un altro lemma al quale magari non era associata quella scheda-fonte (con medesima tecnica sono trattate le schede erroneamente collocate sotto un certo lemma o quelle dove il lemma in corso di redazione è illeggibile, ma nelle quali sono presenti altri lemmi rilevanti). Attualmente l’Indice è ancora in fase di aggiornamento, ma possono essere resi noti alcuni numeri sul lavoro svolto fino ad oggi dai ricercatori CNR e dagli altri collaboratori che negli anni hanno contribuito al progetto.
I lemmi completati dell’Indice semantico sono attualmente 1.184, mentre le voci rimaste da trattare sono 1252. Le accezioni inserite sono oltre 3.600, mentre i sintagmi rilevanti associati alle varie accezioni sono più di 55.000. Le varianti grafiche visibili sono 437.
Una caratteristica che fin dalle sue origini ha connotato il progetto era la possibilità di lavorare da remoto, grazie ad un software disponibile in Rete, al cui ambiente di compilazione si accede tramite user e password. Questo ha permesso nel tempo l’alternarsi di vari compilatori alla redazione, con la possibilità di associare il nome del redattore alla voce compilata. La redazione vede la sua sede operativa presso l’Istituto di Informatica Giuridica e Sistemi Giudiziari del CNR a Firenze, ma la possibilità di implementare la banca dati da remoto ha favorito la possibilità di collaborazione da parte di studiosi provenienti da diverse zone d’Italia. Attualmente la redazione del progetto è composta da undici persone (sette appartenenti al CNR e quattro collaboratori esterni volontari) tra i quali: giuristi, linguisti e tecnologi, il cui ausilio risulta fondamentale per la manutenzione tecnica del sistema e per gli sviluppi dell’interfaccia utente, resisi necessari negli anni per rendere più fruibile la banca dati.
Il sistema si è rivelato utile anche a fini didattici con l’organizzazione di master dedicati a studenti3 o operatori del diritto interessati alla storia della lingua del diritto italiano, ma potrebbe essere utilizzato anche per coinvolgere “gruppi e comunità, associazioni e capillari reti culturali” in una indagine storica che non può più limitarsi solo “al mondo accademico e scientifico; sebbene esso rimanga il luogo della ricerca e dell’accreditamento di qualità” (Ridolfi 2017, p. 5).
3. La banca dati per il linguista
Ogni scheda-fonte riporta, tramite una fotografia del testo a stampa, il contesto nel quale ricorre una determinata parola e, in alto a destra, la data di redazione del documento, l’autore, il titolo, (la data di pubblicazione del documento se non coincidente con quella del documento), il capitolo, il paragrafo e la pagina di riferimento (si veda Fig. 1).
Fig. 1: scheda-fonte associata al lemma “usufrutto”
Cliccando su uno dei lemmi inclusi in IS-LeGI (es. udienza, cfr. Fig. 2), è possibile osservare la frequenza assoluta della voce in tutte e tre le tipologie di testo giuridico, le sue varianti grafiche, il significato del lemma e le sue accezioni. Tramite un collegamento ipertestuale attivato dalla digitazione della freccetta a fianco ad ognuno dei significati riportati, si accede direttamente alle risorse documentarie (schede-fonti) nelle quali la parola è attestata e alla fraseologia associata. In questo modo è possibile osservare direttamente in quale documento ricorre la prima attestazione della voce e monitorare diacronicamente l’ingresso di una sua nuova accezione, o eventualmente di una sua scomparsa.
Fig. 2: schermata relativa al lemma selezionato
Come messo in luce dallo stesso Migliorini e, più recentemente, da Vittorio Coletti4, pochi dizionari di lingua italiana forniscono l’indicazione della data di prima attestazione del lemma o di una sua accezione, regolarmente fornita invece da grandi vocabolari stranieri. Con particolare riferimento alla data di prima attestazione di una voce, la consultazione di dizionari che esibiscono la data di nascita di una parola, può essere affiancata alla verifica di importanti risorse digitali, quali il corpus OVI e il vocabolario storico TLIO (Dell’Anna 2016, pp. 207-217) e, per il lessico giuridico, la banca dati IS-LeGI.
Tramite la banca dati IS-LeGI è possibile retrodatare voci rispetto al dizionario storico TLIO, al corpus OVI o, al GRADIT, per le accezioni non registrate nel TLIO e nell’OVI o per le voci posteriori al 1375. Ad esempio, è possibile retrodatare la locuzione buonafede “onestà, convinzione di agire rettamente, senza recare danno altrui” (1178-82; TLIO 1219, GRADIT 1321), il sostantivo bene nell’accezione di “proprietà in quanto oggetto di diritto” (av. 1250; GRADIT ca. 1274), il sostantivo clausola nell’accezione di “parte di un testo giuridico contenente una disposizione particolare” (1334; GRADIT 1396) e, ancora, il sostantivo compravendita “contratto con cui si trasferisce la proprietà di qualcosa in cambio di denaro” (1589; GRADIT 1857), debito “somma di denaro o di altro bene ricevuto in prestito” (1178; TLIO 1219; GRADIT 1306), monopolio (1322-23; corpus OVI5 1334; GRADIT 1332-37) ed il sostantivo utile nell’accezione di “utilità, frutto, vantaggio materiale o morale” (1219; GRADIT 1293-94), ma l’elenco delle retrodatazioni non si esaurirebbe di certo qui.
Inoltre, poiché la banca dati registra per ogni lemma tutte le accezioni riscontrate nelle schede-fonte che attestano la parola, è possibile datare l’entrata di una nuova accezione o di una locuzione associata ad un lemma (Aprile 2005, p. 56): così apprendiamo che la voce obbligazione, con il significato generale di “dovere imposto da norma morale o religiosa che interpella la coscienza personale”, risulta attestata la prima volta in un volgarizzamento del 1250 intitolato l’Arte notaria volgarizzata di Rainiero da Perugia (Monaci 1955, pp. 67-68) tecnicizzandosi giuridicamente solo cinquant’anni dopo, quando risulta attestata con l’accezione più tecnica di “rapporto giuridico in virtù del quale una determinata persona, il debitore, è tenuta ad una prestazione nei confronti di un’altra persona, il creditore, che ha diritto ad esigere l’adempimento di tale prestazione” all’interno dello Statuto dell’Università ed Arte della Lana di Siena diviso in otto distinzioni (1298-1308) (cfr. Polidori 1863, p. 156). Ancora, è possibile osservare la storia linguistica di locuzioni correlate ad una specifica voce. Il sostantivo utile è attestato, a partire dal 1377, all’interno della locuzione giuridica “dì/giorni utili” per indicare propriamente il periodo in cui è possibile agire in giudizio o compiere una data azione, dal 1463 è documentata la distinzione tra utile pubblico e utile privato (Pampaloni 1463, p. 119) mentre, all’interno di una missiva datata 18 dicembre 1497 (Lettera dell’ambasciatore Raimondo di Soncino per Ludovico il Moro6), possiamo osservare la prima attestazione in lingua volgare della locuzione utile dominio (lat. utile dominium), istituto di elaborazione medievale che individuava la facoltà di godimento pieno di un fondo da parte di un enfiteuta, il quale aveva il dovere di migliorare il terreno e pagare un canone al proprietario terriero7. Il redattore, infatti, a partire dalla lettura delle schede-fonte associate ad un dato lemma, mette a disposizione dell’utente la fraseologia rilevante, i sintagmi ripetuti, eventuali espressioni idiomatiche (es. “usufrutto legale”, “avere voce in capitolo”, “in persona e in avere”, etc.). Ad esempio, al lemma usucapione sono associate le seguenti fraseologie: “usucapione abbreviata”, “usucapione completa”, “usucapione costitutiva”, “usucapione ordinaria”, “usucapione pro herede”, “usucapione straordinaria”, “usucapione traslativa”. Per ognuna di esse è possibile accedere, tramite collegamento, alla relativa scheda-fonte e conoscere la data del documento nel quale ricorre l’attestazione più antica della voce.
Con specifico riguardo al significato di una voce, la banca dati categorizza, sulla base di un inserimento manuale ad opera del redattore, ogni accezione riscontrata nelle singole schede: lo scopo è quello di raccogliere tutti i significati attestati nel corso del tempo, monitorare quelli ancora in uso e quelli eventualmente scomparsi. Interessante è il caso della voce appalto, che si diffonde a partire dal XVI secolo con il significato specifico di “contratto con il quale una persona o un’impresa si impegnano con propri mezzi e a proprio rischio nei confronti di un committente a compiere un’opera o un servizio dietro corrispettivo di denaro”, mentre, nel 1722 la voce è attestata nel Lunario istorico pratese del conte G. Casotti all’interno della locuzione “andare in appalto” con un diverso significato, per indicare figurativamente le donne che si prostituivano (il corsivo è nostro): “se pure ciò non sia seguìto per esser cessata nelle donne l’occasione di convertirsi come ci era in quel tempo, e per molto tempo dopo che esse andavano fino in appalto” (Casotti 1722, p. 168).
Sfogliando la documentazione d’archivio a disposizione, l’utente si accorgerà subito che moltissime schede raccolgono un patrimonio linguistico vastissimo che copre numerose varietà di italiano antico (volgare umbro-marchigiano, veneziano, emiliano, napoletano, etc.) costituendo, di certo, materiale preziosissimo per il dialettologo e lo storico della lingua italiana che intendono osservare un ristretto ambito lessicale, quello giuridico. Ci si può imbattere, ad esempio, nella Carta fabrianese del 1186, un atto scritto in latino e volgare, con cui un nobile si accorda con il monastero di San Vittore delle Chiuse circa la ripartizione dei “frutti” del loro “consorzio”, o nella Carta picena del 1193 con cui un notaio stipula un rogito per una vendita di terre (Marazzini-Maconi 2010, p. 96). Ancora, si possono trovare testi in volgare veneziano, come L’assicurazione a Venezia, cfr. (Stefani 1956, p. 323-627) un documento redatto il 31 ottobre 1429 nel quale si scorge la sonorizzazione della consonante -c- in posizione intervocalica (dico > digo, cfr. Cortelazzo-Marcato-De Blasi-Clivio 1982, p. 125) e la sostituzione dell’affricata dentale sonora /dz/ con /z/ (es. zudixio) o testi in volgare emiliano, come il Testamento di Fiorese di Pinceti cfr. (Migliorini-Folena, 1952) redatto a Modena il 1° Maggio 1384 nel quale ricorre, tra l’altro, una tra le prime attestazioni dell’aggettivo vedovale all’interno di scritti giuridici privati.
Un ultimo strumento, ma non per importanza, a disposizione del linguista e del filologo per lo studio di un dato lemma, è la possibilità di vedere raccolte in una sezione apposita della pagina tutte le varianti grafiche o fonetico/dialettali documentate nelle schede (es. varianti di azione: attione, atione, azzione, actione, açione, acione, azone, aççione) al fine di ottenere una raccolta sistematica di tutto il materiale lessicale a noi giunto.
Per concludere, affiancare l’uso della banca dati IS-LeGI ad altre banche-dati disponibili online o a vocabolari storici della lingua italiana, può essere utile allo storico della lingua e al lessicografo per i seguenti motivi:
4. La banca dati per le altre discipline umanistiche
Come abbiamo visto, il linguista e il filologo hanno a disposizione uno strumento grazie al quale valutare le molteplici sfumature del lessico giuridico che variano col passare del tempo, ma le risorse digitali della banca dati supportano anche studiosi di altre discipline.
In primo luogo chi voglia studiare la storia del diritto attraverso la terminologia e l'evolversi dei diversi istituti giuridici. Così sarà possibile visionare le 199 schede immagine che contengono la parola cittadinanza e che attestano la storia di questa parola dal 1401 al 1965, al fine di identificare le “diverse forme storiche” che tale istituto ha conosciuto nel corso del tempo (Balibar 2012, p. 12). Più in generale, sarà possibile, per chi voglia studiare l’evolversi della nostra società attraverso i vari significati dati nel tempo alle parole, avvalersi della banca dati visualizzando direttamente le schede con l’immagine del testo, rendendo quindi disponibile allo studioso la consultazione diretta delle fonti in un Paese nel quale è molto difficile e faticoso giungere a contatto con i testi e i documenti (Prosperi 2021, p. 7). Ad esempio, in studi recenti è stato verificato l’uso che nel linguaggio giuridico si fa e si è fatto di parole molto discusse quali identità, o razza.
La prima parola è presente in IS-LeGI in 136 contesti e l'arco di tempo in cui è attestata va dal 1593 al 1965. La presenza del termine inteso come identità di un gruppo sociale non è presente, quindi, nei corpora di documenti giuridici più antichi, mentre appare nella legislazione più recente, come evidenziato dall’analisi effettuata sul Portale Normattiva. In particolare, la parola con il significato appena evidenziato pare diffondersi dagli anni Novanta del secolo scorso, periodo a partire dal quale l’Italia è maggiormente interessata dal fenomeno migratorio (Cammelli-Fioravanti-Romano 2020, p. 190).
Quanto alla parola “razza”, come noto, negli ultimi anni una parte dell’opinione pubblica, così come un nutrito gruppo di studiosi e accademici sostiene che si debba modificare l’articolo 3 della Costituzione per eliminare questa parola dal testo della Carta fondamentale. Il tema è di attualità anche in altri Paesi europei (in Francia nell’articolo 1 della Costituzione ogni riferimento alle differenze di razza e di genere è stato emendato). Attraverso l’analisi dei documenti presenti in IS-LeGI, ma anche in altre banche dati del CNR è emerso che l’uso della parola razza per riferirsi a 'ciascuno dei gruppi omogenei in cui si suddividerebbe l’umanità' (GDLI 1990, p. 586) o comunque a un 'gruppo etnico' inizia nel XX secolo (Cammelli, Fioravanti e Romano, 2019 pp. 191-200, ma sull’origine della parola e sul dibattito in assemblea costituente circa l’opportunità di usare il termine cfr. Leonardi 2018).
In conclusione possiamo affermare che la banca dati descritta coniuga le possibilità insite negli strumenti tecnologici di conservare e reperire velocemente le informazioni richieste, con quella di verificare direttamente anche l’immagine del contesto da cui una data parola è tratta, andando dunque a colmare le criticità che un accesso meramente “mediato dalla tecnologia” può comportare negli studi umanistici (Tomasin 2017, p. 135).
In prospettiva futura rimane da segnalare che quando le parole dell’Indice saranno state tutte compilate, si aprirà una nuova fase in cui si dovrà decidere se continuare l’implementazione dell’Indice aggiungendo nuovi termini. In caso positivo sarà necessario verificare come effettuare la scelta delle nuove parole su cui lavorare. Una possibile soluzione potrebbe essere quella di consultare la comunità scientifica su questo tema, per capire quali termini aggiungere all’Indice o, eventualmente, se trattare termini di una determinata branca del diritto, oppure di interesse anche per altri ambiti scientifici (filosofico, delle scienze politiche, etc.).
Nota bibliografica
Gli archivi IS-LeGI e Vocanet-LLI sono accessibili rispettivamente ai seguenti indirizzi: http://www.ittig.cnr.it/BancheDatiGuide/vgi/islegi/ e http://www.ittig.cnr.it/BancheDatiGuide/Vocanet-LLI/index.html (ultimo accesso il 24/03/2022).
Il numero dei lemmi ancora da redigere fa riferimento al mese di marzo 2022.
Attualmente, l’archivio è usato a fini didattici nell’ambito dei percorsi per le competenze trasversali dell’orientamento degli studenti delle scuole superiori di area fiorentina (PCTO).
Intervento tenuto da Vittorio Coletti il 18 dicembre 2019 presso l’Accademia della Crusca all’interno di un ciclo di lezioni dal titolo Strumenti per la didattica dell’italiano: dizionari e risorse in rete. La lezione è consultabile al seguente indirizzo: https://www.youtube.com/watch?v=BWF8XgS2lro&t=570s (ultimo accesso il 22/03/2022).
La voce non è lemmatizzata sul TLIO, ma è attestata nel corpus OVI, all’interno dello Statuto dell’Arte di Calimala del 1334 (cfr. Paolo Emiliani-Giudici, Storia dei Comuni italiani, vol. III, Firenze, Le Monnier, 1866, p. 210).
Il documento è contenuto all’interno del volume: Bruno Migliorini, Gianfranco Folena (a cura di), Testi non toscani del Trecento, Modena, società tipografica modenese, 1953, p. 146.
Per un maggior approfondimento, rimandiamo a: Paolo Grossi, Il dominio e le cose. Percezioni medievali e moderne dei diritti reali, Milano, Giuffrè, 1992.