DOI 10.35948/2532-9006/2025.37453
Licenza CC BY-NC-ND
Copyright: © 2025 Accademia della Crusca
Nella società in cui viviamo abbiamo ormai accesso a un’enorme quantità di dati, disponibilità che continuerà a crescere a ritmi sostenuti, anche grazie alla potenza di calcolo e di elaborazione delle nuove tecnologie e dell’intelligenza artificiale. Il cambiamento tecnologico non ha solo a che vedere con l’aumento della capacità analitiche, ma porta con sé la possibilità di archiviare, conservare, condividere, riutilizzare grandi volumi di dati su scala globale. Ciò implica anche nuovi approcci alla condivisione della conoscenza scientifica, tra cui quello della scienza aperta (open science), “basato su collaborazione, condivisione aperta e tempestiva dei risultati, modalità di diffusione della conoscenza basate su tecnologie digitali in rete e metodi trasparenti di validazione e valutazione dei prodotti della ricerca” (Piano Nazionale per la Scienza Aperta (PNSA) 2021-2027, mur.gov.it, 6/2022, p. 1).
La trasformazione digitale ha messo in atto cambiamenti che non coinvolgono soltanto la dimensione tecnologica, economica, culturale e sociale, ma anche quella linguistica: del resto, la lingua è da sempre lo specchio della trasformazione della società. Tra le parole chiave legate alla scienza aperta e alla digitalizzazione, una delle più rilevanti è FAIR, acronimo di Findable, Accessible, Interoperable, Reusable (‘Rintracciabile, Accessibile, Interoperabile, Riutilizzabile’) usato come aggettivo invariabile in relazione a dati e metadati (cioè dati che servono per descrivere altri dati).
Il termine fa riferimento a una serie di princìpi per la gestione dei dati della ricerca, intendendo con dati ‘qualsiasi materiale raccolto, usato, prodotto durante tutte le fasi del processo di ricerca’. I dati FAIR assumono un ruolo centrale nel Cloud Europeo della Scienza Aperta (European Open Science Cloud - EOSC), una piattaforma cloud per la ricerca europea, e nel contesto delle Infrastrutture di Ricerca (IR), organizzazioni che comprendono “strutture, risorse e servizi collegati, che sono usati dalle comunità di ricerca per condurre ricerca e promuovere l’innovazione nei rispettivi settori”, come definite dal Regolamento (UE) n. 1291/2013 del Parlamento Europeo e del Consiglio dell’11 dicembre 2013, art. 2, che istituisce il programma quadro di ricerca e innovazione (2014-2020).
Ma com’è nato l’acronimo FAIR? E cosa significa strutturare i dati secondo i princìpi FAIR?
Nel 2014 si è tenuto a Leida, nei Paesi Bassi, un workshop Lorentz intitolato Jointly Designing a Data Fairport (‘Progettare insieme un Data Fairport’) a cui partecipava un ampio gruppo di accademici e di soggetti privati interessati al tema del riutilizzo dei dati. Dalla discussione è emerso che, attraverso la definizione di un set minimo di pratiche e princìpi guida, è possibile scoprire, integrare, riutilizzare in modo appropriato e citare adeguatamente le grandi quantità di informazioni generate dalla ricerca scientifica. In occasione del workshop è stata formulata la bozza di una lista di princìpi fondamentali utili a garantire un uso ottimale dei dati della ricerca, i quali sono stati poi elaborati in modo più dettagliato da uno dei gruppi di lavoro, FORCE11, una comunità di studiosi, bibliotecari, archivisti, editori e finanziatori della ricerca; i princìpi sono stati pubblicati ufficialmente nel 2016, con il nome di FAIR Guiding Principles (Mark D. Wilkinson et al., The FAIR Guiding Principles for scientific data management and stewardship, “Sci Data”, 3, 2016).
Così, tra il 2014 e il 2016, l’acronimo FAIR inizia a circolare nella comunità scientifica, a indicare l’insieme dei requisiti che i dati e i risultati della ricerca devono rispettare per aderire a un modello di scienza aperta. I dati devono essere rintracciabili (findable), ovvero descritti con metadati appropriati, come parole chiave significative che possono aiutare nell’indicizzazione; a ogni dato dovrà essere attribuito un identificativo univoco e stabile (PID, Persistent Identifier), riferimenti per le risorse digitali che permettono la corretta citazione e attribuzione. Un esempio di PID sono i DOI (Identificatori di Oggetti Digitali), usati per identificare articoli scientifici, dataset e software. I dati devono inoltre essere accessibili (accessible) e devono durare nel tempo. La scelta del repository in cui depositare i dati è di fondamentale importanza per garantire l’archiviazione a lungo termine. L’accessibilità non implica necessariamente l’apertura dei dati: questi potranno essere liberamente accessibili o resi accessibili attraverso sistemi di autenticazione e autorizzazione; in tal caso dovranno essere esplicitate le possibilità di accesso e di riutilizzo dei dati e dei metadati. Per essere interoperabili (interoperable), i dati devono poter essere integrati e utilizzati con altri dati o strumenti e in diversi contesti: devono quindi essere utilizzati formati standard e aperti, ed è consigliabile l’uso di vocabolari controllati, ontologie e tassonomie. Affinché siano riutilizzabili (reusable), i dati devono essere ben descritti e documentati: ad esempio, devono essere specificate in modo chiaro e accessibile le licenze d’uso. Anche la documentazione relativa alla raccolta e produzione dei dati è indispensabile per il riutilizzo da parte di altri.
Risulta piuttosto complesso individuare l’entrata dell’acronimo FAIR nella nostra lingua, sia per l’altissima frequenza con cui il termine occorre (la ricerca nelle pagine in italiano di Google restituisce, al 19 aprile 2025, 21 milioni e 600 mila occorrenze), sia per la quantità di rumore presente nei risultati della ricerca. È infatti difficile distinguere l’acronimo dalle forme inglesi omografe, quali il sostantivo fair ‘fiera’ e l’aggettivo fair ‘giusto, imparziale’, che si trova in alcune locuzioni inglesi usate anche in italiano (fair play ‘gioco corretto’, fair trade ‘commercio equo e solidale’, fair value letteralmente ‘valore, prezzo equo’) e in alcuni nomi propri (ad esempio la rivista “Vanity Fair”). Oltre ad essere omografe, in inglese le forme sono anche omofone: vengono pronunciate, secondo l’OED, in inglese britannico /fɛː/ e americano /fɛ(ə)r. In italiano, invece, nonostante l’omografia, la pronuncia è diversa: nell’uso corrente dei ricercatori e tecnologi coinvolti nei vari settori della ricerca italiana, la pronuncia dell’acronimo è infatti /feir/, mentre quella del sostantivo e dell’aggettivo fair è /fer/.
La prima attestazione individuata risale al 2016, in occasione del workshop internazionale FAIR Data Management: Best Practices and Open Issues (‘Gestione dei dati FAIR: buone pratiche e problemi aperti’), tenutosi a Firenze il 14 e 15 novembre e organizzato dalla Research Data Alliance (RDA), in collaborazione con diverse università italiane e con il supporto del CNR, dell’Associazione Italiana per la Promozione della Scienza Aperta (AISA) e dell’Open Access Infrastructure for Research in Europe (OpenAIRE). Il resoconto dell’incontro è stato pubblicato a gennaio dell’anno successivo (FAIR Data Management: Workshop di Research Data Alliance (RDA) a Firenze, a cura di Valentina Lepore e Silvia Vellani, “Bibelot”, 22/3, 2016, pp. 34-41).
Sembra quindi che il termine sia stato immediatamente accolto dalla comunità scientifica internazionale, tanto che anche l’entrata nella nostra lingua avviene fin da subito. Contribuirà fortemente alla diffusione dei princìpi FAIR nel contesto nazionale la traduzione italiana delle Linee guida per l’applicazione dei princìpi FAIR alla gestione e al riuso dei dati, realizzata nel 2019 nell’ambito del progetto PARTHENOS (Pooling Activities, Resources and Tools for Heritage E-research Networking, Optimization and Synergies), iniziativa nata con l’obiettivo di rafforzare la coesione della ricerca nel settore degli studi umanistici e dei beni culturali attraverso l’integrazione delle Infrastrutture di Ricerca (IR) europee esistenti.
Abbiamo finora parlato esclusivamente di FAIR, ma vi sono altre parole strettamente collegate all’acronimo e all’applicazione dei requisiti da questo designati: i prestiti integrali FAIRness e fairification, il sostantivo fairificazione e il verbo fairificare. Mentre l’acronimo è scritto sempre in maiuscolo, anche per distinguerlo dalle forme omografe, la grafia delle altre parole oscilla tra la variante tutta minuscola (che scegliamo di usare, tranne per FAIRness distinguendolo così dall’omografo fairness ‘imparzialità, correttezza’, ormai diffuso anche in italiano) e la variante con l’indicazione dell’acronimo in maiuscolo: FAIRification, FAIRificazione, FAIRificare. Avendo come base l’acronimo FAIR, le voci seguono la stessa pronuncia /feir/.
FAIRness è un prestito integrale dall’inglese, derivato dall’acronimo FAIR con il suffisso -ness, usato per formare nomi che indicano ‘lo stato di, la qualità di’ e solitamente aggiunto ad aggettivi (dark ‘oscuro’> darkness ‘oscurità’; happy ‘felice’ > happiness ‘felicità’). Il sostantivo FAIRness indica ‘l’essere FAIR’ (l’acronimo è infatti usato come aggettivo) ed è più specificamente usato con il significato di ‘(grado di) conformità ai princìpi FAIR’.
In inglese, il sostantivo è coevo all’acronimo da cui deriva: se ne trova già traccia nel suddetto documento del 2016 in cui sono pubblicati ufficialmente i princìpi FAIR:
The emphasis placed on FAIRness being applied to both human-driven and machine-driven activities, is a specific focus of the FAIR Guiding Principles that distinguishes them from many peer initiatives. [L’enfasi posta sull’applicazione della FAIRness sia alle attività svolte dagli esseri umani sia a quelle svolte dalle macchine è un aspetto specifico dei Princìpi Guida FAIR che li distingue da molte altre iniziative analoghe. Traduz. mia]
In italiano le prime attestazioni iniziano nel 2019, in riferimento alla già citata iniziativa EOSC:
Nella strategia di EOSC-Pillar le iniziative nazionali rappresentano un elemento chiave per il raggiungimento dell’obiettivo in quanto già concepite per attrarre e coordinare vari elementi dell’ecosistema EOSC è per la loro sostenibilità. Federando queste iniziative e promuovendo politiche comuni, servizi orientati alla FAIRness dei dati, standard e soluzioni tecniche condivise, EOSC-Pillar ambisce a diventare un catalizzatore dell’offerta di servizi e dati messi a disposizione tramite il portale EOSC. (Il progetto EOSC-pillar verso la realizzazione dell’Europen Open Science Cloud, cnr.it, 17/7/2019)
A differenza degli altri termini derivati da FAIR che, come vedremo più avanti, hanno un corrispettivo nella nostra lingua, FAIRness non ha un traducente italiano. In italiano il suffisso -ness può essere reso con -ità, -ezza, -anza, -aggine, -itudine, ma nessuna formazione con tali suffissi sembra aver preso piede (ad esempio FAIRità o FAIRitudine). Si nota invece l’esistenza in francese delle voci sinonimiche FAIRitude o maturité FAIR e in spagnolo dell’espressione madurez FAIR, mentre il tedesco mantiene, come l’italiano, il prestito inglese integrale (si veda a tale proposito il vocabolario multilingue SSHOC Multilingual Data Stewardship Terminology s.v. FAIRness dei dati).
Il sostantivo inglese fairification indica il ‘processo di adeguamento (dei dati) ai princìpi FAIR’. L’adattamento italiano fairificazione si affianca alla forma inglese che, nella nostra lingua, risulta ancora maggiormente diffusa. Il verbo fairificare è usato con il significato di ‘rendere (i dati) conformi ai princìpi FAIR’.
La voce fairification risulta attestata in inglese a partire dal 2019 ed è probabilmente un deverbale da to fairify, testimoniato già nel 2018, derivato dall’acronimo FAIR con il suffisso -ify, che esprime il valore di ‘fare, rendere’ (simple > to simplify > ‘rendere semplice’) e corrisponde al suffisso italiano -ificare (to simplify ‘semplificare’, to gamify ‘gamificare’).
In italiano fairification entra come prestito non adattato a partire dal 2020. Riportiamo le prime occorrenze che siamo riusciti a reperire:
Il primo passo per (ri)utilizzare i dati è trovarli. I metadati e i dati dovrebbero essere facili da trovare sia per l’uomo che per il computer. I metadati leggibili meccanicamente sono essenziali per il rilevamento automatico di set di dati e servizi, quindi questo è un componente essenziale del processo di “FAIRification”. (Simone Aliprandi, Che cosa significa “dati FAIR”?, aliprandi.blogspot.com, 9/7/2020)
EJP-RD: strumento per la FAIRification dei registri di pazienti. Il Programma Congiunto Europeo per le Malattie Rare (EJP-RD) sta lavorando per rendere i registri di malattie rare FAIR (Findable, Accessible, Interoperable, Reusable – rintracciabili, accessibili, interoperabili, riutilizzabili). (traduzione in italiano di una notizia apparsa sul sito vascern.eu, non più disponibile, segnalata nell’edizione del 15/8/2020 della newsletter OrphaNews, sul sito italia.orphanews.org)
Per spiegare le forme italiane a livello morfologico, una prima ipotesi è che fairificare sia un calco traduzione di to fairify e fairificazione il nome d’azione derivato dal verbo fairificare. In italiano il suffisso verbale denominale -ificare e il suffisso nominale deverbale -azione sono sempre stati molto produttivi, così come lo sono le forme corrispondenti in inglese.
In alternativa, si potrebbe supporre che il sostantivo femminile fairificazione sia nato come calco dell’inglese fairification, di cui è coevo, e che il verbo fairificare sia una retroformazione dal sostantivo. Questa seconda ipotesi è supportata dal fatto che il verbo risulta attestato successivamente rispetto al sostantivo, seppure di poco. Oltretutto, mentre la forma inglese fairification è piuttosto diffusa, anche più della corrispettiva italiana, il verbo to fairify non sembra essere molto usato in contesti italiani (la ricerca nelle pagine in italiano di Google restituisce, al 19/4/2025, soltanto 95 risultati, e la quasi totalità è inserita in contesti in lingua inglese).
Anche nella stessa traduzione italiana delle già citate Linee guida per l’applicazione dei princìpi FAIR alla gestione e al riuso dei dati, la cui versione originale è stata pubblicata alla fine del 2018, con il nome GUIDELINES to FAIRify data management and make data reusable, il verbo to fairify non viene reso con fairificare ma al suo posto si usa l’espressione ‘applicazione dei princìpi FAIR’.
La prima occorrenza rintracciata di fairificazione risale a giugno 2020: il sostantivo viene usato come titolo di una sezione nella presentazione dell’incontro Come produrre FAIR DATA tenutosi nell’ambito del ciclo “I mercoledì SUPSI [Scuola universitaria professionale della Svizzera italiana, ndr] dell’Open Science” a cura di Iolanda Pensa e Alessandro Pierno. Se ne ha poi una successiva documentazione nel sito Eventi GARR, nella pagina dedicata ad Alessandro Sulis, uno dei relatori del convegno GARR 2021 Sostenibile/Digitale - Dati e tecnologie per il futuro tenutasi online il 7-15 giugno 2021, i cui “attuali interessi di ricerca comprendono lo studio e la promozione dei princìpi FAIR, nel contesto di progetti legati alla FAIRificazione di dati e metadati in ambito clinico”.
Il verbo è attestato, nella forma del participio passato, nel novembre 2021 in un bando relativo al reclutamento di ricercatori sul PON “Ricerca e Innovazione” 2014-2020:
Tale strumento risulterebbe collateralmente utilissimo per raccogliere ulteriori dati sulla patologia su database fairificati (redcap) anche in merito all’utilizzo dei nuovi farmaci a bersaglio molecolare.
Le occorrenze seguenti sono entrambe del 2022:
Chi supporta i ricercatori nel “FAIRificare” i dati è il data steward. Si tratta di una figura di elevata professionalità, a livello di dottorato di ricerca, con profonda conoscenza dei dati di una specifica materia o area disciplinare, che acquisisce poi una serie di competenze trasversali legate al web semantico, agli aspetti legali, agli standard in vigore in una disciplina. (Elena Giglia, Il riuso nel contesto di EOSC e di Horizon Europe, in Atti del Convegno di studi “Fare per non sprecare. Nei laboratori del riuso digitale” (Roma, 9-10 giugno 2022), a cura di Gianfranco Crupi, Paola Castellucci, Antonella Sbrilli, “DigItalia”, XVIII/2, 2023, p. 118)
L’applicazione dei 15 princìpi guida per i dati FAIR consente, infatti, interrogando le diverse risorse FAIR, di linkare i dati FAIRificati, nel rispetto delle restrizioni di accesso dei dati stessi, e ottenere in un minor tempo le risposte alle “cross resource questions”, essendo i dati leggibili non solo dall’uomo ma anche dalle macchine. […] Il Centro Nazionale Malattie Rare fin da quando è stato coniato l’acronimo “FAIR Data” nel 2014 è stato in prima fila sostenendo l’importanza dei princìpi guida per la comunità delle malattie rare, organizzando all’ISS diverse attività formative internazionali tra cui il “Bring Your Own Data”, in cui i partecipanti affiancati da IT (Information Technology) trainer internazionali e nazionali hanno modo di FAIRificare i loro primi dati provenienti da “use cases” e osservare le potenzialità dei dati FAIRificati. (FAIR Data, una grande opportunità per la ricerca nel campo delle malattie rare, malattierare.gov, 4/7/2022)
Nessuno dei termini esaminati è registrato dai dizionari italiani, né da quelli inglesi. Non stupisce l’assenza anche nei principali quotidiani nazionali, data la natura prettamente specialistica dei contesti in cui sono usati. Troviamo un’unica attestazione dell’acronimo sul sito della “Repubblica”, ma si tratta di un riferimento all’interno di una pubblicità. Si rintraccia invece qualche occorrenza di FAIR nel sito e nelle pubblicazioni settimanali del “Sole 24 Ore” e in alcune riviste di ambito istituzionale, quali “Agenda Digitale”, la testata che si occupa di temi legati al digitale e alla Pubblica Amministrazione, e “GARR News”, la rivista dedicata alla comunità GARR, la rete telematica italiana per l’istruzione, la ricerca e la cultura. Riportiamo alcuni esempi tratti da queste riviste:
La Commissione europea suggerisce di seguire i principi Fair (Findable-Accesible-Interoperable-Reusable): identificare i dati utili, pacchettizzarli [sic] per renderli accessibili, archiviarli in una infrastruttura adeguata; prevedere una fase di integrazione ossia la possibilità di spostare e combinare dati di settori diversi, e infine una policy per la loro gestione e governance. (Alessandro Longo, Alle aziende servono banda, cloud e potenza di calcolo, numero speciale Intelligenza artificiale, “Il Sole 24 Ore”, 8/3/2023, p. 14)
La gestione dei dati secondo i principi della scienza aperta riveste sempre maggiore importanza in ambito globale. In questo quadro, i concetti di riuso, accesso e interoperabilità (FAIR, ovvero Findable, Accessible, Interoperable, Reusable) hanno assunto un ruolo primario nella gestione dei progetti e delle infrastrutture di ricerca, tanto da essere spesso posti come vincolo alla concessione di finanziamenti. (Marco Aldinucci, Rossana Damiano, Formazione dei data steward: l’Università di Torino apre la strada in Italia, agendadigitale.eu, 27/8/2024)
Un ponte per le competenze, invece, è quello costruito dal progetto Skills4EOSC, coordinato da GARR, che sta creando una rete europea di competence centre per sviluppare competenze nell’Open Science e nella gestione FAIR dei dati. Questi centri agiscono come nodi chiave per la formazione e la condivisione di buone pratiche, sostenendo una visione unitaria e inclusiva per la scienza aperta in Europa. (Claudia Battista, Il filo, garrnews.it, 18/12/2024)
Per quanto riguarda la diffusione attuale delle voci, si nota da una parte l’altissimo numero di occorrenze dell’acronimo FAIR (che, ricordiamo, ha nelle pagine in italiano di Google 21 milioni e 600 mila risultati, e ben 1 miliardo 810 milioni nella ricerca generale; non va però dimenticato che il rumore è molto alto), mentre risulta piuttosto contenuto il numero di attestazioni delle altre forme: 1.340 risultati per fairification, 276 per fairificazione, 42 per fairificare (a cui si possono aggiungere 14 occorrenze del participio passato; tutte le ricerche sono aggiornate al 19/4/2025). Anche il sostantivo FAIRness conta 2 milioni di risultati, ma come per FAIR risulta impossibile distinguere tra i significati delle forme omografe.
Al di là del numero di attestazioni, è evidente la centralità dell’acronimo FAIR (e dei termini collegati) all’interno del dibattito sui dati della ricerca nazionale ed europea. Lo testimoniano la registrazione di FAIR nelle terminologie di riferimento per la comunità europea, come IATE (Interactive Terminology for Europe - Terminologia interattiva per l’Europa; l’acronimo inglese è registrato in ben 19 lingue ufficiali dell’UE) e la forte presenza di tali vocaboli in contesti e documenti istituzionali, quali, ad esempio, il Piano Nazionale per la Scienza Aperta (PNSA) 2021-2027, il Piano Nazionale Infrastrutture di Ricerca (PNIR) 2021 – 2027, il Programma nazionale per la ricerca (PNR) 2021-2027 e le Linee Guida recanti regole tecniche per l’apertura dei dati e il riutilizzo dell’informazione del settore pubblico dell’Agenzia per l’Italia Digitale (Agid).