In questo contributo, si propone l’integrazione di strumenti avanzati di intelligenza artificiale con metodologie filologiche tradizionali per la ricostruzione del testo giuridico lacunoso delle Istituzioni di Gaio. L’analisi congiunta di modelli deterministici e probabilistici, supportata da un filtro semantico per l’analisi delle correlazioni testuali, ha mostrato risultati incoraggianti nel processo di recupero della scriptio continua. I software OCR-AM e Praevideo 1.12 svolgono ruoli complementari: il primo garantisce un efficiente riconoscimento ottico dei caratteri e delle abbreviazioni, mentre il secondo impiega una Rete Neurale Ricorrente Bidirezionale (BiRNN) abbinata ad un algoritmo deterministico per prevedere i caratteri mancanti. Test eseguiti su contesti specifici, come le lacune del folium 29r e del folium 11r, evidenziano il valore aggiunto del filtro semantico nel fornire integrazioni linguisticamente e stilisticamente plausibili. Nonostante l’impiego di un dataset limitato, i risultati confermano che i modelli di deep machine learning possono offrire un significativo supporto alla critica testuale e alla comprensione giuridica del testo gaiano. Ulteriori sviluppi prevedono l’ampliamento dell’addestramento e l’ottimizzazione dei modelli, gettando le basi per un’analisi filologica e giuridica più solida e completa del testo delle Istituzioni di Gaio contenuto nel Codex XV (13) della Biblioteca Capitolare di Verona.
Parole chiave: diritto romano, intelligenza artificiale, Istituzioni di Gaio, Codici palinsesti, Scriptio continua, apprendimento automatico avanzato (Deep Machine Learning), modelli di reti neurali ricorrenti bidirezionali (RNN bidirezionali), LSTM (Long Short-Term Memory), metodi probabilistici e deterministici, analisi semantica e statistica, recupero testuale, Biblioteca Capitolare di Verona.
This contribution presents the integration of advanced artificial intelligence tools with traditional philological methodologies for reconstructing the lacunose legal text of Gaius’ Institutes. The combined analysis of deterministic and probabilistic models, supported by a semantic filter for textual correlation analysis, has shown promising results in the recovery of scriptio continua. The OCR-AM and Praevideo 1.12 software perform complementary roles: the former ensures efficient optical recognition of characters and abbreviations, while the latter employs a Bidirectional Recurrent Neural Network (BiRNN) combined with a deterministic algorithm to predict missing characters. Tests conducted on specific contexts, such as the lacunae in folium 29r and folium 11r, highlight the added value of the semantic filter in providing linguistically and stylistically plausible integrations. Despite a limited dataset, the results confirm that deep
machine learning models can significantly support textual criticism and the legal understanding of Gaius’ text. Further developments will involve the expansion of training and the optimization of the models, laying the groundwork for a more robust and comprehensive philological and legal analysis of the text of Gaius’ Institutes contained in Codex XV (13) of the Capitular Library of Verona.
Key words: Roman law, Artificial intelligence, Gaius’ Institutes, Palimpsest codices, Scriptio continua, Advanced machine learning (Deep Machine Learning), Bidirectional Recurrent Neural Network models (Bidirectional RNN), LSTM (Long Short-Term Memory), Probabilistic and deterministic methods, Semantic and statistical analysis, Text recovery, Capitular Library of Verona.