Attività collaterali / Collateral events

San Galgano… a Palazzo San Galgano (ITA)

Virtual tour dell’abbazia di San Galgano: un viaggio nello spazio e nel tempo, attraverso dei visori VR di ultima generazione; il tour racconta le ricerche archeologiche, storiche e architettoniche realizzate tra 2019 e 2022 nel complesso abbaziale. Si può percorrere “una strada” lunga otto secoli, accompagnati alternativamente dal colono Giovanni Petrucci, vissuto a metà ‘800, da Ugolino di Maffeo – cioè colui che completò l’abbazia nel 1278 – e da un archeologo di oggi. Esperienza immersiva in una realtà alternativa che permette di muoversi come un avatar nel monumento, nelle ricostruzioni seguite agli scavi archeologici, nelle diverse classi di reperti, offrendo uno spazio al tempo stesso di svago e di apprendimento.

When: 7 June, 9.00-9.45

Language: italiano

Tickets: 15

Where: Palazzo San Galgano, Via Roma 47

Organization: Dipartimento di Scienze storiche e dei Beni Culturali

Fab Lab (EN)

The Fab Lab of the University of Siena is an open space for innovation, learning, design, and small-scale prototyping. Our Fab Lab model is based on the awareness that a cohesive and resilient society is built upon open access to knowledge, technologies, and spaces for co-creation and co-design of solutions. Established in 2016, the Fab Lab has distinguished itself as a space for innovation in the fields of inclusion, accessibility, health, cultural heritage, and sustainability. We collaborate with the local community, providing public and private institutions and businesses with knowledge, technologies, and machinery to develop innovative projects and facilitate access to digital technologies. We conduct research, offer training, and develop solutions that can reach a high level of maturity, even leading to patents. During the visit to the lab spaces, we will explain the main techniques of digital fabrication and how they can be integrated into a rapid prototyping process that enables an agile and iterative development model from the original idea to a functional product.

When: 6th June, 17.30-18.30

Language: english

Where: Santa Chiara Lab

Organization: FAB-LAB

Tickets: 36

Fab Lab (ITA)

Il Fab Lab dell’Università di Siena è uno spazio aperto all’innovazione, all’apprendimento, alla progettazione e alla prototipazione su piccola scala.
Il nostro modello di Fab Lab si basa sulla consapevolezza che una società coesa e resiliente si fonda su un accesso aperto a conoscenze, tecnologie e spazi di co-creazione e co-progettazione di soluzioni.
Nato nel 2016, il Fab Lab si è caratterizzato come spazio di innovazione nei settori dell’inclusione, accessibilità, salute, beni culturali e sostenibilità. 
Collaboriamo con il territorio, offrendo ad istituzioni pubbliche e private e alle imprese conoscenze, tecnologie e macchinari per sviluppare progetti innovativi, e facilitare l’accesso alle tecnologie digitali.Facciamo ricerca, formazione e sviluppiamo soluzioni che possono raggiungere un alto livello di maturità fino al brevetto.
Nel corso della visita agli spazi del laboratorio verranno illustrate le principali tecniche di fabbricazione digitale e come queste possano essere integrate in un processo di prototipazione rapida che consente un modello di sviluppo agile e iterativo dall’idea al prodotto funzionante.

When: 7th June, 9.00-9.45 (Italiano)

Language: italiano

Where: Santa Chiara Lab

Organization: FAB-LAB

Tickets: 36

SAI-LAB, Siena Artificial Intelligence Lab

The focus of our research is on machine learning. In the last few years, we’ve been mainly involved in the conception of new theories of learning in structured domains and in their applications to pattern recognition and mining the web. We are also interested in facing popular puzzles using problem solving and, especially, in cracking crosswords. We strongly believe in the importance of technological transfer, but you can find us involved also in discussions on novel models of computation and in their relationships with human brain.

When: 7 June, 9.00-9.45

Language: english

Where: Palazzo San Niccolò

Organization: SAI-LAB, Dipartimento di Ingegneria dell’informazione e scienze matematiche

Tickets: 15

POSTER

1

Arnaud Barbe, Molka Tounsi Dhouib, Catherine Faron, Marco Corneli, Arnaud Zucker

Zoo-KG: A knowledge graph of zoological data 

2

Rodolfo Brancato, Marianna Figuera, Marianna Nicolosi-Asmundo, Daniele Francesco Santamaria, Paola Venuti, Giuseppe Zappala

 CoMOntology. Towards An Ontology for the Chronology of Mediterranean archaeologies: a model for the digital memory

3

Emiliano Degl’Innocenti, Monica Monachini, Alberto Bucciero, Enrico Pasini, Bruno Fanini, Francesca Frontini

 H2IOSC: Humanities and Heritage Open Science Cloud

4

Nilo Pedrazzini, Barbara McGillivray

 Diachronic and diatopic word embeddings from British historical newspapers

10.5281/zenodo.7974004

5

Barbara McGillivray, Iacopo Ghinassi, Paola Marongiu

The challenges of sense granularity in word sense disambiguation for Latin

10.5281/zenodo.7973992

6

Anas Fahad Khan, Michele Cavallaro, Rafael Cruz González, Javier Díaz-Vera, Francesca Frontini, Francisco Javier Minaya Gomez

Constructing an Old English WordNet: The Case of Guilt

7

Gloria Mugelli, Cristiana Franco

Proteus: marcatura di testi per una lettura antropologica del mito greco e romano

8

Simone Zenzaro, Angelo Mario Del Grosso, Federico Boschetti, Graziano Ranocchia

Ease the collaboration making Scholarly Editions: the GreekSchools case study 

10.5281/zenodo.7996084

9

Tamás Kovács, Franziska Decker, Daniel Luger, Florian Atzenhofer-Baumgartner, Georg Vogeler

Unsupervised Information Extraction from Medieval Charters

10

Alessia Prontera, Valeria Melis

Musisque Deoque: la nuova organizzazione dei testimoni manoscritti

DOI SLIDES: 10.6084/m9.figshare.23292842

11

Marco Sartor

Nel laboratorio di “Poeti d’Italia in lingua latina”: lavori in corso e prospettive future

10.5281/zenodo.7979279

12

Rachele Sprugnoli, Arianna Redaelli, Marco Sartor

Risorse linguistiche per lo studio dei Promessi Sposi

10.5281/zenodo.7979703

13

Alessia Valenti, Nicola De Nisco, Sandra Gorla

ITINERA: progetto, database e prospettive 

https://doi.org/10.6084/m9.figshare.23214476.v1

14

Elisa Conti

I Capricci d’un Re digitale

10.5281/zenodo.7977634

15

Matteo Maselli

Database Allegorico Dantesco

16

Giuseppe Zappalà, Antonio Di Silvestro, Pietro Sichera, Daria Spampinato

Per l’edizione digitale delle lettere familiari di Verga: un esperimento di analisi semantica

10.5281/zenodo.7990969

17

Angela Siciliano, Vanessa Bianconi, Angelo Mario Del Grosso 

“Voce dei Margini”: Le annotazioni di Giorgio Bassani

10.5281/zenodo.7996309

18

Luca Giovannini, Ingo Börner, Frank Fischer, Carsten Milling, Daniil Skorinkin, Peer Trilcke

Quali prospettive per ItaDraCor? Risorse e strumenti per la codifica di testi drammatici in lingua italiana

10.5281/zenodo.7963028

19

Sara Ermini, Martina Magri

L’approccio human-centered nella progettazione di un ecosistema digitale che massimizzi la diffusione del materiale diaristico preservando la sua singolarità

10.5281/zenodo.7936897

20

Anna Maria Marras, Andrea Bolioli

Libri, memoria e territorio: la digital library di Carlo Alberto

10.5281/zenodo.8004541

21

Stefania Riso

Un modello open data per l’interazione utente: la digital library Open Memory Apulia

22

Vincenzo Colaprice, Nicola Barbuti

Un atlante digitale per i borghi delle aree interne

10.5281/zenodo.7973984

23

Enrica Salvatori, Monica Bacci

I Confini della Lunigiana: un progetto di Digital Public History

24

Giulia Renda, Marilena Daquino

Storytelling with Linked Open Data

25

Giulia Fabbris, Chiara Aiola

Uso e riuso di dati per la valorizzazione del patrimonio culturale italiano online: buone pratiche per l’interoperabilità

10.5281/zenodo.7991793

26

Leonardo Canova, Francesco Coradeschi, Emiliano Degl’Innocenti, Federica Spinelli

Preservare il Tesoro. Per un nuovo sistema di interrogazione dei corpora dell’Opera del Vocabolario Italiano

10.5281/zenodo.7973831

27

Alessandro Alfredo Nannini

Un’ontologia per la classificazione semantica dei dizionari storici: l’esempio del LEI Digitale

https://doi.org/10.6084/m9.figshare.23244206.v1

28

Silvia Muzzupappa, Giorgio Maria Di Nunzio

Un modello di catalogazione digitale delle grammatiche bilingue di spagnolo per italofoni

10.5281/zenodo.7987866

29

Lorenzo Demma, Daniele Silvi

Memorizzare o ricordare? La memoria come fatto emozionale

30

Mauro De Bari

A methodological study on the projects developed by the Cologne Center for Humanities (CCeH)

10.5281/zenodo.7924322

31

Hansmichael Hohenegger, Federico Boschetti, Iacopo Chiaravalli, Fabio Ciotti, Eleonora De Longis, Angelo Mario Del Grosso, Tiziana Mancinelli

Metodologie di indagine per una nuova piattaforma: Digital Scholarly Editions Platform and Aligned Translation

32

Maria Chiara Mattacchione, Luca Del Greco

Tecnologie digitali per la realizzazione e adattamento di contenuti scolastici facilitati e semplificati

Workshop sulle edizioni digitali: preparazione con codifica XML TEI e visualizzazione con il software EVT

Giulia D’Agostino (Università degli Studi di Verona)

Giulia Fabbris (Università Ca’ Foscari di Venezia)

Roberto Rosselli Del Turco (Università di Torino)

ABSTRACT

Per il dodicesimo convegno annuale AIUCD “La memoria digitale. Forme del testo e organizzazione della conoscenza” proponiamo un workshop sulla preparazione di edizioni digitali XML TEI e la loro visualizzazione con il software EVT. Gli obiettivi principali del workshop sono due. In primo luogo, vorremmo stimolare riflessioni su trattamento e rappresentazione di dati testuali. In secondo luogo, miriamo a mostrare nel concreto come si costruisce, passo per passo, un’edizione digitale e come può essere visualizzata. Per quest’ultimo fine, insegneremo ad utilizzare EVT in modo che gli iscritti possano poi lavorare autonomamente e ottenere più consapevolezza del rapporto tra dati di partenza e software. Il workshop è rivolto a tutti coloro che sono interessati ad un esempio di workflow di gestione del materiale testuale.

filologia digitale, modellazione di dati, software di visualizzazione, XML TEI

Workshop “Trascrivere, analizzare e pubblicare documenti d’archivio: Transkribus e l’intelligenza artificiale al servizio dello storico”

Intelligenza Artificiale; Handwritten Text Recognition; Layout Analysis; Transkribus 

Sara Mansutti (READ-COOP SCE, Austria) e Salvatore Spina (Università degli Studi di Catania)

LINGUA: Italiano

QUANDO: lunedì 5 giugno, ore …

DOVE: Palazzo San Niccolò, Via Roma 56,

ABSTRACT

Il workshop ha l’obiettivo di riflettere sulle opportunità che l’Intelligenza Artificiale offre al ricercatore per lo studio di testi manoscritti e a stampa. Negli ultimi anni, l’uso dell’Intelligenza Artificiale si è fatto strada nell’ambito della ricerca umanistica e dei Beni Culturali, e uno dei maggiori campi di applicazione è stato quello della trascrizione automatica dei manoscritti. Utilizzando la piattaforma Transkribus – sviluppata nell’ambito del progetto europeo Horizon 2020 “READ” e oggi mantenuta e implementata dalla società cooperativa europea READ-COOP SCE –, i partecipanti impareranno ad allenare un modello di riconoscimento automatico del testo manoscritto (Handwritten Text Recognition), processare automaticamente layout complessi (es. tabelle e registri), arricchire manualmente o automaticamente il layout e il testo dei documenti tramite tag. Verranno, inoltre, mostrate varie possibilità per esportare e pubblicare online le trascrizioni, e per analizzarle al di fuori di Transkribus. 

Programma

  1. Lo scoglio dei testi manoscritti e le opportunità dell’Intelligenza Artificiale per lo storico
  2. L’impatto dell’Intelligenza Artificiale negli archivi
  3. Come addestrare modelli di Intelligenza Artificiale con Transkribus
  4. Come esportare le trascrizioni e pubblicarle
  5. Come analizzare le trascrizioni al di fuori di Transkribus
  6. Domande

Prerequisiti

Non è richiesta nessuna competenza o conoscenza pregressa per partecipare al workshop. Si richiede ai partecipanti di venire con il proprio laptop e di registrarsi alla piattaforma Transkribus.

Workshop “Codificare (al)l’Infinito”

LINGUA: Italiano

QUANDO: lunedì 5 giugno, ore

DOVE: Palazzo San Niccolò, Via Roma 56, aula , piano

Beatrice Nava (Huygens Institute, Netherlands)

Roberta Priore (Università di Bologna)

Abstract

Il workshop si propone di affrontare, attraverso il caso di studio dell’Infinito di Giacomo Leopardi, il nodo centrale della marcatura dell’apparato nella costruzione di edizioni genetiche digitali, con l’obiettivo di stimolare la discussione e la condivisione di esperienze per stabilire un modello condiviso per la codifica di situazioni testuali simili. “Codificare (al)l’Infinito” rappresenta dunque sia un momento di riflessione teorica sui problemi testuali legati alla codifica di testi a tradizione pluritestimoniale (manoscritta e a stampa), sia un banco di prova pratico per la risoluzione delle criticità che tale pratica comporta. Verrà proposto infatti un modello di marcatura XML/TEI della poesia, con particolare attenzione alle problematiche riscontrate in fase di modellizzazione e alla descrizione delle diverse soluzioni alternative finora trovate, a cui seguirà un laboratorio di marcatura XML/TEI degli Idilli leopardiani che con l’Infinito fanno sistema all’interno del “quaderno napoletano” e, in fine, un esercizio di visualizzazione con Edition Visualization Technology. A questo lavoro, individuale o di gruppo ma guidato dalle proponenti, e dunque affrontabile a partire da livelli di partenza diversi, seguirà la messa in comune dei risultati, la condivisione di esperienze di codifica simili, di soluzioni emerse in corso d’opera o di eventuali problemi ulteriori, per la costruzione collettiva di soluzioni applicabili a più situazioni testuali che costituisce, come anticipato, lo scopo principale, e più ambizioso, della presente proposta. 

Prerequisiti e strumenti

Si richiede una conoscenza, anche base, del linguaggio di codifica XML/TEI e un editor xml (sublime, oxygen, ecc.). Coloro che fossero interessati a discutere eventuali situazioni testuali particolari, nell’ultima fase del workshop, potranno presentare i loro materiali di lavoro. 

Workshop – Linda Spinazzè

Linda Spinazzè (Università Ca’ Foscari, Venezia)

Zotero per la gestione dei dati bibliografici e la ricerca collaborativa

gestione bibliografica; stile citazionale; ricerca collaborativa; team working; Zotero

Incontro finalizzato a passare in rassegna e approfondire le potenzialità e l’utilizzo del software di gestione bibliografica Zotero in un’ottica di ricerca collaborativa. Creare e mantenere ordinata una collezione di referenze bibliografiche e PDF; annotare, organizzare e classificare le informazioni in modo coerente nel tempo; produrre rapidamente bibliografie; modificare e personalizzare gli stili citazionali.

Consigli per prepararsi al workshop:

  1. Un account Zotero: https://www.zotero.org/user/register
  2. Installare Zotero Connector sul proprio browser (preferibilmente Firefox o Google Chrome)
  3. Installare Zotero Desktop

Linda Spinazzè, dopo essersi laureata in lettere moderne presso l’Università di Trieste, si è avvicinata al campo delle Digital Humanities conseguendo la laurea in informatica umanistica nel 2005 all’Università Ca’ Foscari Venezia. Nello stesso ateneo ha conseguito un dottorato in filologia classica e medievale con una borsa specifica sull’ecdotica digitale. Dal 2002 ha collaborato a vari progetti di ricerca nell’ambito delle DH e letteratura latina, e nel 2015 è stata Experienced Researcher in Digital Scholarly Editing presso MAynooth University (EIRE) all’interno della Marie Curie Actions: DiXit network (https://dixit.uni-koeln.de/). Dal 2020 lavora all’interno del Sistema Bibliotecario d’Ateneo come digital media specialist, ricoprendo sia ruoli nel settore supporto alla ricerca che occupandosi di preservazione e valorizzazione del Fondo Storico dell’Università Ca’ Foscari Venezia.

Quando: 11 maggio 2023, ore 17.00

Dove: via Webex per gli iscritti ai seminari, diretta streaming via YouTube all’indirizzo https://youtube.com/live/2QZa0BJ5bYk

Workshop – Tiziana Mancinelli

Tiziana Mancinelli

Introduzione a IIIF – International Image Interoperability Framework

Quando: 25 maggio 2023, ore 17.00

Questo workshop ha l’obiettivo di introdurre gli strumenti, gli standard e gli aspetti elementari dell’International Image Interoperability Framework (IIIF). In particolare, verranno prese in considerazione le API base del framework: API image (https://iiif.io/api/image/3.0/) e API Presentation (https://iiif.io/api/presentation/3.0/). 

Vedremo quali sono i vantaggi di questa tecnologia: come i contenuti sul web possano essere migliorati con IIIF in termini di accessibilità, interoperabilità e riuso e come è possibile utilizzare con contenuti già esistenti in altri progetti. 

Mostreremo poi come esporre queste risorse attraverso diversi visualizzatori abilitati all’API Image, OpenSeaDragon e all’API di presentazione IIIF, tra cui Mirador e Universal Viewer.

Non è richiesto nessun tipo di conoscenza pregressa.

Gli strumenti per seguire questo workshop:

  • Uno di questi due Browser: Firefox o Chrome; potrebbe essere utile avere a disposizione entrambi i browser. Installare l’estensione Web server per Chrome.

I materiali del workshop saranno disponibili su GitHub: https://github.com/tmancinelli/aspettandoaiucd-iiif 

Tiziana Mancinelli collabora con l’Istituto Centrale per la Digitalizzazione del Patrimonio Culturale e il VeDPH (Venice Centre for Digital and Public Humanities) presso Università di Venezia Ca’ Foscari. Ha partecipato e partecipa a progetti di respiro internazionale di Informatica Umanistica come esperta nella modellizzazione di edizioni e di digitalizzazione del patrimonio culturale

Dove: via Webex per gli iscritti ai seminari, diretta streaming via YouTube all’indirizzo https://youtube.com/live/RiUZ-wn_Tvc

Gli altri incontri

Workshop – Rachele Sprugnoli

 Rachele Sprugnoli (Università di Parma)

Introduzione al Natural Language Processing

Natural Language Processing, Trattamento Automatico del Linguaggio, Linguistica Computazionale, annotazione linguistica, pipeline

Il Natural Language Processing (NLP), anche noto in Italia con l’espressione Trattamento Automatico del Linguaggio (TAL), è un campo di ricerca interdisciplinare il cui obiettivo è creare macchine che comprendano (ma anche riproducano) le lingue naturali. L’NLP applicato alle discipline umanistiche può essere usato per l’analisi avanzata dei dati linguistici in formato digitale studiando, ad esempio, le costruzioni sintattiche di un romanzo, i cambiamenti semantici delle parole nel tempo, le differenze stilistiche tra autori diversi. L’NLP, infatti, si occupa dell’elaborazione di ogni livello di analisi linguistica, dalla morfologia alla sintassi, dalla semantica alla pragmatica.Il workshop includerà un’introduzione teorica ai concetti principali dell’NLP (che cosa è, perché è una sfida interessante, cosa è una pipeline, quali sono le fasi principali nello sviluppo di un sistema di NLP) e una parte pratica in cui verranno mostrate le funzionalità di due strumenti liberamente disponibili online: UDPipe (https://ufal.mff.cuni.cz/udpipe) e Tint (https://dh.fbk.eu/research/tint/). Per seguire il workshop non sono richieste competenze pregresse né l’installazione di software: infatti, per facilitare la partecipazione di un pubblico ampio e vario, verranno usate le demo online dei suddetti strumenti.

I materiali del workshop sono disponibili a questo indirizzo.

Rachele Sprugnoli è ricercatrice a tempo determinato (RTDA) nel dipartimento di Discipline Umanistiche, Sociali e delle Imprese Culturali (DUSIC) dell’Università di Parma, fa parte del direttivo dell’Associazione Italiana per l’Informatica Umanistica e la Cultura Digitale (AIUCD) e del gruppo di lavoro su comunicazione e divulgazione dell’Associazione Italiana di Linguistica Computazionale (AILC). Nel corso degli anni la sua ricerca si è concentrata sulla creazione e annotazione di corpora, sulla valutazione degli strumenti di Trattamento Automatico del Linguaggio, sull’elaborazione dell’informazione temporale e sulla sentiment analysis. Ha al suo attivo numerose pubblicazioni nel campo della linguistica computazionale e delle digital humanities ed è co-autrice, insieme alla Prof.ssa Jezek, del recente libro Linguistica computazionale. Introduzione all’analisi automatica dei testi (Mulino, 2023).

Quando: 1 giugno 2023, ore 17.00

Dove: via Webex per gli iscritti ai seminari, diretta streaming via YouTube all’indirizzo https://youtube.com/live/NlnpoyQnr6Y

Gli altri incontri:

Workshop – Angelo Mario Del Grosso

Angelo Mario Del Grosso (ILC-CNR)

Selezione, elaborazione e presentazione di documenti XML-TEI mediante i linguaggi XPath e XSL

Extensible Markup Languages, Digital Scholarly Editions, Digital/Computational Philology, XPath, Extensible Stylesheet Language

La rappresentazione digitale di una risorsa testuale è ad oggi realizzata mediante l’adozione di specifici modelli formali implementati per mezzo di vocabolari XML che ne caratterizzano la struttura e la semantica. Tra questi, lo standard de-facto per l’editing scientifico dei testi – soprattutto di testi d’interesse umanistico – è lo schema di codifica manutenuto dal consorzio TEI (Text Encoding Initiative), il quale definisce anche le “best practices” per il corretto utilizzo del vocabolario (id est, le TEI guidelines). Una volta realizzata la codifica della risorsa, spesso però, non si è in grado di sfruttarne il potenziale computazionale poiché manca una sufficiente familiarità con le tecnologie volte all’elaborazione dei dati codificati. L’ecosistema tecnologico che ruota attorno allo standard W3C/XML include, tra gli altri, due ulteriori linguaggi finalizzati specificatamente alla selezione e all’elaborazione di documenti XML-besed. Essi sono il linguaggio “XML Path” (XPath) e il linguaggio “eXtensible Stylesheet Language Transformation” (XSL-T). Scopo del seminario è di illustrare le potenzialità dei due linguaggi menzionati, descrivendo il modello dati e il modello di processing su cui si basano nonché mostrandone la sintassi e i costrutti più frequenti. Il fine è quello di estrarre automaticamente informazioni, produrre dati aggregati, statistiche interessanti, visualizzazioni Web così come trasformazioni di struttura e di formato. Durante il seminario si lavorerà con esempi di fogli di stile realizzati in seno ad autorevoli progetti di ricerca dedicati alla pubblicazione e all’elaborazione di documenti XML/TEI, quali ad esempio il progetto EpiDoc, il progetto papyri.info oppure il progetto Kiln, oppure lo stesso progetto TEI. Si mostrerà come personalizzare i fogli di stile analizzati al fine di accogliere nuovi requisiti ed adattare risorse già esistenti a differenti esigenze di elaborazione. Infine, si farà uso del processore XSLT Saxon e dell’ambiente eXist-db per eseguire le istruzioni definite nei fogli di stile selezionati.

Consigli per preparare l’ambiente per coloro che volessero provare le tecnologie usate durante il seminario:

– Editor: visual studio code con estensioni XML installate- URL per download: https://code.visualstudio.com/download
– Processore XSLT da terminale: SaxonJ (versione 11.5)- URL github per il dowload: https://github.com/Saxonica/Saxon-HE/blob/main/11/Java/SaxonHE11-5J.zip– URL documentazione: https://www.saxonica.com/documentation11/index.html#!using-xsl/commandline
– Ambiente JAVA installato: https://www.java.com/it/download/
– eXist-db: http://exist-db.org/exist/apps/homepage/index.html

I materiali del workshop saranno disponibili su Github: https://github.com/angelodel80/aspettandoAIUCD2023

Angelo Mario Del Grosso è ingegnere informatico; ha conseguito il dottorato di ricerca in Ingegneria dell’Informazione con una tesi sulla progettazione di componenti software per lo studio di testi d’interesse storico-letterario. Dal 2019 è ricercatore confermato presso il CNR-ILC di Pisa. Le sue principali attività di ricerca riguardano la rappresentazione, l’elaborazione e la fruizione di risorse filologiche. I suoi interessi sono tanto volti alla modellazione formale del testo quanto all’analisi computazionale di documenti testuali, combinando in un unico modello approcci apparentemente divergenti: quello scientifico e quello storico. Partecipa a vari progetti di ricerca sia nazionali che internazionali e insegna codifica di testi presso l’Università di Pisa.

Quando: 18 maggio 2023, ore 17.00

Dove: via Webex per gli iscritti ai seminari, diretta streaming via YouTube all’indirizzo https://youtube.com/live/2QZa0BJ5bYk

Workshop – Francesco Mambrini

Francesco Mambrini (Università Cattolica del Sacro Cuore)

Introduzione a Python per l’analisi dei dati testuali

programmazione; Python; analisi testuale; natural language processing; tutorial

In questo seminario introdurremo i concetti di base della programmazione in Python. Il corso è principalmente dedicato a chi, provenendo da una formazione umanistica, sia interessato ad apprendere i fondamenti della sintassi di Python per eseguire semplici operazioni di analisi testuale e linguistica e a muovere i primi passi nel mondo della programmazione. Nessuna conoscenza preliminare verrà richiesta o presupposta. Inizieremo introducendo alcuni concetti fondamentali della sintassi dei linguaggi di programmazione, come variabili, tipi di dati, cicli e funzioni, illustrando il loro utilizzo nella scrittura di semplici istruzioni in Python. Il cuore del seminario sarà dedicato al lavoro sui testi: vedremo come aprire file di testo e come manipolare il loro contenuto per trovare o sostituire stringhe, nonché come ottenere semplici informazioni statistiche come liste di frequenze. Infine, accenneremo all’uso di due librerie molto importanti per la ricerca linguistica e testuale, come NLTK e Spacy.

Per lo svolgimento della lezione, utilizzeremo un Jupyter Notebook, cui gli studenti iscritti potranno accedere tramite la piattaforma Binder

Aggiornamento al 5 maggio: durante il seminario, per un problema tecnico con Binder (qui il notebook predisposto), abbiamo usato Colab:

  1. Aprire COLAB e accedere con un account Google
  2. Nella finestra di apertura selezionare la scheda “GitHub” e inserire nel modulo di ricerca il seguente link
    https://github.com/francescomambrini/aspettandoAIUCD/blob/master/introduzione_python.ipynb
  3. Appare il nome del notebook “introduzione_python.ipynb”, cliccando si può accedere al materiale in modalità interattiva.

Francesco Mambrini è attualmente ricercatore presso la facoltà di Scienze Linguistiche e Letterature Straniere, Università Cattolica del Sacro Cuore. Dopo aver conseguito un Dottorato in Filologia Classica (co-tutela Università di Trento e EHESS, Parigi), ha iniziato ad interessarsi di Linguistica Computazionale, in particolare nelle sue applicazioni alle lingue antiche. Ha lavorato per alcuni dei più importanti progetti nella storia delle Digital Humanities, quali il Perseus Project (Tufts University), l’Index Thomisticus Treebank (Università Cattolica del Sacro Cuore), il database archeologico Arachne (Università di Colonia), e Open Greek and Latin (Humboldt Chair of DH, Università di Lipsia), nonché per alcuni importanti progetti europei come il network di epigrafia digitale EAGLE o il progetto ERC “LiLa – Linking Latin”. Dal 2013 al 2018 è stato assistente di ricerca presso il Deutsches Archaölogisches Institut (DAI), Berlino. Nel 2012-13 è stato titolare della prima Fellowship congiunta fra il DAI (Berlino) e il Center for Hellenic Studies (Harvard University, Washington, DC).

Quando: 4 maggio 2023, ore 17.00

Dove: via Webex per gli iscritti ai seminari, diretta streaming via YouTube all’indirizzo https://youtube.com/live/2QZa0BJ5bYk

Gli altri incontri