Francesco Mambrini (Università Cattolica del Sacro Cuore)

Introduzione a Python per l’analisi dei dati testuali

programmazione; Python; analisi testuale; natural language processing; tutorial

In questo seminario introdurremo i concetti di base della programmazione in Python. Il corso è principalmente dedicato a chi, provenendo da una formazione umanistica, sia interessato ad apprendere i fondamenti della sintassi di Python per eseguire semplici operazioni di analisi testuale e linguistica e a muovere i primi passi nel mondo della programmazione. Nessuna conoscenza preliminare verrà richiesta o presupposta. Inizieremo introducendo alcuni concetti fondamentali della sintassi dei linguaggi di programmazione, come variabili, tipi di dati, cicli e funzioni, illustrando il loro utilizzo nella scrittura di semplici istruzioni in Python. Il cuore del seminario sarà dedicato al lavoro sui testi: vedremo come aprire file di testo e come manipolare il loro contenuto per trovare o sostituire stringhe, nonché come ottenere semplici informazioni statistiche come liste di frequenze. Infine, accenneremo all’uso di due librerie molto importanti per la ricerca linguistica e testuale, come NLTK e Spacy.

Per lo svolgimento della lezione, utilizzeremo un Jupyter Notebook, cui gli studenti iscritti potranno accedere tramite la piattaforma Binder

Aggiornamento al 5 maggio: durante il seminario, per un problema tecnico con Binder (qui il notebook predisposto), abbiamo usato Colab:

  1. Aprire COLAB e accedere con un account Google
  2. Nella finestra di apertura selezionare la scheda “GitHub” e inserire nel modulo di ricerca il seguente link
    https://github.com/francescomambrini/aspettandoAIUCD/blob/master/introduzione_python.ipynb
  3. Appare il nome del notebook “introduzione_python.ipynb”, cliccando si può accedere al materiale in modalità interattiva.

Francesco Mambrini è attualmente ricercatore presso la facoltà di Scienze Linguistiche e Letterature Straniere, Università Cattolica del Sacro Cuore. Dopo aver conseguito un Dottorato in Filologia Classica (co-tutela Università di Trento e EHESS, Parigi), ha iniziato ad interessarsi di Linguistica Computazionale, in particolare nelle sue applicazioni alle lingue antiche. Ha lavorato per alcuni dei più importanti progetti nella storia delle Digital Humanities, quali il Perseus Project (Tufts University), l’Index Thomisticus Treebank (Università Cattolica del Sacro Cuore), il database archeologico Arachne (Università di Colonia), e Open Greek and Latin (Humboldt Chair of DH, Università di Lipsia), nonché per alcuni importanti progetti europei come il network di epigrafia digitale EAGLE o il progetto ERC “LiLa – Linking Latin”. Dal 2013 al 2018 è stato assistente di ricerca presso il Deutsches Archaölogisches Institut (DAI), Berlino. Nel 2012-13 è stato titolare della prima Fellowship congiunta fra il DAI (Berlino) e il Center for Hellenic Studies (Harvard University, Washington, DC).

Quando: 4 maggio 2023, ore 17.00

Dove: via Webex per gli iscritti ai seminari, diretta streaming via YouTube all’indirizzo https://youtube.com/live/2QZa0BJ5bYk

Gli altri incontri