Rachele Sprugnoli (Università di Parma)

Introduzione al Natural Language Processing

Natural Language Processing, Trattamento Automatico del Linguaggio, Linguistica Computazionale, annotazione linguistica, pipeline

Il Natural Language Processing (NLP), anche noto in Italia con l’espressione Trattamento Automatico del Linguaggio (TAL), è un campo di ricerca interdisciplinare il cui obiettivo è creare macchine che comprendano (ma anche riproducano) le lingue naturali. L’NLP applicato alle discipline umanistiche può essere usato per l’analisi avanzata dei dati linguistici in formato digitale studiando, ad esempio, le costruzioni sintattiche di un romanzo, i cambiamenti semantici delle parole nel tempo, le differenze stilistiche tra autori diversi. L’NLP, infatti, si occupa dell’elaborazione di ogni livello di analisi linguistica, dalla morfologia alla sintassi, dalla semantica alla pragmatica.Il workshop includerà un’introduzione teorica ai concetti principali dell’NLP (che cosa è, perché è una sfida interessante, cosa è una pipeline, quali sono le fasi principali nello sviluppo di un sistema di NLP) e una parte pratica in cui verranno mostrate le funzionalità di due strumenti liberamente disponibili online: UDPipe (https://ufal.mff.cuni.cz/udpipe) e Tint (https://dh.fbk.eu/research/tint/). Per seguire il workshop non sono richieste competenze pregresse né l’installazione di software: infatti, per facilitare la partecipazione di un pubblico ampio e vario, verranno usate le demo online dei suddetti strumenti.

I materiali del workshop sono disponibili a questo indirizzo.

Rachele Sprugnoli è ricercatrice a tempo determinato (RTDA) nel dipartimento di Discipline Umanistiche, Sociali e delle Imprese Culturali (DUSIC) dell’Università di Parma, fa parte del direttivo dell’Associazione Italiana per l’Informatica Umanistica e la Cultura Digitale (AIUCD) e del gruppo di lavoro su comunicazione e divulgazione dell’Associazione Italiana di Linguistica Computazionale (AILC). Nel corso degli anni la sua ricerca si è concentrata sulla creazione e annotazione di corpora, sulla valutazione degli strumenti di Trattamento Automatico del Linguaggio, sull’elaborazione dell’informazione temporale e sulla sentiment analysis. Ha al suo attivo numerose pubblicazioni nel campo della linguistica computazionale e delle digital humanities ed è co-autrice, insieme alla Prof.ssa Jezek, del recente libro Linguistica computazionale. Introduzione all’analisi automatica dei testi (Mulino, 2023).

Quando: 1 giugno 2023, ore 17.00

Dove: via Webex per gli iscritti ai seminari, diretta streaming via YouTube all’indirizzo https://youtube.com/live/NlnpoyQnr6Y

Gli altri incontri: