Programma d’esame

Modulo A o unico: Linguistica computazionale

Argomento:   

Il corso ha lo scopo di presentare i temi principali della linguistica computazionale e del “Natural Language Processing” (NLP) e di familiarizzare lo studente con gli strumenti di base per l’analisi quantitativa e computazionale del testo.

Lezioni teoriche

1. Analisi computazionale dei dati linguistici

  • corpora: tipologia e uso
  • codifica e rappresentazione dei dati linguistici
  • corpora annotati
  • analisi statistica dei dati linguistici
  • linguaggio e probabilità: modelli di markov, entropia, legge di bayes
  • metodi computazionali per l'esplorazione dei dati linguistici: concordanze, collocazioni e misure di associazione
2. Natural Language Processing (NLP)
  • metodi a regole e di machine learning
  • corpora annotati per lo sviluppo di strumenti di NLP
  • analisi morfologica: Automi e Trasduttori a Stati Finiti
  • Part of Speech Tagging
  • analisi sintattica: chunking e shallow parsing, grammatiche context-free, cenni di parsing a costituenti e a dipendenze
  • metodi di valutazione
  • lessici semantici computazionali: Wordnet e FrameNet

Esercitazioni

  • espressioni regolari
  • introduzione a NLTK
  • analisi computazionali del testo con NLTK
  • annotazioni semantiche del testo


Modalità d’esame/Prerequisiti:

Esame scritto + progetto

L'esame scritto, diviso in due prove, può essere sostenuto o come compiti in itinere durante il corso oppure in occasione degli appelli scritti (le  due prove scritte possono essere sostenute anche in appelli differenti). Le prove in itinere possono essere effettuate SOLO dagli studenti frequentanti.

Il progetto viene presentato e discusso in occasione degli appelli orali. Il superamento dell'esame scritto (18/30 in ciascuna prova scritta) è condizione strettamente necessaria per presentarsi all'orale e discutere il progetto.

Note: E' necessario iscriversi al corso su MOODLE


Bibliografia

Testi modulo A o unico:   


Informazioni amministrative

Docente: Alessandro Lenci

Codocente: Felice Dell'Orletta

Codici/Crediti:  305LL (12 CFU)
Settore scientifico-disciplinare:    L-LIN/01
Periodo lezioni/semestre: primo