Curriculum Vitae et Studiorum

Transcript

Curriculum Vitae et Studiorum
Curriculum Vitae et Studiorum
Malvina Nissim
1 ottobre 2007
Generalità
Nome
Malvina Nissim
Data e luogo di nascita
1◦ Marzo 1975
Cascina (PI), Italia
Nazionalità
Italiana
Domicilio
via Nosadella, 34
40123 Bologna
Telefono
+39 0512098469
E-mail
[email protected]
Titoli e Formazione
01/2002
Dottorato in Linguistica. Tesi: Bridging Definites and Possessives: Distribution of Determiners
in Anaphoric Noun Phrases. Relatori: Prof. Michele Prandi, Prof. Giacomo Ferrari e Prof. Anna
Giacalone Ramat. Commissione: Prof. Marcella Bertuccelli Papi, Prof. Michela Cennamo e Prof.
Paolo Di Giovine.
1998—2001
Corso di Dottorato in Linguistica, XIV ciclo, Dipartimento di Linguistica, Università di Pavia.
Borsa ministeriale.
1993—1998
Laurea in Lettere Classiche, indirizzo linguistico, Dipartimento di Linguistica, Università di Pisa.
Tesi: Spazi Mentali, Meronimia e Definitezza: Semantica delle Costruzioni Possessive. Relatori:
Prof. Romano Lazzeroni e Prof. Giacomo Ferrari. Voto: 110/110 e lode.
1988—1993
Liceo Ginnasio “G. Galilei”, Pisa. Maturità classica: 60/60
1
Esperienze Lavorative
11/2006-oggi
Ricercatore universitario (L-LIN/01), Dipartimento di Studi Linguistici e Orientali,
Università di Bologna.
03/2006-10/2006
“Collaboratore a progetto, Laboratory for Applied Ontology,
Istituto di Scienze e Tecnologie della Cognizione, CNR, Roma. Progetto:
• NeOn – Lifecycle Support for Networked Ontologies
(Comunità Europea, Framework VI)
01/2002–01/2006
“Research fellow” (RA1A), Institute for Communicating and Collaborative Systems,
School of Informatics, Università di Edimburgo. Progetti:
• TXM (Text Mining for Biomedicine)
Finanziato da ITI Lifesciences, Scozia. Collaborazione Università di Edimburgo e COGNIA EU.
Propositori, assegnatari e responsabili: Dr. C. Grover, Prof. E. Klein, Dr. R. Tobin.
• Machine Learning of Entity Recognizers for Modular Retargetable NLP .
Finanziato dalla Scottish Enterprise all’interno del programma di collaborazione
“Edinburgh-Stanford Link”. Propositori, assegnatari e responsabili:
Dr. C. Grover (Edimburgo), Prof. E. Klein (Edimburgo), Prof. C. Manning (Stanford),
Dr. K. Markert (Edimburgo/Leeds), Dr. M. Nissim (Edimburgo)
• Paraphrase Analysis for Improved Generation.
Finanziato dalla Scottish Enterprise all’interno del programma di collaborazione
“Edinburgh-Stanford Link”. Propositori, assegnatari e responsabili:
Prof. J. Bresnan (Stanford), Dr. J. Carletta (Edimburgo), Dr. D. Crouch (Stanford),
Dr. M. Nissim (Edimburgo), Prof. M. Steedman (Edimburgo), Prof. T. Wasow (Stanford),
Dr. A. Zaenen (Stanford)
2001–2002
“Research associate” (RA1B), Institute for Communicating and Collaborative Systems,
School of Informatics, Università di Edimburgo.
Progetto: Metonymy Annotation Schemes and Robust Analysis.
Finanziato dallo Economic and Social Research Council (ESRC), Regno Unito.
Propositore, Assegnatario e Responsabile: Dr. Katja Markert.
2000
Traduttore a contratto Inglese→Italiano per la casa editrice Bruno Mondadori.
Insegnamento
2007
2002
Linguistica dei Corpora II (AA 2006/07), Corso di Laurea Specialistica in Linguistica, Università di
Bologna.
Techniques in Natural Language Processing 2. Insegnante, Tutor, e responsabile esercitazioni. MSc in
Informatics (Natural Language and Language Engineering), Università di Edimburgo. Titolare del corso:
Prof Bonnie Webber.
2001
Tecniche per la Costruzione e l’Analisi di Corpora, Corso intensivo (16 ore) per dottorandi tenuto
all’Università di Pavia, all’interno del Programma di Dottorato in Linguistica. Titolare, insegnante,
esercitatrice.
1998
Corsi di Italiano per Stranieri. Insegnante di Italiano e responsabile del Laboratorio Linguistico presso
i Corsi di Italiano per Stranieri, Dipartimento di Linguistica, Università di Pisa.
2
Soggiorni di Formazione all’Estero
09/2000—03/2001
Institute for Communicating and Collaborative Systems,
School of Informatics, Università di Edimburgo. Contatto: Prof. Bonnie Webber
10/1999—03/2000
Fachbereich Sprachwissenschaft (Dipartimento di Linguistica),
Università di Costanza. Contatto: Prof. Klaus von Heusinger
Interessi di Ricerca
Durante gli anni di dottorato e post-dottorato, ho sviluppato abilità e interessi di ricerca in vari ambiti dell’elaborazione
del linguaggio naturale (Natural Language Processing), combinando una solida preparazione linguistica con acquisite
tecniche computazionali, e cosı̀ creando un ponte di ricerca tra la linguistica e l’informatica. Usando approcci sia
statistici che simbolici, ho lavorato in particolare nei seguenti campi:
• Risoluzione dell’Anafora: lavori teorici e corpus-based su fenomeni di bridging (anafore indirette), otheranafora, e coreferenza. Confronto teorico e corpus-based di sintagmi nominali definiti a testa piena e costruzioni genitivali. Sviluppo di metodi simbolici e statistici per la risoluzione di anafore lessicali a testa piena.
Uso innovativo del Web in sostituzione di basi di conoscenza organizzate per la risoluzione di anafore a testa
piena. Annotazione di coreferenza pronominale e pronomi relativi in dialoghi spontanei (inclusi linee guida per
l’annotazione e coordinamento del progetto di annotazione).
• Struttura del Discorso: sviluppo del primo schema di annotazione dettagliato per l’annotazione della struttura dell’informazione in Inglese. Coordinamento del progetto di annotazione. Analisi di costruzioni sintattiche alternative (attivo/passivo, genitivo prenominale/genitivo postnominale, alternanza dativa, ...) sfruttando
tale annotazione. In corso: (i) apprendimento automatico della struttura dell’informazione; (ii) generazione
automatica della corretta forma genitiva nel contesto.
• Risoluzione di Ambiguità Semantiche: primo modello statistico per la risoluzione automatica di metonimie.
Particolare attenzione a nomi di luoghi e aziende. Integrazione di un thesaurus per risolvere problemi di scarsezza di dati e per class-based smoothing. Analisi approfondita di fenomeni di metonimia nel discorso e interazione
con metafore.
• Estrazione dell’Informazione: metodi statistici per il riconoscimento e la risoluzione di “named entities” in diversi domini (news, biomedicina, astronomia, arte, geografia). Miglior sistema in assoluto per il riconoscimento
di “named entities” in campo biomedico (2004). Annotazione di corpora; responsabile principale e coordinatrice dell’annotazione di testi biomedici per il progetto “TXM” (“named entities”, disambiguazione, e relazioni
tra named entities). Metodi statistici per l’estrazione di relazioni tra elementi del discorso.
Fondi di Ricerca e Borse di Studio
• Fondi di Ricerca
2002
Progetto biennale finanziato dalla Scottish Enterprise all’interno del programma “EdinburghStanford Link (co-Proponente/Assegnatario/Responsabile): Machine Learning of Entity Recognizers for Modular Retargetable NLP (169,448 GBP)
2002
Progetto biennale finanziato dalla Scottish Enterprise all’interno del programma “EdinburghStanford Link (co-Proponente/Assegnatario/Responsabile): Paraphrase Analysis for Improved
Generation (73,626 GBP)
3
• Borse di Studio
2004
Borsa per giovani ricercatori erogata dalla European Science Foundation per partecipare alla
conferenza “Mind, Metaphor and Language Conference, Granada, Spagna.
2002
Borsa per giovani ricercatori erogata dalla European Science Foundation per partecipare alla
conferenza “Mind, Metaphor and Language, Kerkrade, Olanda.
2000
Borsa “Giovani Ricercatori, Università di Pavia (ca. 8,500 Euro, in collaborazione con A. Sansò).
Progetto: Semantica Lessicale e Semantica del Discorso: Verso un Modello Computazionale.
1999
Borsa dell’Università di Costanza, Germania, per un soggiorno di tre mesi presso il Dipartimento di
Linguistica (vincitrice di una delle tre borse disponibili per dottorandi presso l’Università di Pavia)
1996
Borsa dell’Università di Heidelberg, Germania per un corso mensile di Lingua Tedesca (vincitrice
di una delle tre borse disponibili per laureandi presso l’Università di Pisa)
1995
Borsa dell’Università di Salamanca per un corso mensile di Lingua Spagnola (unica vincitrice della
borsa disponibile per laureandi presso l’Università di Pisa)
Seminari Invitati
• Scuola Normale Superiore, Classe di Lettere, Pisa. Data and Models for Automatic Metonymy Resolution and
Understanding, Ottobre 2006.
• Scuola Superiore di Lingue Moderne per Interpreti e Traduttori, Università di Bologna. Risolvere sul Web
Sintagmi Nominali Anaforici, Aprile 2006.
• Università di Roma “Tor Vergata, Ingegneria Informatica, Artificial Intelligence Research Group. Sorgenti di
Informazione Lessicale per la Risoluzione di Sintagmi Nominali Anaforici, Maggio 2005.
• Università di Edimburgo, ICCS, BioNLP group. “Mining External Resources for BioMedical IE, Marzo 2005.
• Istituto di Linguistica Computazionale (ILC-CNR), Pisa. “Syntactic Features and Word Similarity for Supervised Metonymy Resolution, Settembre 2003.
Organizzazione di Eventi
• “Metonymy Resolution at SemEval-2007 (Shared Task). Challenge sulla risoluzione automatica della metonimia organizzata all’interno di SemEval 2007 (http://nlp.cs.swarthmore.edu/semeval/).
• 7th ESSLLI Student Session, Organizzatrice e Chair. Tenuta all’interno della 14esima European Summer
School in Logic Language and Computation (ESSLLI 2002), Agosto 2002, Trento, Italia.
• 6th ESSLLI Student Session, Co-chair per l’area “Language. Tenuta all’interno della 13esima European
Summer School in Logic Language and Computation (ESSLLI 2001), Agosto 2001, Helsinki, Finlandia.
• First Pavia Postgraduate Conference in Linguistics (Papocol 2000). Ideatrice e membro del comitato organizzativo e scientifico, Pavia, 24-25 Novembre 2000.
• Workshop on Procedures in Discourse Interpretation. Ideatrice e membro del comitato organizzativo e scientifico. Tenuto all’interno della 4a EUROLAN Summer School on Human Language Technology (EUROLAN’99),
Luglio 1999, Iasi, Romania.
4
Partecipazione a Conferenze, Workshops e Scuole
2006
2006
2006
2006
2006
2005
2005
2005
2004
2004
2003
2003
2003
2002
2002
2002
2002
2001
2000
2000
2000
2000
2000
2000
1999
1999
1999
1998
1998
1997
1997
1996
1995
DuePuntoZero, Convegno sul Web Semantico, Torino, Italia.
Società di Linguistica Italiana (SLI 2006), Università del Piemonte Orientale, Vercelli, Italia.
Wikimania, Panel on “NLP and Wikipedia, Harvard Law School, Cambridge, MA, Stati Uniti.
Conference on Empirical Methods in Natural Language Processing (EMNLP 2006), Sydney, Australia.
44th Meeting of the Association for Computational Linguistics (ACL 2006), Sydney, Australia.
43rd Meeting of the Association for Computational Linguistics (ACL 2005), Ann Arbor, MI, Stati Uniti.
Semantic Mining for BioMedicine (SMBM), Cambridge, Regno Unito.
6th International Workshop on Computational Semantics (IWCS-6), Tilburg, Olanda.
Language Resources and Evaluation Conference (LREC2004), Lisbona, Portogallo.
Mind, Language, and Metaphor, EuroConference on the Processing of Metaphor and Metonymy (European
Science Foundation), Granada, Spagna.
Conference on Empirical Methods in Natural Language Processing (EMNLP 2003), Sapporo, Giappone.
41st Meeting of the Association for Computational Linguistics (ACL 2003), Sapporo, Giappone.
European Chapter of the Association for Computational Linguistics (EACL 2003), Budapest, Ungheria.
14th European Summer School in Logic, Language, and Information (ESSLLI02), Trento, Italia.
Language Resources and Evaluation Conference (LREC2002), Las Palmas, Spagna.
Workshop on the Syntax and Semantics of Possessives, UMass, Amherst, MA, Stati Uniti.
Mind, Language, and Metaphor, Euroconference on Consciousness and the Imagination (European Science
Foundation), Kerkrade, Olanda
13th European Summer School in Logic, Language, and Information (ESSLLI01), Helsinki, Finlandia.
First Pavia Postgraduate Conference in Linguistics (Papocol2000), Pavia, Italia.
Second International Conference on Contrastive Semantics and Pragmatics (SIC–CSP), Cambridge, Regno
Unito.
12th European Summer School in Logic, Language, and Information (ESSLLI00), Birmingham, Regno
Unito.
7th International Pragmatics Conference, Budapest, Ungheria.
MEDTYP Workshop (Università di Pisa), Tirrenia, Pisa.
Vilem Mathesius Lectures Series 15, Praga, Repubblica Ceca.
Workshop on Procedures in Discourse Interpretation, EUROLAN99, Iaşi, Romania.
The 4th EUROLAN Summer School on Human Language Technology (EUROLAN99), Iaşi, Romania.
6th International Cognitive Linguistics Conference (ICLC99), Stoccolma, Svezia.
10th European Summer School in Logic, Language, and Information (ESSLLI98), Saarbrücken, Germania.
2nd Workshop on Lexical Semantics Systems (WLSS98), Scuola Normale Superiore, Pisa, Italia.
Workshop on Dynamic Perspectives in Logic and Linguistics: Proof-theoretical Dimensions of
Communicative Processes, Università di Roma 3, Roma, Italia.
9th European Summer School in Logic, Language, and Information (ESSLLI97), Aix-en-Provence, Francia.
Corso estivo di lingua tedesca (Internationaler Ferienkurs), “Universität Heidelberg”, Germania. Diploma
finale.
Corso estivo di lingua spagnola (Cursos Internacionales) “Universidad de Salamanca”, Salamanca, Spagna.
Diploma finale.
Durante gli anni del mio post-doc in Scozia ho inoltre preso parte a vari di corsi formazione (di uno o due giorni)
offerti dal centro per le Risorse Umane dell’Università di Edimburgo. Tra questi: Time management, Managing your
future, e How to write successful grant applications. Ho inoltre partecipato a due workshops sulla condizione delle
ricercatrici donne in Informatica: Scottish Hoppers: Women in Computer Science, Glasgow, 2005, e IJCAI Workshop
on Women in Computer Science, Edimburgo, 2005.
5
Responsabilità Accademiche
• ’Referaggio’ per riviste internazionali:
– Discourse Processes
– International Journal of Geographical Information Systems
– International Journal of Human-Computer Studies
– Journal of Language Resources and Evaluation
– Journal of Computer Speech and Language
• ’Referaggio’ per conferenze/workshops internazionali:
– ESSLLI 2001 student session (comitato scientifico)
– ESSLLI 2003 student session
– Eurolan 2003 Workshop on Information Extraction and Ontologies 2003 (comitato scientifico)
– ACL 2004 Workshop on Semantic Annotation (comitato scientifico)
– ESSLLI 2005 student session
– KI 2005 (28th German Conference on Artificial Intelligence)
– ACL 2006
– EMNLP 2006
– ESWC 2007
– ACL 2007
– ACL Student Workshop 2007
– ESSLLI 2007 Student Session
– EMNLP 2007
• Commissione per la selezione del personale per le seguenti posizioni (ICCS, School of Informatics, Università
di Edimburgo):
– Ricercatore a tempo determinato con specialità in apprendimento automatico (Progetto Machine Learning
of Entity Recognizers for Modular Retargetable NLP )
– Ricercatore a tempo determinato con specialità in “document retrieval” (Progetto TXM)
– Ricercatore a tempo determinato con specialità in metodi statistici per estrazione dell’informazione (Progetto TXM);
– Ricercatore a tempo determinato con specialità in metodi ibridi in semantica computazionale (Progetto
TXM);
• Commissione per la valutazione di tesi di dottorato per ammissione alla consegna (ICCS, School of Informatics,
Università di Edimburgo):
– Colin Bannard, Modelling the Multiword Lexicon with Corpora, 2005.
– Natalia N. Modjeska Resolving Other-Anaphora, 2002.
• Incarichi:
6
– Responsabile gruppo di lavoro “Information Extraction (organizzazione seminari, mantenimento webpage, liste bibliografiche), ICCS, School of Informatics, Università di Edimburgo, 2002-2003
– Responsabile pubbliche relazioni per la European Association for Logic, Language, and Information
(FoLLI).
Lingue Moderne
Italiano
Inglese
Spagnolo
Tedesco
Olandese
Ebraico Moderno (parlato)
Madrelingua
‘Near-native’
Buona conoscenza
Buona conoscenza
Moderata conoscenza
Moderata conoscenza
Abilità Informatiche
• Piattaforme: Unix, Linux, MacOS (classic e X), Windows
• Processori di Testo: LaTeX, HTML, XML, XSLT, Microsoft Word
• Linguaggi: Shell scripting, Perl, Prolog
Bologna, 1 ottobre 2007
7