Computational Linguistics and the COVID-19 Outbreak

This page is maintained by AILC (the Italian Association for Computational Linguistics). It groups some of the initiatives that the Computational Linguistics community is carrying out to contribute to the fight against COVID-19. Everyone is invited to collaborate by reporting new initiatives. Please do so through our contact form

Datasets


  • CORD-19 – The Allen Institute COVID-19 Open Research Dataset, a collection of Covid-19 scientific papers, weekly updated (March 2020)
  • Processed CORD-19 – The Allen Institute corpus processed with Sketch Engine (March 2020)
  • 40wita – A dataset of tweets in Italian collected daily by the University of Turin
  • Corona Corpus – A corpus of texts from online newspapers and magazines in 20 different English-speaking countries and part of the English-Corpora.org suite of corpora

Tools


Shared Tasks and Events


  • CLEF 2020: CheckThat! Lab Task 1 Tweet Check-Worthiness – The task asks to rank a stream of tweets on a number of topics, including COVID-19, according to their check-worthiness (March 2020)
  • Kaggle Tasks – Several tasks on COVID-19  (March 2020)
  • NLP COVID-19 Workshop an emergency workshop at ACL 2020 – Authors are invited to submit papers related to NLP applied to combat the COVID-19 pandemic (July 2020)
  • TREC-COVID program – Launched by NIST and OSTP, the challenge will follow the TREC assessment process to evaluate search systems, based on the CORD-19 documents

Publications


Di |2020-05-20T08:17:11+02:002 Apr, 2020|BLOG, HOME, RISORSE|

Lessici affettivi per l’italiano

Un lessico affettivo è un database di parole (o sensi, espressioni, o altri tipi di elementi lessicali), in cui ogni elemento è classificato in base al suo contenuto in termini di soggettività, polarità (positiva o negativa), capacità di provocare particolari emozioni, e così via. Questo tipo di risorse è usato per costruire sistemi in grado di analizzare il linguaggio naturale (per esempio, da siti Web o social media), e “leggere” il sentimento espresso nel testo. Questa attività è chiamata Analisi del Sentimento (anche Sentiment Analysis o Opinion Mining) e sta rapidamente raccogliendo attenzione crescente da parte delle comunità scientifiche e dell’industria, poiché è in grado di rispondere a domande quali “i clienti sono contenti del prodotto X?” oppure “che tipo di persone ha gradito l’iniziativa Y?”.

L’italiano è una lingua relativamente poco rappresentata nel panorama delle risorse linguistiche computazionali. Questo vale anche per i lessici affettivi, ma grazie ad una comunità vivace, lo scenario sta mutando rapidamente. Abbiamo condotto una piccola indagine tra i membri di AILC, chiedendo loro di indicarci lessici affettivi per l’italiano e risorse correlate. Le risposte sono sintetizzate nella lista seguente. Alcuni di questi sono propriamente lessici, altri sono risorse di vario tipo e metologie per l’italiano o comunque legate alla comunità italiana di NLP.

Questa lista è aprta a modifiche ed integrazioni. Chi sia a conoscenza di risorse rilevanti è invitato a contattare AILC, in modo da poterle includere.

 

Di |2017-10-04T16:42:23+02:0028 Set, 2017|BLOG, RISORSE|
Torna in cima