L’innovazione e la ricerca nelle aziende italiane di linguistica computazionale
All’inizio degli anni ‘90, quando i giovani della mia generazione studiavano linguistica computazionale (o Natural Language Processing) all’Università, il Center for the Study of Language and Information della Stanford University era uno dei luoghi più ambiti e sognati. Molti di noi si erano innamorati della Head-Driven Phrase Structure Grammar (HPSG), inventata da Carl Pollard e Ivan A. Sag in California. Ci sembrava che HPSG potesse essere la parola definitiva sulle grammatiche formali delle lingue naturali, perché univa alcuni principi universali delle lingue (ispirati alla linguistica di Noam Chomsky) con un potentissimo framework computazionale. L’approccio presentava però due problemi: era difficile creare e gestire tutte quelle regole piuttosto complesse; il parsing non era veloce come avremmo voluto. Ci dedicavamo alla ricerca ma non riuscivamo a fare dei servizi commerciali efficaci basati su questo o altri framework linguistico-computazionali.
Da allora sono passati alcuni anni. Ad ottobre 2016 leggo un’intervista fatta ad Andrew Ng in occasione del rilascio da parte dell’azienda cinese Baidu di un chatbot per fare diagnosi mediche: “As Melody has more conversations, it will also learn and keep getting better. This is just the start of a much larger, AI-driven transformation of the healthcare industry.” Nel 1990 Andrew Ng aveva 14 anni. Dopo un paio di lauree e dottorati, nel 2002 iniziò a lavorare alla Stanford University. Nel 2011 fondò il Google Brain project. Sempre nel 2011 tenne un corso di Machine Learning online per la Stanford University, che fu seguito da circa 100.000 studenti in tutto il mondo. Nel 2012 fondò Coursera, piattaforma di MOOC che ha ormai quasi 2000 corsi e 24 milioni di iscritti. Dal 2014 Ng lavora a Baidu come Chief Scientist, e finora è rimasto a lavorare in quell’azienda. Quest’uomo eccezionale è un esempio brillante di come il mondo della ricerca, della formazione e della produzione aziendale si alimentino a vicenda con scambi continui.
Il mondo della Linguistica Computazionale e più in generale dell’Intelligenza Artificiale stanno vivendo un periodo di incredibile accelerazione
con passaggi velocissimi tra le attività di ricerca e l’applicazione dei risultati della ricerca in servizi concreti e viceversa, quando i problemi sollevati dai casi reali diventano materia di studio.
Questo scambio vivace avviene anche nelle aziende italiane che fanno linguistica computazionale. Così come i ricercatori di questo settore sono sempre stati all’avanguardia a livello globale, anche le aziende italiane che fanno linguistica computazionale si sono fatte valere a livello internazionale. Ad esempio Expert System, una SpA con sedi a Modena, Napoli, Rovereto, è sbarcata da alcuni anni negli Stati Uniti ed è cresciuta in Europa. Una PMI come CELI, con sedi a Torino e Milano, fornisce tecnologie e consulenze di Natural Language Processing ad aziende internazionali, dalla Corea alla California. Almawave, del gruppo Almaviva, da qualche anno integra tecnologie NLP. Euregio, con sede a Bolzano, utilizza l’NLP per fornire servizi di media intelligence. Interactive Media SpA è specializzata in soluzioni di speech. La startup pugliese QuestionCube è focalizzata sul question answering e usa il machine learning come strumento principale. Altre aziende più o meno grandi stanno integrando queste tecnologie per fornire i loro servizi, utilizzando tecnologie di machine learning combinate con tecnologie NLP standard.
Quali servizi offrono ai clienti? Il servizio principale è il “Natural Language Processing”, cioè l’analisi automatica e la comprensione dei testi scritti e del parlato.
La comprensione è ovviamente parziale rispetto alla comprensione umana ma è molto più veloce, e questo consente di svolgere delle attività che altrimenti non potrebbero essere realizzate, o di semplificare attività eccessivamente complesse.
Nei prossimi post di questo blog verranno descritti più in dettaglio i temi e i problemi della Linguistica Computazionale affrontati nelle università e nelle aziende.
Uno degli scopi dell’AILC è facilitare gli scambi tra università, centri di ricerca e aziende in questo settore. In questo blog perciò si potranno raccontare alcune delle scoperte, dei risultati ottenuti, dei progetti in corso, e dei problemi incontrati nei vari ambiti di questa disciplina.
CELI, Expert System, Euregio e QuestionCube sono già socie dell’Associazione Italiana di Linguistica Computazionale. Ci auguriamo che nei prossimi mesi altre aziende si uniscano, per contribuire alla creazione dell’ecosistema italiano della linguistica computazionale e dell’Intelligenza Artificiale.