Il progetto ha come obiettivo quello di identificare le opinioni degli utenti rispetto a un determinato argomento di interesse o brand partendo dall'estrazione di grandi moli di dati da Twitter e l'applicazione di tecniche di Natural Language Processing (NLP).
Il progetto sarà articolato come segue:
• Data Ingestion tramite Twitter API
(con eventuale integrazione di un processo di geocoding) sulla base di specifiche parole chiave
• Pulizia del dato e NLP Text preprocessing (i.e. tokenization, stemming, lemmatization)
• Sviluppo di un modello di sentiment analysis e visualizzazione dei risultati
Conoscenza delle librerie Python pandas, NumPy, SciKit-Learn, Keras
Conoscenza delle principali librerie Python per NLP (nltk, spaCy, TextBlob)
KPMG offre l'opportunità di uno stage curricolare con supporto per la compilazione della tesi di laurea.