“La digitalizzazione indifferenziata delle nostre vite ha apportato un’esponenziale crescita di datificazione; siamo tutti, nessuno escluso, “produttori di dati e di relazioni” che entrano in modo sempre più diretto nei processi di accumulazione capitalistica.

Per avere un ordine di grandezza delle quantità e dell’accelerazione di cui parliamo, dove proprio la datificazione costituisce il cardine centrale, Martin Hilbert della Annenberg School for Communication and Journalism ha calcolato che, mentre nel 2000 le informazioni registrate nel mondo erano per il 25% supportate da formato digitale e per il 75% contenute su dispositivi analogici, nel 2013 le informazioni digitalizzate, sono stimate attorno i 1.200 exabyte e sono il 98% del totale, lasciando all’analogico solo il 2%.

Quindi se fino a qualche anno fa i dati potevano essere analizzati da un esperto o da un gruppo di ricerca, avvalendosi di macchine ed algoritmi classici per poterne estrarre le informazioni utili alla profilazione, oggi i big data rendono insoddisfacenti e obsoleti questi modelli, questo perché siamo oggi nella condizione, mai avuta prima, di possedere una quantità di dati maggiore di quella che i mezzi ci permettono di gestire. Viene da se la necessità di utilizzare meccanismi di Artificial Intelligence come il Machine Learning, perché mentre nell’algoritmica classica la macchina ha il compito di eseguire determinati calcoli in un ordine prefissato, nel Machine Learning l’algoritmo trova nei dati la linfa vitale, definendoli la materia prima; l’incredibile potenza è questo processo può essere applicato praticamente ad ogni contesto.
Per fare ciò abbiamo bisogno di un’unica cosa, di un dataset sufficiente grande, con informazioni contestualizzate ai nostri obbiettivi, che faccia il training ai nostri algoritmi.

PRAGMA ETIMOS, leader nella raffinazione dei dati (Data Economy), ha da diverso tempo nel proprio settore di Ricerca e Sviluppo integrato lo studio di processi di Sentiment Analysis, branca del Natural Language Processing, con il fine di determinare un livello di “positività” o “negatività” emotiva da un testo destrutturato. Per creare un tale algoritmo di machine learning è stato necessario recuperare una grossa mole di testi “etichettati”, che la rete ci mette a disposizione con le tante piattaforme social di tipo open, disponibili pubblicamente e costituiti da un testo annesso ad una valutazione, che già ne costituisce una catalogazione sentimentale, per effettuare un traning nel modo più accurato possibile. Successivamente si è resa necessaria una calibrazione dei processi di riconoscimento per mezzo di precise tokenizzazioni (separazione degli elementi) con una lemmatura (gestione delle forme flesse) e una ricerca dell’elemento naturalizzato nel DB dei lemmi catalogati in modo positivo e negativo, dove proprio l’algoritmo avrà il compito di calcolare la reale polarità confrontando i vari punteggi. “

Emologic – Dynamic Sentiment Polarity Gaetano