Text-Mining per la ricerca sociale

Il mondo sta cambiando, anche la ricerca sociale economica e per il marketing deve trovare nuovi strumenti facendo leva sul digitale ed i social network

Il Text mining “un’analisi del testo “mediata” dal computer, ossia basata non sulla lettura del testo, bensì su un’analisi automatica, utile soprattutto quando i testi sono di ampia dimensione. In questi casi, infatti, ogni lettura diretta sarebbe limitata, lunga e difficoltosa, mentre un’analisi automatica è veloce e aperta a “infiniti” confronti, resi possibili dall’uso del computer.

L’analisi dei contenuti digitali è caratterizzata da una alta intensità di lavoro (si tratta di analizzare anche decine di migliaia di post mese) e per questa ragione occorre sviluppare tecniche che utilizzino algoritmi di text mining funzionali alla estrazione di senso e di sentiment, alla classificazione delle categorie, in grado di automatizzare le analisi con l’obiettivo appunto di ridurre il carico di lavoro per la redazione, sperimentando la possibilità di un rilascio real time delle analisi

L’analisi del posizionamento stampa: l’uso di tecniche di Text Mining

ANALISI DEL POSIZIONAMENTO STAMPA

Le fasi di attività prevedono:

a) un’analisi generale del vocabolario utilizzato, in termini di forme testuali (parole e locuzioni) più frequenti;

b) una evidenziazione dei lemmi più ricorrenti per categorie grammaticali;

c) mediante una riduzione al tema delle principali unità lessicali selezionate, l’individuazione del linguaggio peculiare, che ha permesso di quantificare le diverse percezioni del soggetto studiato. 

ANALISI SEMI AUTOMATICA DEI CONTENUTI

Attraverso l’utilizzo di opportuni algoritmi è possibile individuare topics, dimensioni semantiche attraverso cui leggere il corpus: la vicinanza tra parole sul piano fattoriale rinvia infatti a una loro combinazione o associazione nel testo, e l’esplorazione delle associazioni tra le parole contribuisce alla lettura/descrizione del corpus. 

TECNICHE DI TEXT MINING SU TESTI EDITORIALI O SU CONTENUTI DIGITALI ASSOCIATI A KEYWORD RILEVANTI

Il punto di partenza è l’analisi delle parole diverse che compongono il corpus, ordinate per valori decrescenti di frequenza (vocabolario). Tra le parole ad alta frequenza a parte le preposizioni e le particelle, spiccano le cosiddette “parole tema”, che proprio per via della loro elevata frequenza consentono di cogliere immediatamente gli argomenti principali del testo. 

Vuoi saperne di più?