Introduzione al data mining: cos’è

Al momento stai visualizzando Introduzione al data mining: cos’è

Data mining: definizione

Letteralmente “estrazione dei dati”, per data mining intendiamo l’individuazione di dati informativi di diversa natura.

Per attivare un processo di data mining è necessario possedere una banca dati, perché quest’attività le si incrocia.

Database e data mining

Attraverso la banca dati, estraiamo alcuni aspetti specifici, informazioni “criptiche” presenti senza un ordine preciso nel database .

Contenuti di diversa natura utili alla costruzione di fini diversi.

Un contenuto testuale, uno multimediale e così via, vanno a definire il percorso chiamato KDD  – Knowledge Discovery in Databases.

Data mining: come funziona la procedura

Il processo di estrazione dati si articola in più passaggi, anche ripetuti diverse volte, per affinare la procedura e verificare man mano i risultati raggiunti.

La procedura è l’insieme delle fasi operative del modello (ad esempio: la preparazione dei dati, la ricerca di pattern – modelli, il processo di scoperta, la valutazione e la successiva iterazione del modello).

Obiettivi

il processo di estrazione  ha come obiettivo quello di fare in modo che i pattern identificati spieghino nel migliore dei modi i dati che li hanno generati.

Si tratta in altre parole dell’applicazione di una o più tecniche che consentono l’esplorazione di grandi quantità di dati individuando i pattern più significativi.

Allo stesso modo, il Knowledge Discovery in Database è quel processo che usa i metodi (algoritmi) di data mining per estrarre e identificare conoscenza dai pattern, in accordo con le misure e le soglie usate sui fatti.

L’obiettivo è identificare i modelli di acquisto per attivare strategie mirate di marketing.

Interpretazione dei dati

Passaggio conclusivo e importante di tutto il processo esposto, è appunto, l’interpretazione dei risultati.

Valutare se l’obiettivo è raggiunto, e se la risposta è negativa si procede con la reiterazione (ed eventuale modifica) del passo precedente e talvolta anche di altri.

Come si può notare, le singole informazioni hanno correlazioni impreviste, rivelando così l’utilità del processo estrattivo  nell’identificare associazioni nascoste, utili per adottare strategie di marketing mirato.
Il sistema di Data Mining definisce dei parametri e assegna degli output a ogni elemento, cioè l’output empirico.

Dal confronto tra output empirico e teorico vi sono degli algoritmi che fanno in modo di ricalibrare i parametri del modello finché questo non generi i risultati attesi.

Per tutte le informazioni chiamaci al’800 92 60 80 

oppure compila il form qui:


    Se l'articolo ti è piaciuto condividilo sui tuoi social