Video: L’analisi predittiva di Daniele Lavecchia 2024
Per il tuo progetto di analisi predittiva, dovrai identificare fonti di dati appropriate, raccogliere dati da tali fonti e metterle in un formato strutturato e ben organizzato. Queste attività possono essere molto impegnative e richiederanno probabilmente un coordinamento accurato tra diversi amministratori di dati all'interno della vostra organizzazione.
Devi anche selezionare le variabili che stai per analizzare. Questo processo deve tenere in considerazione i vincoli sui dati, i vincoli di progetto e gli obiettivi aziendali.
Le variabili selezionate devono avere un potere predittivo. Inoltre, è necessario considerare le variabili che sono sia preziose e fattibili per il progetto all'interno del budget e dei tempi. Ad esempio, se si analizzano le transazioni bancarie in un'indagine criminale, i record telefonici per tutte le parti coinvolte potrebbero essere pertinenti per l'analisi ma non accessibili agli analisti.
Aspettatevi di dedicare molto tempo a questa fase del progetto. La raccolta dei dati, l'analisi dei dati e il processo di risoluzione del contenuto, della qualità e della struttura dei dati possono sommarsi a una lunga lista di cose da fare.
Durante il processo di identificazione dei dati, aiuta a capire i tuoi dati e le loro proprietà; questa conoscenza ti aiuterà a scegliere quale algoritmo usare per costruire il tuo modello. Ad esempio, i dati delle serie temporali possono essere analizzati mediante algoritmi di regressione; gli algoritmi di classificazione possono essere utilizzati per analizzare i dati discreti.
La selezione delle variabili è influenzata dalla tua comprensione dei dati. Non sorprenderti se devi esaminare e valutare centinaia di variabili, almeno all'inizio. Fortunatamente, mentre lavori con queste variabili e inizi a ottenere informazioni chiave, inizi a ridurle a poche decine di volte. Inoltre, si aspetti che la selezione delle variabili cambi quando la comprensione dei dati cambia durante il progetto.
Potresti trovare utile creare un inventario di dati che puoi usare per tracciare ciò che sai, ciò che non sai e ciò che potrebbe mancare. L'inventario dei dati dovrebbe includere un elenco dei vari elementi di dati e tutti gli attributi che sono rilevanti nelle fasi successive del processo.
Ad esempio, potresti voler documentare se alcuni segmenti mancano di codici di avviamento postale o di record mancanti per uno specifico periodo di tempo.
I tuoi esperti in materia di conoscenza del business (conosciuti anche come esperti di conoscenza del dominio ) ti aiuteranno a selezionare le variabili chiave che possono influenzare positivamente i risultati del tuo progetto. Possono aiutarti a spiegarti l'importanza di queste variabili, oltre a dove e come ottenerle, oltre ad altri preziosi input.