Video: Ben Wellington: How we found the worst place to park in New York City — using big data 2024
Se stai cercando dati che il governo federale potrebbe avere, ma non sei sicuro di quale agenzia sia coinvolta, inizia la ricerca sul portale dei dati federali. Lì troverai un catalogo di dati consultabile da tutte le agenzie federali. È possibile cercare set di dati per parole chiave e ottenere informazioni su ciò che è disponibile, la fonte per ogni set di dati, i formati disponibili e dove trovare i dati.
Il portale dei dati non è una fonte di dati, solo informazioni su quali dati sono disponibili e dove trovarli. E il portale non copre tutti i dati governativi disponibili. Quindi, se trovi qualcosa che ti è utile su Data. gov, follow up indagando sul sito web dell'agenzia che effettivamente fornisce tali dati per cercare ulteriori informazioni e dati.
Se hai bisogno di qualcosa che non riesci a trovare, contatta direttamente l'agenzia. Potresti essere in grado di parlare con qualcuno che può aiutarti a individuare ciò che ti serve, o almeno a scoprire perché i dati che desideri non sono disponibili.
Mentre nulla è nuovo sui dati pubblici, il portale facilita alcune nuove iniziative. Tutti i dati del governo federale di nuova generazione devono essere resi pubblicamente disponibili in formati aperti, leggibili dalla macchina, pur mantenendo la privacy e la sicurezza. Il concetto chiave qui è la leggibilità delle macchine, che fornisce dati in formati appropriati per l'utilizzo del computer, in particolare per lo sviluppo di applicazioni.
Le agenzie sono inoltre obbligate a
-
Creare un unico inventario di dati di agenzia: Devono documentare e tenere traccia delle risorse di dati mentre fanno attrezzature, mobili e altre risorse.
-
Pubblica un elenco di dati pubblici: L'annuncio deve essere pubblicato sulle pagine web dell'agenzia, compresi tutti i dati pubblici che sono pubblici o che potrebbero essere resi pubblici.
-
Sviluppare nuovi meccanismi di feedback pubblico: Devono fornire modi per il pubblico di fornire feedback relativi alle priorità di condivisione dei dati.
Il portale dei dati federali consente inoltre alle amministrazioni locali di aggiungere i propri set di dati al catalogo del portale. Questo non è obbligatorio e non molte città sono pronte a partecipare, ma potresti trovare alcuni dati locali nel catalogo e puoi aspettarti di vederne altri in futuro.
Sebbene questo portale possa portare a una vasta e diversificata gamma di dati, nessuno di questi è stato creato specificamente per l'utilizzo di data mining. Tutto è stato originariamente raccolto per uso governativo; la condivisione con il pubblico è secondaria.
I requisiti di privacy e sicurezza impediscono la pubblicazione di alcuni dati e alcuni dati possono essere condivisi solo in forma aggregata.(Ad esempio, il reddito di un individuo può essere privato, mentre il reddito medio di un gruppo di persone è pubblico.) Le iniziative di data aperta sono guidate dai programmatori, non dai data miner, quindi i dati potrebbero non essere organizzati o formattati come preferisci.
Il portale dei dati è un punto di partenza, non una destinazione finale, nella ricerca dei dati. Non tutti i set di dati del governo sono inclusi nel catalogo e alcuni potrebbero non essere contrassegnati con le parole chiave che hai scelto per la tua ricerca. Ma dati. gov può guidarti verso molti set di dati utili e fornire lead alle agenzie che potrebbero avere di più da offrire. Potresti anche scoprire alcune gemme inaspettate per migliorare il tuo lavoro di data mining.