Video: Lesson 1: Deep Learning 2019 - Image classification 2024
La classificazione delle immagini richiede una quantità significativa di risorse per l'elaborazione dei dati, tuttavia, che ha limitato la portata delle distribuzioni. La classificazione delle immagini è un tema caldo nel mondo Hadoop perché nessuna tecnologia mainstream è stata capace - fino a quando Hadoop è arrivata - di aprire le porte a questo tipo di elaborazione costosa su una scala così massiccia ed efficiente.
La classificazione delle immagini inizia con l'idea che si costruisce un set di addestramento e che i computer imparano a identificare e classificare ciò che stanno guardando. Allo stesso modo che avere più dati aiuta a costruire modelli migliori di individuazione e rischio di frodi, aiuta anche i sistemi a classificare meglio le immagini.
In questo caso d'uso, i dati vengono definiti set di allenamento e i modelli sono classificatori. I classificatori riconoscono caratteristiche o motivi all'interno di suoni, immagini o video e li classificano in modo appropriato. I classificatori sono costruiti e iterativamente raffinati dai set di allenamento in modo che i loro punteggi di precisione (una misura di esattezza) e i punteggi di richiamo (una misura di copertura) siano alti.
Hadoop è adatto per la classificazione di immagini poiché fornisce un ambiente di elaborazione in parallelo non solo per creare modelli di classificatore (iterando su insiemi di training) ma fornisce anche una scalabilità quasi illimitata per elaborare ed eseguire tali classificatori su enormi serie di volumi di dati non strutturati.
Considerate fonti multimediali come YouTube, Facebook, Instagram e Flickr - tutte sono fonti di dati binari non strutturati. La figura mostra un modo in cui è possibile utilizzare Hadoop per ridimensionare l'elaborazione di grandi volumi di immagini e video memorizzati per la classificazione semantica multimediale.
Potete vedere come tutti i concetti relativi al framework di elaborazione Hadoop sono applicati a questi dati. Si noti come le immagini vengono caricate in HDFS. I modelli di classificatore, costruiti nel tempo, vengono ora applicati ai componenti di feature immagine extra nella fase Map di questa soluzione. Come puoi vedere nell'angolo in basso a destra, l'output di questa elaborazione consiste in classificazioni di immagini che spaziano dai cartoni animati agli sport e ai luoghi, tra gli altri.
Hadoop può essere utilizzato anche per l'analisi audio o vocale. Un cliente del settore della sicurezza con cui lavoriamo crea un sistema di classificazione audio per classificare i suoni che vengono ascoltati tramite cavi a fibre ottiche arricchiti di acustica disposti lungo il perimetro dei reattori nucleari.
Ad esempio, questo sistema sa come classificare quasi istantaneamente il sussurro del vento rispetto al sussurro di una voce umana o per distinguere il suono dei passi umani che corrono nei parchi perimetrali da quello della fauna selvatica.
Questa descrizione potrebbe avere una sorta di Star Trek , ma ora puoi vedere esempi dal vivo. Infatti, IBM rende pubblico uno dei più grandi sistemi di classificazione delle immagini al mondo, tramite l'IBM Multimedia Analysis and Retrieval System (IMARS).
Ecco il risultato di una ricerca IMARS per il termine sci alpino. Nella parte superiore della figura, è possibile visualizzare i risultati dei classificatori associati al set di immagini elaborato da Hadoop, insieme a un tag cloud associato.
Si noti il classificatore principale più grossolanamente definito, in contrasto con il più granulare. In effetti, noti i vari livelli di classificazione: rotola in, che si trasforma in - tutto generato automaticamente dal modello di classificatore, costruito e valutato usando Hadoop.
Nessuna di queste immagini ha alcun metadato aggiunto. Nessuno ha aperto iPhoto e ha taggato un'immagine come sport invernale per farlo apparire in questa classificazione. È il classificatore di sport invernali che è stato costruito per riconoscere gli attributi dell'immagine e le caratteristiche degli sport che si svolgono in un ambiente invernale.
La classificazione delle immagini ha molte applicazioni e la possibilità di eseguire questa classificazione su larga scala utilizzando Hadoop offre maggiori possibilità di analisi, poiché altre applicazioni possono utilizzare le informazioni di classificazione generate per le immagini.
Guarda questo esempio del settore sanitario. Una grande agenzia sanitaria in Asia era focalizzata sulla fornitura di assistenza sanitaria tramite cliniche mobili a una popolazione rurale distribuita su una grande massa di terra. Un problema significativo affrontato dall'agenzia è stata la sfida logistica dell'analisi dei dati di imaging medicale generati nelle sue cliniche mobili.
Un radiologo è una risorsa scarsa in questa parte del mondo, quindi aveva senso trasmettere elettronicamente le immagini mediche a un punto centrale e far esaminare loro un esercito di medici. I dottori che stavano esaminando le immagini furono presto sovraccaricati, comunque.
L'agenzia sta ora lavorando su un sistema di classificazione per aiutare a identificare le possibili condizioni per fornire in modo efficace suggerimenti da verificare per i medici. I primi test hanno mostrato questa strategia per aiutare a ridurre il numero di diagnosi mancate o inaccurate, risparmiando tempo, denaro e, soprattutto, vite.