Google Releases Open Image V5, Launches Open Image Challenge
Google has released its updated open-source image dataset Open Image V5 and announced the second Open Images Sfida per la Conferenza internazionale 2019 di questo autunno sulla visione artificiale (ICv 2019).
Introdotto per la prima volta nel 2016, Open Image è una versione collaborativa che comprende circa nove milioni di immagini annotate con etichette che coprono migliaia di categorie di oggetti. La nuova versione è un aggiornamento su Open Images V4 di 2018.
Open Image V5 presenta annotazioni appena aggiunte sulle maschere di segmentazione delle immagini per 2,8 milioni di oggetti in 350 categorie. A differenza delle caselle di delimitazione che identificano solo l’area generale in cui si trova un oggetto, queste maschere di segmentazione dell’immagine tracciano il contorno dell’oggetto di destinazione, caratterizzandone l’estensione spaziale con un livello di dettaglio più elevato.
La segmentazione maschere sul training set di 2.68 milioni di campioni di dati sono stati generati dal processo di segmentazione interattiva di Google. Gli annotatori umani professionisti continuano a partecipare al miglioramento dell’output della rete neurale segmentata. Google dice che il metodo dà maschere una precisione media del 84 per cento, che è più efficiente di disegno manuale da solo.
Oltre alle maschere, Google ha aggiunto 6,4 milioni di tag a livello di immagine verificati manualmente per portare il totale a 36,5 milioni di tag che coprono quasi 20.000 categorie. I ricercatori di Google hanno anche migliorato la densità di annotazione di 600 analoghi oggetto nei set di convalida e test, aggiungendo più di 400.000 caselle di delimitazione per abbinare la densità di annotazione nel set di formazione e garantire una valutazione più accurata del modello di rilevamento di destinazione.
La sfida Openv 2019 Open Images introdurrà una nuova traccia di segmentazione delle istanze basata sul set di dati Open Images V5. Quest’anno sono state aggiunte anche una traccia di rilevamento di oggetti su larga scala che copre 500 categorie con 12,2 milioni di scatole di delimitazione di allenamento; e una traccia di rilevamento delle relazioni visive per rilevare coppie di oggetti in una particolare relazione.
Il set di formazione con tutte le annotazioni è disponibile per il download.