Articles

Google Releases Open Image V5, Launches Open Image Challenge

Synced
Synced

Follow

May 20, 2019 · 3 min read

Google has released its updated open-source image dataset Open Image V5 and announced the second Open Images Utmaning inför höstens internationella konferens om datorseende 2019 (Iccv 2019).

Open Image introducerades 2016 och är en samarbetsrelease som omfattar cirka nio miljoner bilder med etiketter som täcker tusentals objektkategorier. Den nya versionen är en uppdatering på 2018s Open Images V4.

Open Image V5 har nyligen tillagda anteckningar på bildsegmenteringsmasker för 2,8 miljoner objekt i 350 kategorier. Till skillnad från avgränsningsrutor som bara identifierar det allmänna området där ett objekt är beläget, spårar dessa bildsegmenteringsmasker konturen för målobjektet och karakteriserar dess rumsliga utsträckning med en högre detaljnivå.

exempel masker på det öppna bilder v5 träningsuppsättning

segmenteringen maskerar på träningsuppsättningen 2.68 miljoner dataprover genererades av Googles interaktiva segmenteringsprocess. Professionella mänskliga annotatorer fortsätter att delta i att förbättra det segmenterade neurala nätverkets produktion. Google säger att metoden ger masker en genomsnittlig noggrannhet på 84 procent, vilket är effektivare än manuell ritning ensam.

exempel masker på validerings-och testuppsättningar av öppna bilder v5, ritade helt manuellt.

förutom maskerna lade Google till 6,4 miljoner manuellt verifierade bildnivåtaggar för att få totalt 36,5 miljoner taggar som täcker nästan 20 000 kategorier. Google-forskare förbättrade också annoteringstätheten för 600 objektanaloger i validerings-och testuppsättningarna och lade till mer än 400 000 avgränsningsrutor för att matcha annoteringstätheten i träningsuppsättningen och säkerställa en mer exakt bedömning av måldetekteringsmodellen.

Iccv 2019 Open Images Challenge kommer att introducera ett nytt instanssegmenteringsspår baserat på Open Images V5-dataset. I år läggs också ett storskaligt objektdetekteringsspår som täcker 500 kategorier med 12,2 miljoner träningsgränser; och ett visuellt relationsdetekteringsspår för att upptäcka objektpar i ett visst förhållande.

träningsuppsättningen med alla anteckningar är tillgänglig för nedladdning.