Articles

Google Releases Open Image V5, Launches Open Image Challenge

Synced
Synced

Follow

May 20, 2019 · 3 min read

Google has released its updated open-source image dataset Open Image V5 and announced the second Open Images Udfordring til efterårets internationale konference om Computervision 2019 (Iccv 2019).Open Image blev først introduceret i 2016 og er en samarbejdsudgivelse bestående af omkring ni millioner billeder kommenteret med etiketter, der dækker tusinder af objektkategorier. Den nye version er en opdatering på 2018 ‘ s Open Images V4.

Åbn billede V5 indeholder nyligt tilføjede kommentarer på billedsegmenteringsmasker til 2,8 millioner objekter i 350 kategorier. I modsætning til afgrænsningsbokse, der kun identificerer det generelle område, hvor et objekt er placeret, sporer disse billedsegmenteringsmasker omridset af målobjektet og karakteriserer dets rumlige omfang med et højere detaljeringsniveau.

eksempel masker på den åbne billeder v5 træningssæt

segmenteringsmaskerne på træningssættet af 2.68 millioner dataprøver blev genereret af Googles interaktive segmenteringsproces. Professionelle menneskelige annotatorer deltager fortsat i at forbedre det segmenterede neurale netværks output. Google siger, at metoden giver masker en gennemsnitlig nøjagtighed på 84 procent, hvilket er mere effektivt end manuel tegning alene.

Eksempelmasker på validering og test sæt af åbne billeder V5, tegnet helt manuelt.

ud over maskerne tilføjede Google 6,4 millioner manuelt verificerede tags på billedniveau for at bringe det samlede antal til 36,5 millioner tags, der dækker næsten 20.000 kategorier. Google-forskere forbedrede også annotationstætheden på 600 objektanaloger i validerings-og testsættene og tilføjede mere end 400.000 afgrænsningsbokse for at matche annotationstætheden i træningssættet og sikre en mere nøjagtig vurdering af måldetekteringsmodellen.

Iccv 2019 Open Images Challenge introducerer et nyt instanssegmenteringsspor baseret på Open Images V5-datasættet. Også tilføjet i år er et stort objektdetekteringsspor, der dækker 500 kategorier med 12,2 millioner træningsgrænsekasser; og et visuelt forholdsdetekteringsspor til at registrere objektpar i et bestemt forhold.

træningssættet med alle anmærkninger kan hentes.