Articles

Google Releases Open Image V5, Launches Open Image Challenge

Synced
Synced

Follow

May 20, 2019 · 3 min read

Google has released its updated open-source image dataset Open Image V5 and announced the second Open Images Wyzwanie dla tej jesieni 2019 International Conference on Computer Vision (ICCV 2019).

Po raz pierwszy wprowadzony w 2016 roku, Open Image to Wspólne wydanie zawierające około dziewięciu milionów obrazów opatrzonych etykietami obejmującymi tysiące kategorii obiektów. Nowa wersja jest aktualizacją Open Images V4 2018.

Open Image V5 zawiera nowo dodane adnotacje na maskach segmentacji obrazu dla 2,8 miliona obiektów w 350 kategoriach. W przeciwieństwie do obwiedni, które identyfikują tylko ogólny obszar, w którym znajduje się obiekt, te maski segmentacji obrazu śledzą zarys obiektu docelowego, charakteryzując jego zasięg przestrzenny z wyższym poziomem szczegółowości.

przykładowe maski na otwartym images v5 training set

maski segmentacji na zestawie treningowym 2.68 milionów próbek danych zostało wygenerowanych przez interaktywny proces segmentacji Google. Profesjonalne adnotatory ludzkie nadal uczestniczą w ulepszaniu wyników segmentowanej sieci neuronowej. Google twierdzi, że metoda daje maski średnią dokładność 84 procent, co jest bardziej wydajne niż ręczne rysowanie.

przykładowe maski na Walidacja i testowanie zestawów otwartych obrazów V5, narysowanych całkowicie ręcznie.

oprócz masek, Google dodało 6,4 miliona ręcznie zweryfikowanych tagów na poziomie obrazu, aby łącznie uzyskać 36,5 miliona tagów obejmujących prawie 20 000 kategorii. Naukowcy Google poprawili również gęstość adnotacji 600 analogów obiektów w zestawach walidacji i testów, dodając ponad 400 000 obwiedni, aby dopasować gęstość adnotacji w zestawie treningowym i zapewnić dokładniejszą ocenę modelu wykrywania celu.

wyzwanie Iccv 2019 Open Images wprowadzi nową ścieżkę segmentacji instancji opartą na zbiorze danych Open Images V5. W tym roku dodano również ścieżkę wykrywania obiektów na dużą skalę obejmującą 500 kategorii z 12,2 milionami obwiedni treningowych; oraz ścieżkę wykrywania relacji wizualnych do wykrywania par obiektów w określonej relacji.

zestaw szkoleniowy ze wszystkimi adnotacjami jest dostępny do pobrania.