Articles

Google Releases Open Image V5, Launches Open Image Challenge

Synced
Synced

Follow

May 20, 2019 · 3 min read

Google has released its updated open-source image dataset Open Image V5 and announced the second Open Images Kihívás az őszi 2019-es számítógépes látás nemzetközi konferenciájára (ICCV 2019).

először 2016-ban mutatták be, az Open Image egy együttműködési kiadás, amely körülbelül kilenc millió képet tartalmaz, amelyek címkékkel vannak ellátva, amelyek több ezer objektumkategóriát fednek le. Az új verzió a 2018-as Open Images V4 frissítése.

Open Image V5 funkciók újonnan hozzáadott kommentárok a kép szegmentációs maszkok 2,8 millió tárgyak 350 kategóriában. Ellentétben a határoló dobozokkal, amelyek csak azt az általános területet azonosítják, amelyben egy objektum található, ezek a képszegmentációs maszkok nyomon követik a célobjektum körvonalait, nagyobb részletességgel jellemezve annak térbeli kiterjedését.

példa maszkok a nyílt images v5 training set

a szegmentációs maszkok a képzési készlet 2.A Google interaktív szegmentálási folyamata során 68 millió adatmintát hoztak létre. A professzionális emberi kommentátorok továbbra is részt vesznek a szegmentált neurális hálózat kimenetének javításában. A Google szerint a módszer átlagosan 84 százalékos pontosságot ad a maszkoknak, ami hatékonyabb, mint önmagában a kézi rajz.

alidation és teszt készletek nyitott képek V5, rajzolt teljesen kézzel.

a maszkok mellett a Google 6,4 millió manuálisan ellenőrzött képszintű címkét adott hozzá, így az összesen 36,5 millió címke közel 20 000 kategóriát fed le. A Google kutatói 600 objektumanalóg annotációs sűrűségét is javították az érvényesítési és tesztkészletekben, több mint 400 000 határoló dobozt adtak hozzá, hogy megfeleljenek a képzési készlet annotációs sűrűségének, és biztosítsák a célérzékelési modell pontosabb értékelését.

az ICCV 2019 Open Images Challenge új példányszegmentációs sávot vezet be az Open Images V5 adatkészlet alapján. Ebben az évben egy nagyszabású objektum-észlelési sávot is hozzáadtak, amely 500 kategóriát tartalmaz, 12,2 millió képzési határolódobozzal; valamint egy vizuális kapcsolat-észlelési sávot az objektumpárok észlelésére egy adott kapcsolatban.

az összes kommentárral ellátott képzési készlet letölthető.