open_images_challenge2019_detection

  • विवरण :

ओपन इमेजेज छवि-स्तरीय लेबल, ऑब्जेक्ट बाउंडिंग बॉक्स, ऑब्जेक्ट सेगमेंटेशन मास्क और दृश्य संबंधों के साथ एनोटेट की गई ~9 मिलियन छवियों का एक सहयोगी रिलीज है। यह विशिष्ट रूप से बड़ा और विविध डेटासेट छवियों के विश्लेषण और समझने में अत्याधुनिक प्रगति को प्रोत्साहित करने के लिए डिज़ाइन किया गया है।

इसमें प्रतियोगिता के ऑब्जेक्ट डिटेक्शन ट्रैक का डेटा शामिल है। इस ट्रैक का लक्ष्य 500 वर्गों के सभी ऑब्जेक्ट इंस्टेंस के चारों ओर एक तंग बाउंडिंग बॉक्स की भविष्यवाणी करना है।

छवियों को सकारात्मक छवि-स्तर लेबल के साथ एनोटेट किया जाता है, जो दर्शाता है कि कुछ ऑब्जेक्ट वर्ग मौजूद हैं, और नकारात्मक छवि-स्तर लेबल के साथ, यह दर्शाता है कि कुछ वर्ग अनुपस्थित हैं। प्रतियोगिता में, अन्य सभी अघोषित वर्गों को उस छवि में मूल्यांकन से बाहर रखा गया है। किसी छवि में प्रत्येक सकारात्मक छवि-स्तर लेबल के लिए, छवि में उस ऑब्जेक्ट वर्ग के प्रत्येक उदाहरण को एनोटेट किया गया था।

विभाजित करना उदाहरण
'test' 99,999
'train' 1,743,042
'validation' 41,620
  • फ़ीचर संरचना :
FeaturesDict({
    'bobjects': Sequence({
        'bbox': BBoxFeature(shape=(4,), dtype=float32),
        'is_group_of': bool,
        'label': ClassLabel(shape=(), dtype=int64, num_classes=500),
    }),
    'id': Text(shape=(), dtype=string),
    'image': Image(shape=(None, None, 3), dtype=uint8),
    'objects': Sequence({
        'confidence': float32,
        'label': ClassLabel(shape=(), dtype=int64, num_classes=500),
        'source': Text(shape=(), dtype=string),
    }),
})
  • फ़ीचर दस्तावेज़ीकरण :
विशेषता कक्षा आकार डीप्रकार विवरण
फीचर्सडिक्ट
bobjects अनुक्रम
bobjects/bbox बीबॉक्सफ़ीचर (4,) फ्लोट32
bobjects/is_group_of टेन्सर बूल
बॉबजेक्ट्स/लेबल क्लास लेबल int64
पहचान मूलपाठ डोरी
छवि छवि (कोई नहीं, कोई नहीं, 3) uint8
वस्तुओं अनुक्रम
वस्तुएं/विश्वास टेन्सर फ्लोट32
ऑब्जेक्ट/लेबल क्लास लेबल int64
वस्तुएं/स्रोत मूलपाठ डोरी
  • पर्यवेक्षित कुंजियाँ ( as_supervised doc देखें): None

  • उद्धरण :

open_images_challenge2019_detection/200k (डिफ़ॉल्ट कॉन्फ़िगरेशन)

  • कॉन्फ़िगरेशन विवरण : छवियों में अधिकतम 200,000 पिक्सेल, 72 JPEG गुणवत्ता होती है।

  • डेटासेट का आकार : 59.06 GiB

  • चित्र ( tfds.show_examples ):

VISUALIZATION

open_images_challenge2019_detection/300k

  • कॉन्फ़िगरेशन विवरण : छवियों में 72 जेपीईजी गुणवत्ता पर अधिकतम 300,000 पिक्सेल हैं।

  • डेटासेट का आकार : 80.10 GiB

  • चित्र ( tfds.show_examples ):

VISUALIZATION