ताओ

  • विवरण :

TAO डेटासेट एक बड़ा वीडियो ऑब्जेक्ट डिटेक्शन डेटासेट है जिसमें 2,907 उच्च रिज़ॉल्यूशन वीडियो और 833 ऑब्जेक्ट श्रेणियां शामिल हैं। ध्यान दें कि इस डेटासेट को स्टोर करने के लिए कम से कम 300 जीबी खाली जगह की आवश्यकता है।

  • अतिरिक्त दस्तावेज़ीकरण : कोड वाले कागजात पर अन्वेषण करें

  • मुखपृष्ठ : https://taodataset.org/

  • स्रोत कोड : tfds.video.tao.Tao

  • संस्करण :

    • 1.1.0 (डिफ़ॉल्ट) : जोड़ा गया परीक्षण विभाजन।
  • डाउनलोड आकार : Unknown size

  • डेटासेट आकार : Unknown size

  • मैन्युअल डाउनलोड निर्देश : इस डेटासेट के लिए आपको स्रोत डेटा को मैन्युअल रूप से download_config.manual_dir (डिफ़ॉल्ट रूप से ~/tensorflow_datasets/downloads/manual/ ) में डाउनलोड करना होगा:
    कुछ TAO फ़ाइलें (HVACS और AVA वीडियो) मैन्युअल रूप से डाउनलोड की जानी चाहिए क्योंकि MOT में लॉगिन आवश्यक है। कृपया https://motchallenge.net/tao_download.php पर दिए गए निर्देशों का पालन करते हुए वह डेटा डाउनलोड करें

इस डेटा को डाउनलोड करें और परिणामी .zip फ़ाइलों को ~/tensorflow_datasets/downloads/manual/ पर ले जाएं

यदि मैन्युअल डाउनलोड की आवश्यकता वाला डेटा मौजूद नहीं है, तो इसे छोड़ दिया जाएगा और केवल उस डेटा का उपयोग किया जाएगा जिसे मैन्युअल डाउनलोड की आवश्यकता नहीं है।

विभाजित करना उदाहरण
  • पर्यवेक्षित कुंजियाँ ( as_supervised doc देखें): None

  • चित्र ( tfds.show_examples ): समर्थित नहीं है।

  • उदाहरण ( tfds.as_dataframe ): गुम है।

  • उद्धरण :

@article{Dave_2020,
   title={TAO: A Large-Scale Benchmark for Tracking Any Object},
   ISBN={9783030585587},
   ISSN={1611-3349},
   url={http://dx.doi.org/10.1007/978-3-030-58558-7_26},
   DOI={10.1007/978-3-030-58558-7_26},
   journal={Lecture Notes in Computer Science},
   publisher={Springer International Publishing},
   author={Dave, Achal and Khurana, Tarasha and Tokmakov, Pavel and Schmid, Cordelia and Ramanan, Deva},
   year={2020},
   pages={436-454}
}

ताओ/480_640 (डिफ़ॉल्ट कॉन्फ़िगरेशन)

  • कॉन्फ़िगरेशन विवरण : सभी छवियों का आकार द्विरेखीय रूप से 480 X 640 कर दिया गया है

  • फ़ीचर संरचना :

FeaturesDict({
    'metadata': FeaturesDict({
        'dataset': string,
        'height': int32,
        'neg_category_ids': Tensor(shape=(None,), dtype=int32),
        'not_exhaustive_category_ids': Tensor(shape=(None,), dtype=int32),
        'num_frames': int32,
        'video_name': string,
        'width': int32,
    }),
    'tracks': Sequence({
        'bboxes': Sequence(BBoxFeature(shape=(4,), dtype=float32)),
        'category': ClassLabel(shape=(), dtype=int64, num_classes=363),
        'frames': Sequence(int32),
        'is_crowd': bool,
        'scale_category': string,
        'track_id': int32,
    }),
    'video': Video(Image(shape=(480, 640, 3), dtype=uint8)),
})
  • फ़ीचर दस्तावेज़ीकरण :
विशेषता कक्षा आकार डीप्रकार विवरण
फीचर्सडिक्ट
मेटाडाटा फीचर्सडिक्ट
मेटाडेटा/डेटासेट टेन्सर डोरी
मेटाडेटा/ऊंचाई टेन्सर int32
मेटाडेटा/नकारात्मक_श्रेणी_आईडी टेन्सर (कोई नहीं,) int32
मेटाडेटा/not_exhaustive_category_ids टेन्सर (कोई नहीं,) int32
मेटाडेटा/num_frames टेन्सर int32
मेटाडेटा/वीडियो_नाम टेन्सर डोरी
मेटाडेटा/चौड़ाई टेन्सर int32
पटरियों अनुक्रम
ट्रैक/बॉक्स अनुक्रम(बीबॉक्सफ़ीचर) (कोई नहीं, 4) फ्लोट32
ट्रैक/श्रेणी क्लास लेबल int64
ट्रैक/फ़्रेम अनुक्रम (टेंसर) (कोई नहीं,) int32
ट्रैक/भीड़ है टेन्सर बूल
ट्रैक/स्केल_श्रेणी टेन्सर डोरी
ट्रैक/ट्रैक_आईडी टेन्सर int32
वीडियो वीडियो(छवि) (कोई नहीं, 480, 640, 3) uint8

tao/full_resolution

  • कॉन्फ़िगरेशन विवरण : डेटासेट का पूर्ण रिज़ॉल्यूशन संस्करण।

  • फ़ीचर संरचना :

FeaturesDict({
    'metadata': FeaturesDict({
        'dataset': string,
        'height': int32,
        'neg_category_ids': Tensor(shape=(None,), dtype=int32),
        'not_exhaustive_category_ids': Tensor(shape=(None,), dtype=int32),
        'num_frames': int32,
        'video_name': string,
        'width': int32,
    }),
    'tracks': Sequence({
        'bboxes': Sequence(BBoxFeature(shape=(4,), dtype=float32)),
        'category': ClassLabel(shape=(), dtype=int64, num_classes=363),
        'frames': Sequence(int32),
        'is_crowd': bool,
        'scale_category': string,
        'track_id': int32,
    }),
    'video': Video(Image(shape=(None, None, 3), dtype=uint8)),
})
  • फ़ीचर दस्तावेज़ीकरण :
विशेषता कक्षा आकार डीप्रकार विवरण
फीचर्सडिक्ट
मेटाडाटा फीचर्सडिक्ट
मेटाडेटा/डेटासेट टेन्सर डोरी
मेटाडेटा/ऊंचाई टेन्सर int32
मेटाडेटा/नकारात्मक_श्रेणी_आईडी टेन्सर (कोई नहीं,) int32
मेटाडेटा/not_exhaustive_category_ids टेन्सर (कोई नहीं,) int32
मेटाडेटा/num_frames टेन्सर int32
मेटाडेटा/वीडियो_नाम टेन्सर डोरी
मेटाडेटा/चौड़ाई टेन्सर int32
पटरियों अनुक्रम
ट्रैक/बॉक्स अनुक्रम(बीबॉक्सफ़ीचर) (कोई नहीं, 4) फ्लोट32
ट्रैक/श्रेणी क्लास लेबल int64
ट्रैक/फ़्रेम अनुक्रम (टेंसर) (कोई नहीं,) int32
ट्रैक/भीड़ है टेन्सर बूल
ट्रैक/स्केल_श्रेणी टेन्सर डोरी
ट्रैक/ट्रैक_आईडी टेन्सर int32
वीडियो वीडियो(छवि) (कोई नहीं, कोई नहीं, कोई नहीं, 3) uint8