davis

  • Mô tả :

Bộ dữ liệu phân đoạn đối tượng video DAVIS 2017.

Tách ra ví dụ
'train' 60
'validation' 30
  • Cấu trúc tính năng :
FeaturesDict({
   
'metadata': FeaturesDict({
       
'num_frames': int64,
       
'video_name': string,
   
}),
   
'video': Sequence({
       
'frames': Image(shape=(None, None, 3), dtype=uint8),
       
'segmentations': Image(shape=(None, None, 1), dtype=uint8),
   
}),
})
  • Tài liệu tính năng :
Tính năng Lớp Hình dạng Dtype Sự mô tả
Tính năngDict
metadata Tính năngDict
siêu dữ liệu/num_frames tenxơ int64
siêu dữ liệu/video_name tenxơ sợi dây
video Sự phối hợp
video/khung hình Hình ảnh (Không, Không có, 3) uint8
video/phân đoạn Hình ảnh (Không có, Không có, 1) uint8
@article{DBLP:journals/corr/Pont-TusetPCASG17,
  author    
= {Jordi Pont{-}Tuset and
               
Federico Perazzi and
               
Sergi Caelles and
               
Pablo Arbelaez and
               
Alexander Sorkine{-}Hornung and
               
Luc Van Gool},
  title    
= {The 2017 {DAVIS} Challenge on Video Object Segmentation},
  journal  
= {CoRR},
  volume    
= {abs/1704.00675},
  year      
= {2017},
  url      
= {http://arxiv.org/abs/1704.00675},
  archivePrefix
= {arXiv},
  eprint    
= {1704.00675},
  timestamp
= {Mon, 13 Aug 2018 16:48:55 +0200},
  biburl    
= {https://dblp.org/rec/journals/corr/Pont-TusetPCASG17.bib},
  bibsource
= {dblp computer science bibliography, https://dblp.org}
}

davis/480p (cấu hình mặc định)

  • Mô tả cấu hình : Phiên bản 480p của tập dữ liệu

  • Kích thước tải xuống : 794.19 MiB

  • Kích thước tập dữ liệu : 792.26 MiB

  • Ví dụ ( tfds.as_dataframe ):

davis/full_resolution

  • Mô tả cấu hình : Phiên bản có độ phân giải đầy đủ của tập dữ liệu.

  • Kích thước tải xuống : 2.75 GiB

  • Kích thước tập dữ liệu : 2.78 GiB

  • Ví dụ ( tfds.as_dataframe ):