davis

  • Mô tả :

Bộ dữ liệu phân đoạn đối tượng video DAVIS 2017.

Tách ra ví dụ
'train' 60
'validation' 30
  • Cấu trúc tính năng :
FeaturesDict({
    'metadata': FeaturesDict({
        'num_frames': int64,
        'video_name': string,
    }),
    'video': Sequence({
        'frames': Image(shape=(None, None, 3), dtype=uint8),
        'segmentations': Image(shape=(None, None, 1), dtype=uint8),
    }),
})
  • Tài liệu tính năng :
Tính năng Lớp Hình dạng Dtype Sự mô tả
Tính năngDict
metadata Tính năngDict
siêu dữ liệu/num_frames tenxơ int64
siêu dữ liệu/video_name tenxơ sợi dây
video Sự phối hợp
video/khung hình Hình ảnh (Không, Không có, 3) uint8
video/phân đoạn Hình ảnh (Không có, Không có, 1) uint8
@article{DBLP:journals/corr/Pont-TusetPCASG17,
  author    = {Jordi Pont{-}Tuset and
               Federico Perazzi and
               Sergi Caelles and
               Pablo Arbelaez and
               Alexander Sorkine{-}Hornung and
               Luc Van Gool},
  title     = {The 2017 {DAVIS} Challenge on Video Object Segmentation},
  journal   = {CoRR},
  volume    = {abs/1704.00675},
  year      = {2017},
  url       = {http://arxiv.org/abs/1704.00675},
  archivePrefix = {arXiv},
  eprint    = {1704.00675},
  timestamp = {Mon, 13 Aug 2018 16:48:55 +0200},
  biburl    = {https://dblp.org/rec/journals/corr/Pont-TusetPCASG17.bib},
  bibsource = {dblp computer science bibliography, https://dblp.org}
}

davis/480p (cấu hình mặc định)

  • Mô tả cấu hình : Phiên bản 480p của tập dữ liệu

  • Kích thước tải xuống : 794.19 MiB

  • Kích thước tập dữ liệu : 792.26 MiB

  • Ví dụ ( tfds.as_dataframe ):

davis/full_resolution

  • Mô tả cấu hình : Phiên bản có độ phân giải đầy đủ của tập dữ liệu.

  • Kích thước tải xuống : 2.75 GiB

  • Kích thước tập dữ liệu : 2.78 GiB

  • Ví dụ ( tfds.as_dataframe ):