chập chờn

Từ bài báo: Chúng tôi đã tự động thu thập bộ dữ liệu hình ảnh 5003 từ các bộ phim nổi tiếng của Hollywood. Các hình ảnh thu được bằng cách chạy một máy phát hiện người hiện đại trên mỗi khung hình thứ mười của 30 phim. Những người được phát hiện với độ tin cậy cao (khoảng 20.000 ứng viên) sau đó đã được gửi đến thị trường cung cấp dịch vụ cộng đồng Amazon Mechanical Turk để có được nhãn xác thực. Mỗi hình ảnh được chú thích bởi năm Turkers với giá 0,01 đô la mỗi người để gắn nhãn cho 10 khớp trên cơ thể. Việc ghi nhãn trung bình của năm được thực hiện trong mỗi hình ảnh để mạnh mẽ đối với chú thích ngoại lệ. Cuối cùng, chúng tôi đã từ chối các hình ảnh theo cách thủ công nếu người đó bị che khuất hoặc nhìn không chính diện nghiêm trọng. Chúng tôi dành 20% (1016 hình ảnh) dữ liệu để thử nghiệm.

Tách ra ví dụ
'test' 1,016
'train' 3,987
  • Cấu trúc tính năng :
FeaturesDict({
    'currframe': float64,
    'image': Image(shape=(480, 720, 3), dtype=uint8),
    'moviename': Text(shape=(), dtype=string),
    'poselet_hit_idx': Sequence(uint16),
    'torsobox': BBoxFeature(shape=(4,), dtype=float32),
    'xcoords': Sequence(float64),
    'ycoords': Sequence(float64),
})
  • Tài liệu tính năng :
Tính năng Lớp Hình dạng Dtype Sự mô tả
Tính năngDict
khuôn viên tenxơ phao64
hình ảnh Hình ảnh (480, 720, 3) uint8
tên bộ phim Chữ sợi dây
poselet_hit_idx Trình tự (Tensor) (Không có,) uint16
hộp thân Tính năng BBox (4,) phao32
xcoords Trình tự (Tensor) (Không có,) phao64
ycoords Trình tự (Tensor) (Không có,) phao64
@inproceedings{modec13,
    title={MODEC: Multimodal Decomposable Models for Human Pose Estimation},
    author={Sapp, Benjamin and Taskar, Ben},
    booktitle={In Proc. CVPR},
    year={2013},
  }

flic/small (cấu hình mặc định)

  • Mô tả cấu hình : Sử dụng 5003 ví dụ được sử dụng trong giấy CVPR13 MODEC.

  • Kích thước tải xuống : 286.35 MiB

  • Hình ( tfds.show_examples ):

Hình dung

phim/đầy đủ

  • Mô tả cấu hình : Sử dụng 20928 ví dụ, một siêu bộ FLIC bao gồm các ví dụ khó hơn.

  • Kích thước tải xuống : 1.10 GiB

  • Hình ( tfds.show_examples ):

Hình dung