Trực quan hóa : Khám phá khi biết dữ liệu của bạn
Mô tả :
Từ bài báo: Chúng tôi đã tự động thu thập bộ dữ liệu hình ảnh 5003 từ các bộ phim nổi tiếng của Hollywood. Các hình ảnh thu được bằng cách chạy một máy phát hiện người hiện đại trên mỗi khung hình thứ mười của 30 phim. Những người được phát hiện với độ tin cậy cao (khoảng 20.000 ứng viên) sau đó đã được gửi đến thị trường cung cấp dịch vụ cộng đồng Amazon Mechanical Turk để có được nhãn xác thực. Mỗi hình ảnh được chú thích bởi năm Turkers với giá 0,01 đô la mỗi người để gắn nhãn cho 10 khớp trên cơ thể. Việc ghi nhãn trung bình của năm được thực hiện trong mỗi hình ảnh để mạnh mẽ đối với chú thích ngoại lệ. Cuối cùng, chúng tôi đã từ chối các hình ảnh theo cách thủ công nếu người đó bị che khuất hoặc nhìn không chính diện nghiêm trọng. Chúng tôi dành 20% (1016 hình ảnh) dữ liệu để thử nghiệm.
Tài liệu bổ sung : Khám phá trên giấy tờ với mã
Trang chủ : https://bensapp.github.io/flic-dataset.html
Mã nguồn :
tfds.datasets.flic.Builder
Phiên bản :
-
2.0.0
(mặc định): Không có ghi chú phát hành.
-
Kích thước tập dữ liệu :
317.94 MiB
Tự động lưu vào bộ nhớ cache ( tài liệu ): Không
Chia tách :
Tách ra | ví dụ |
---|---|
'test' | 1,016 |
'train' | 3,987 |
- Cấu trúc tính năng :
FeaturesDict({
'currframe': float64,
'image': Image(shape=(480, 720, 3), dtype=uint8),
'moviename': Text(shape=(), dtype=string),
'poselet_hit_idx': Sequence(uint16),
'torsobox': BBoxFeature(shape=(4,), dtype=float32),
'xcoords': Sequence(float64),
'ycoords': Sequence(float64),
})
- Tài liệu tính năng :
Tính năng | Lớp | Hình dạng | Dtype | Sự mô tả |
---|---|---|---|---|
Tính năngDict | ||||
khuôn viên | tenxơ | phao64 | ||
hình ảnh | Hình ảnh | (480, 720, 3) | uint8 | |
tên bộ phim | Chữ | sợi dây | ||
poselet_hit_idx | Trình tự (Tensor) | (Không có,) | uint16 | |
hộp thân | Tính năng BBox | (4,) | phao32 | |
xcoords | Trình tự (Tensor) | (Không có,) | phao64 | |
ycoords | Trình tự (Tensor) | (Không có,) | phao64 |
Các khóa được giám sát (Xem
as_supervised
doc ):None
trích dẫn :
@inproceedings{modec13,
title={MODEC: Multimodal Decomposable Models for Human Pose Estimation},
author={Sapp, Benjamin and Taskar, Ben},
booktitle={In Proc. CVPR},
year={2013},
}
flic/small (cấu hình mặc định)
Mô tả cấu hình : Sử dụng 5003 ví dụ được sử dụng trong giấy CVPR13 MODEC.
Kích thước tải xuống :
286.35 MiB
Hình ( tfds.show_examples ):
- Ví dụ ( tfds.as_dataframe ):
phim/đầy đủ
Mô tả cấu hình : Sử dụng 20928 ví dụ, một siêu bộ FLIC bao gồm các ví dụ khó hơn.
Kích thước tải xuống :
1.10 GiB
Hình ( tfds.show_examples ):
- Ví dụ ( tfds.as_dataframe ):