- Mô tả :
Bộ dữ liệu Địa điểm được thiết kế theo nguyên tắc nhận thức thị giác của con người. Mục tiêu của chúng tôi là xây dựng kiến thức cốt lõi về hình ảnh có thể được sử dụng để huấn luyện các hệ thống nhân tạo cho các nhiệm vụ hiểu hình ảnh cấp cao, chẳng hạn như bối cảnh cảnh, nhận dạng đối tượng, dự đoán hành động và sự kiện cũng như suy luận theo lý thuyết tâm trí.
Các danh mục ngữ nghĩa của Địa điểm được xác định theo chức năng của chúng: các nhãn biểu thị cấp mục nhập của một môi trường. Để minh họa, tập dữ liệu có các loại phòng ngủ hoặc đường phố khác nhau, v.v., vì một người không hành động theo cùng một cách và không đưa ra những dự đoán giống nhau về những gì có thể xảy ra tiếp theo, trong phòng ngủ gia đình, phòng ngủ khách sạn hoặc nhà trẻ. Tổng cộng, Địa điểm chứa hơn 10 triệu hình ảnh bao gồm hơn 400 danh mục cảnh độc đáo. Bộ dữ liệu có 5000 đến 30.000 hình ảnh đào tạo cho mỗi lớp, phù hợp với tần suất xuất hiện trong thế giới thực. Bằng cách sử dụng mạng thần kinh tích chập (CNN), bộ dữ liệu Địa điểm cho phép tìm hiểu các tính năng cảnh sâu cho các tác vụ nhận dạng cảnh khác nhau, với mục tiêu thiết lập các hiệu suất hiện đại mới trên các điểm chuẩn lấy cảnh làm trung tâm.
Tại đây, chúng tôi cung cấp Cơ sở dữ liệu Địa điểm và các CNN được đào tạo cho mục đích giáo dục và nghiên cứu học thuật.
Trang chủ : http://places2.csail.mit.edu/
Mã nguồn :
tfds.datasets.placesfull.Builder
Phiên bản :
-
1.0.0
(mặc định): Không có ghi chú phát hành.
-
Kích thước tải xuống :
143.56 GiB
Kích thước tập dữ liệu :
136.56 GiB
Tự động lưu vào bộ nhớ cache ( tài liệu ): Không
Chia tách :
Tách ra | ví dụ |
---|---|
'train' | 10.653.087 |
- Cấu trúc tính năng :
FeaturesDict({
'filename': Text(shape=(), dtype=string),
'image': Image(shape=(256, 256, 3), dtype=uint8),
'label': ClassLabel(shape=(), dtype=int64, num_classes=435),
})
- Tài liệu tính năng :
Tính năng | Lớp | Hình dạng | Dtype | Sự mô tả |
---|---|---|---|---|
Tính năngDict | ||||
tên tập tin | Chữ | sợi dây | ||
hình ảnh | Hình ảnh | (256, 256, 3) | uint8 | |
nhãn mác | LớpNhãn | int64 |
Các khóa được giám sát (Xem
as_supervised
doc ):('image', 'label', 'filename')
Hình ( tfds.show_examples ):
- Ví dụ ( tfds.as_dataframe ):
- trích dẫn :
@article{zhou2017places,
title={Places: A 10 million Image Database for Scene Recognition},
author={Zhou, Bolei and Lapedriza, Agata and Khosla, Aditya and Oliva, Aude and Torralba, Antonio},
journal={IEEE Transactions on Pattern Analysis and Machine Intelligence},
year={2017},
publisher={IEEE}
}