đầy đủ

Mô tả :

Bộ dữ liệu Địa điểm được thiết kế theo nguyên tắc nhận thức thị giác của con người. Mục tiêu của chúng tôi là xây dựng kiến thức cốt lõi về hình ảnh có thể được sử dụng để huấn luyện các hệ thống nhân tạo cho các nhiệm vụ hiểu hình ảnh cấp cao, chẳng hạn như bối cảnh cảnh, nhận dạng đối tượng, dự đoán hành động và sự kiện cũng như suy luận theo lý thuyết tâm trí.

Các danh mục ngữ nghĩa của Địa điểm được xác định theo chức năng của chúng: các nhãn biểu thị cấp mục nhập của một môi trường. Để minh họa, tập dữ liệu có các loại phòng ngủ hoặc đường phố khác nhau, v.v., vì một người không hành động theo cùng một cách và không đưa ra những dự đoán giống nhau về những gì có thể xảy ra tiếp theo, trong phòng ngủ gia đình, phòng ngủ khách sạn hoặc nhà trẻ. Tổng cộng, Địa điểm chứa hơn 10 triệu hình ảnh bao gồm hơn 400 danh mục cảnh độc đáo. Bộ dữ liệu có 5000 đến 30.000 hình ảnh đào tạo cho mỗi lớp, phù hợp với tần suất xuất hiện trong thế giới thực. Bằng cách sử dụng mạng thần kinh tích chập (CNN), bộ dữ liệu Địa điểm cho phép tìm hiểu các tính năng cảnh sâu cho các tác vụ nhận dạng cảnh khác nhau, với mục tiêu thiết lập các hiệu suất hiện đại mới trên các điểm chuẩn lấy cảnh làm trung tâm.

Tại đây, chúng tôi cung cấp Cơ sở dữ liệu Địa điểm và các CNN được đào tạo cho mục đích giáo dục và nghiên cứu học thuật.

Trang chủ : http://places2.csail.mit.edu/
Mã nguồn : tfds.datasets.placesfull.Builder
Phiên bản :
- 1.0.0 (mặc định): Không có ghi chú phát hành.
Kích thước tải xuống : 143.56 GiB
Kích thước tập dữ liệu : 136.56 GiB
Tự động lưu vào bộ nhớ cache ( tài liệu ): Không
Chia tách :

Tách ra	ví dụ
`'train'`	10.653.087

Cấu trúc tính năng :

FeaturesDict({
    'filename': Text(shape=(), dtype=string),
    'image': Image(shape=(256, 256, 3), dtype=uint8),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=435),
})

Tài liệu tính năng :

Tính năng	Lớp	Hình dạng	Dtype
	Tính năngDict
tên tập tin	Chữ		sợi dây
hình ảnh	Hình ảnh	(256, 256, 3)	uint8
nhãn mác	LớpNhãn		int64

Các khóa được giám sát (Xem as_supervised doc ): ('image', 'label', 'filename')
Hình ( tfds.show_examples ):

Hình dung

Ví dụ ( tfds.as_dataframe ):

trích dẫn :

@article{zhou2017places,
  title={Places: A 10 million Image Database for Scene Recognition},
  author={Zhou, Bolei and Lapedriza, Agata and Khosla, Aditya and Oliva, Aude and Torralba, Antonio},
  journal={IEEE Transactions on Pattern Analysis and Machine Intelligence},
  year={2017},
  publisher={IEEE}
}