đầy đủ

  • Mô tả :

Bộ dữ liệu Địa điểm được thiết kế theo nguyên tắc nhận thức thị giác của con người. Mục tiêu của chúng tôi là xây dựng kiến ​​thức cốt lõi về hình ảnh có thể được sử dụng để huấn luyện các hệ thống nhân tạo cho các nhiệm vụ hiểu hình ảnh cấp cao, chẳng hạn như bối cảnh cảnh, nhận dạng đối tượng, dự đoán hành động và sự kiện cũng như suy luận theo lý thuyết tâm trí.

Các danh mục ngữ nghĩa của Địa điểm được xác định theo chức năng của chúng: các nhãn biểu thị cấp mục nhập của một môi trường. Để minh họa, tập dữ liệu có các loại phòng ngủ hoặc đường phố khác nhau, v.v., vì một người không hành động theo cùng một cách và không đưa ra những dự đoán giống nhau về những gì có thể xảy ra tiếp theo, trong phòng ngủ gia đình, phòng ngủ khách sạn hoặc nhà trẻ. Tổng cộng, Địa điểm chứa hơn 10 triệu hình ảnh bao gồm hơn 400 danh mục cảnh độc đáo. Bộ dữ liệu có 5000 đến 30.000 hình ảnh đào tạo cho mỗi lớp, phù hợp với tần suất xuất hiện trong thế giới thực. Bằng cách sử dụng mạng thần kinh tích chập (CNN), bộ dữ liệu Địa điểm cho phép tìm hiểu các tính năng cảnh sâu cho các tác vụ nhận dạng cảnh khác nhau, với mục tiêu thiết lập các hiệu suất hiện đại mới trên các điểm chuẩn lấy cảnh làm trung tâm.

Tại đây, chúng tôi cung cấp Cơ sở dữ liệu Địa điểm và các CNN được đào tạo cho mục đích giáo dục và nghiên cứu học thuật.

Tách ra ví dụ
'train' 10.653.087
  • Cấu trúc tính năng :
FeaturesDict({
    'filename': Text(shape=(), dtype=string),
    'image': Image(shape=(256, 256, 3), dtype=uint8),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=435),
})
  • Tài liệu tính năng :
Tính năng Lớp Hình dạng Dtype Sự mô tả
Tính năngDict
tên tập tin Chữ sợi dây
hình ảnh Hình ảnh (256, 256, 3) uint8
nhãn mác LớpNhãn int64

Hình dung

  • trích dẫn :
@article{zhou2017places,
  title={Places: A 10 million Image Database for Scene Recognition},
  author={Zhou, Bolei and Lapedriza, Agata and Khosla, Aditya and Oliva, Aude and Torralba, Antonio},
  journal={IEEE Transactions on Pattern Analysis and Machine Intelligence},
  year={2017},
  publisher={IEEE}
}