sun397

Cơ sở dữ liệu chứa 108.753 hình ảnh thuộc 397 danh mục, được sử dụng trong điểm chuẩn Hiểu biết về bối cảnh (SUN). Số lượng hình ảnh khác nhau giữa các danh mục, nhưng có ít nhất 100 hình ảnh cho mỗi danh mục.

Một số cấu hình của tập dữ liệu được cung cấp thông qua TFDS:

  • Một phân vùng tùy chỉnh (ngẫu nhiên) của toàn bộ tập dữ liệu với 76.128 hình ảnh đào tạo, 10.875 hình ảnh xác thực và 21.750 hình ảnh thử nghiệm. Hình ảnh đã được thay đổi kích thước để có tối đa 120.000 pixel và được mã hóa thành JPEG với chất lượng 72.

  • "tiêu chuẩn-part1-120k", "tiêu chuẩn-part2-120k", ..., "tiêu chuẩn-part10-120k": Mỗi phân vùng trong số 10 phân vùng đào tạo/kiểm tra chính thức với 50 hình ảnh mỗi lớp trong mỗi phân chia. Hình ảnh đã được thay đổi kích thước để có tối đa 120.000 pixel và được mã hóa thành JPEG với chất lượng 72.

  • Tài liệu bổ sung : Khám phá trên giấy tờ với mã

  • Trang chủ : https://vision.princeton.edu/projects/2010/SUN/

  • Mã nguồn : tfds.datasets.sun397.Builder

  • Phiên bản :

    • 4.0.0 (mặc định): Không có ghi chú phát hành.
  • Kích thước tải xuống : 36.41 GiB

  • Kích thước tập dữ liệu : Unknown size

  • Tự động lưu vào bộ nhớ đệm ( tài liệu ): Không xác định

  • Cấu trúc tính năng :

FeaturesDict({
    'file_name': Text(shape=(), dtype=string),
    'image': Image(shape=(None, None, 3), dtype=uint8),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=397),
})
  • Tài liệu tính năng :
Đặc tính Tầng lớp Hình dạng Dtype Sự miêu tả
Tính năngDict
tên_tệp Chữ chuỗi
hình ảnh Hình ảnh (Không, Không có, 3) uint8
nhãn LớpNhãn int64
@INPROCEEDINGS{Xiao:2010,
author={J. {Xiao} and J. {Hays} and K. A. {Ehinger} and A. {Oliva} and A. {Torralba} },
booktitle={2010 IEEE Computer Society Conference on Computer Vision and Pattern Recognition},
title={SUN database: Large-scale scene recognition from abbey to zoo},
year={2010},
volume={},
number={},
pages={3485-3492},
keywords={computer vision;human factors;image classification;object recognition;visual databases;SUN database;large-scale scene recognition;abbey;zoo;scene categorization;computer vision;scene understanding research;scene category;object categorization;scene understanding database;state-of-the-art algorithms;human scene classification performance;finer-grained scene representation;Sun;Large-scale systems;Layout;Humans;Image databases;Computer vision;Anthropometry;Bridges;Legged locomotion;Spatial databases},
doi={10.1109/CVPR.2010.5539970},
ISSN={1063-6919},
month={June},}

sun397/tfds (cấu hình mặc định)

  • Mô tả cấu hình : Phân vùng TFDS với phân tách đào tạo/xác thực/kiểm tra ngẫu nhiên với 70%/10%/20% hình ảnh tương ứng. Hình ảnh được thay đổi kích thước để có tối đa 120.000 pixel và được nén với chất lượng 72 JPEG.

  • Chia tách :

Tách ra ví dụ
'test' 21.750
'train' 76,128
'validation' 10,875

Hình dung

sun397/chuẩn-phần1-120k

  • Mô tả cấu hình : Huấn luyện và kiểm tra phân tách từ phân vùng chính thức số 1. Hình ảnh được thay đổi kích thước để có tối đa 120.000 pixel và được nén với chất lượng 72 JPEG.

  • Chia tách :

Tách ra ví dụ
'test' 19.850
'train' 19.850

Hình dung

sun397/chuẩn-phần2-120k

  • Mô tả cấu hình : Huấn luyện và kiểm tra phân tách từ phân vùng chính thức số 2. Hình ảnh được thay đổi kích thước để có tối đa 120.000 pixel và được nén với chất lượng 72 JPEG.

  • Chia tách :

Tách ra ví dụ
'test' 19.850
'train' 19.850

Hình dung

sun397/chuẩn-phần3-120k

  • Mô tả cấu hình : Huấn luyện và kiểm tra phân tách từ phân vùng chính thức số 3. Hình ảnh được thay đổi kích thước để có tối đa 120.000 pixel và được nén với chất lượng 72 JPEG.

  • Chia tách :

Tách ra ví dụ
'test' 19.850
'train' 19.850

Hình dung

sun397/chuẩn-phần4-120k

  • Mô tả cấu hình : Huấn luyện và kiểm tra phân tách từ phân vùng chính thức số 4. Hình ảnh được thay đổi kích thước để có tối đa 120.000 pixel và được nén với chất lượng 72 JPEG.

  • Chia tách :

Tách ra ví dụ
'test' 19.850
'train' 19.850

Hình dung

sun397/chuẩn-phần5-120k

  • Mô tả cấu hình : Huấn luyện và kiểm tra phân tách từ phân vùng chính thức số 5. ​​Hình ảnh được thay đổi kích thước để có tối đa 120.000 pixel và được nén với chất lượng 72 JPEG.

  • Chia tách :

Tách ra ví dụ
'test' 19.850
'train' 19.850

Hình dung

sun397/chuẩn-phần6-120k

  • Mô tả cấu hình : Huấn luyện và kiểm tra phân tách từ phân vùng chính thức số 6. Hình ảnh được thay đổi kích thước để có tối đa 120.000 pixel và được nén với chất lượng 72 JPEG.

  • Chia tách :

Tách ra ví dụ
'test' 19.850
'train' 19.850

Hình dung

sun397/chuẩn-phần7-120k

  • Mô tả cấu hình : Huấn luyện và kiểm tra phân tách từ phân vùng chính thức số 7. Hình ảnh được thay đổi kích thước để có tối đa 120.000 pixel và được nén với chất lượng 72 JPEG.

  • Chia tách :

Tách ra ví dụ
'test' 19.850
'train' 19.850

Hình dung

sun397/chuẩn-phần8-120k

  • Mô tả cấu hình : Huấn luyện và kiểm tra phân tách từ phân vùng chính thức số 8. Hình ảnh được thay đổi kích thước để có tối đa 120.000 pixel và được nén với chất lượng 72 JPEG.

  • Chia tách :

Tách ra ví dụ
'test' 19.850
'train' 19.850

Hình dung

sun397/chuẩn-phần9-120k

  • Mô tả cấu hình : Huấn luyện và kiểm tra phân tách từ phân vùng chính thức số 9. Hình ảnh được thay đổi kích thước để có tối đa 120.000 pixel và được nén với chất lượng 72 JPEG.

  • Chia tách :

Tách ra ví dụ
'test' 19.850
'train' 19.850

Hình dung

sun397/chuẩn-phần10-120k

  • Mô tả cấu hình : Huấn luyện và kiểm tra phân tách từ phân vùng chính thức số 10. Hình ảnh được thay đổi kích thước để có tối đa 120.000 pixel và được nén với chất lượng 72 JPEG.

  • Chia tách :

Tách ra ví dụ
'test' 19.850
'train' 19.850

Hình dung