sun397

  • Sự miêu tả :

Cơ sở dữ liệu chứa 108.753 hình ảnh thuộc 397 danh mục, được sử dụng trong tiêu chuẩn Hiểu biết về Cảnh (SUN). Số lượng hình ảnh khác nhau giữa các danh mục nhưng có ít nhất 100 hình ảnh cho mỗi danh mục.

Một số cấu hình của tập dữ liệu được cung cấp thông qua TFDS:

  • Một phân vùng tùy chỉnh (ngẫu nhiên) của toàn bộ tập dữ liệu với 76.128 hình ảnh huấn luyện, 10.875 hình ảnh xác thực và 21.750 hình ảnh thử nghiệm. Hình ảnh đã được thay đổi kích thước để có tối đa 120.000 pixel và được mã hóa dưới dạng JPEG với chất lượng 72.

  • "standard-part1-120k", "standard-part2-120k", ..., "standard-part10-120k": Mỗi phân vùng trong số 10 phân vùng đào tạo/kiểm tra chính thức với 50 hình ảnh cho mỗi lớp trong mỗi phần. Hình ảnh đã được thay đổi kích thước để có tối đa 120.000 pixel và được mã hóa dưới dạng JPEG với chất lượng 72.

  • Tài liệu bổ sung : Khám phá trên giấy tờ có mã

  • Trang chủ : https://vision.princeton.edu/projects/2010/SUN/

  • Mã nguồn : tfds.datasets.sun397.Builder

  • Phiên bản :

    • 4.0.0 (mặc định): Không có ghi chú phát hành.
  • Kích thước tải xuống : 36.41 GiB

  • Kích thước tập dữ liệu : Unknown size

  • Tự động lưu vào bộ nhớ đệm ( tài liệu ): Không xác định

  • Cấu trúc tính năng :

FeaturesDict({
    'file_name': Text(shape=(), dtype=string),
    'image': Image(shape=(None, None, 3), dtype=uint8),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=397),
})
  • Tài liệu tính năng :
Tính năng Lớp học Hình dạng loại D Sự miêu tả
Tính năngDict
tên_tệp Chữ sợi dây
hình ảnh Hình ảnh (Không, Không, 3) uint8
nhãn Nhãn lớp int64
@INPROCEEDINGS{Xiao:2010,
author={J. {Xiao} and J. {Hays} and K. A. {Ehinger} and A. {Oliva} and A. {Torralba} },
booktitle={2010 IEEE Computer Society Conference on Computer Vision and Pattern Recognition},
title={SUN database: Large-scale scene recognition from abbey to zoo},
year={2010},
volume={},
number={},
pages={3485-3492},
keywords={computer vision;human factors;image classification;object recognition;visual databases;SUN database;large-scale scene recognition;abbey;zoo;scene categorization;computer vision;scene understanding research;scene category;object categorization;scene understanding database;state-of-the-art algorithms;human scene classification performance;finer-grained scene representation;Sun;Large-scale systems;Layout;Humans;Image databases;Computer vision;Anthropometry;Bridges;Legged locomotion;Spatial databases},
doi={10.1109/CVPR.2010.5539970},
ISSN={1063-6919},
month={June},}

sun397/tfds (cấu hình mặc định)

  • Mô tả cấu hình : Phân vùng TFDS với các phân chia đào tạo/xác thực/kiểm tra ngẫu nhiên với 70%/10%/20% số hình ảnh tương ứng. Hình ảnh được thay đổi kích thước để có tối đa 120.000 pixel và được nén với chất lượng 72 JPEG.

  • Chia tách :

Tách ra Ví dụ
'test' 21.750
'train' 76.128
'validation' 10,875

Hình dung

sun397/tiêu chuẩn-part1-120k

  • Mô tả cấu hình : Đào tạo và kiểm tra các phân tách từ phân vùng chính thức số 1. Hình ảnh được thay đổi kích thước để có tối đa 120.000 pixel và được nén với chất lượng 72 JPEG.

  • Chia tách :

Tách ra Ví dụ
'test' 19.850
'train' 19.850

Hình dung

sun397/tiêu chuẩn-part2-120k

  • Mô tả cấu hình : Đào tạo và kiểm tra các phân tách từ phân vùng chính thức số 2. Hình ảnh được thay đổi kích thước để có tối đa 120.000 pixel và được nén với chất lượng 72 JPEG.

  • Chia tách :

Tách ra Ví dụ
'test' 19.850
'train' 19.850

Hình dung

sun397/tiêu chuẩn-part3-120k

  • Mô tả cấu hình : Đào tạo và kiểm tra các phân tách từ phân vùng chính thức số 3. Hình ảnh được thay đổi kích thước để có tối đa 120.000 pixel và được nén với chất lượng 72 JPEG.

  • Chia tách :

Tách ra Ví dụ
'test' 19.850
'train' 19.850

Hình dung

sun397/tiêu chuẩn-part4-120k

  • Mô tả cấu hình : Đào tạo và kiểm tra các phần tách từ phân vùng chính thức số 4. Hình ảnh được thay đổi kích thước để có tối đa 120.000 pixel và được nén với chất lượng 72 JPEG.

  • Chia tách :

Tách ra Ví dụ
'test' 19.850
'train' 19.850

Hình dung

sun397/tiêu chuẩn-part5-120k

  • Mô tả cấu hình : Đào tạo và kiểm tra các phân tách từ phân vùng chính thức số 5. ​​Hình ảnh được thay đổi kích thước để có tối đa 120.000 pixel và được nén với chất lượng 72 JPEG.

  • Chia tách :

Tách ra Ví dụ
'test' 19.850
'train' 19.850

Hình dung

sun397/tiêu chuẩn-part6-120k

  • Mô tả cấu hình : Đào tạo và kiểm tra các phần tách từ phân vùng chính thức số 6. Hình ảnh được thay đổi kích thước để có tối đa 120.000 pixel và được nén với chất lượng 72 JPEG.

  • Chia tách :

Tách ra Ví dụ
'test' 19.850
'train' 19.850

Hình dung

sun397/tiêu chuẩn-part7-120k

  • Mô tả cấu hình : Đào tạo và kiểm tra các phần tách từ phân vùng chính thức số 7. Hình ảnh được thay đổi kích thước để có tối đa 120.000 pixel và được nén với chất lượng 72 JPEG.

  • Chia tách :

Tách ra Ví dụ
'test' 19.850
'train' 19.850

Hình dung

sun397/tiêu chuẩn-part8-120k

  • Mô tả cấu hình : Đào tạo và kiểm tra các phân tách từ phân vùng chính thức số 8. Hình ảnh được thay đổi kích thước để có tối đa 120.000 pixel và được nén với chất lượng 72 JPEG.

  • Chia tách :

Tách ra Ví dụ
'test' 19.850
'train' 19.850

Hình dung

sun397/tiêu chuẩn-part9-120k

  • Mô tả cấu hình : Đào tạo và kiểm tra các phân tách từ phân vùng chính thức số 9. Hình ảnh được thay đổi kích thước để có tối đa 120.000 pixel và được nén với chất lượng 72 JPEG.

  • Chia tách :

Tách ra Ví dụ
'test' 19.850
'train' 19.850

Hình dung

sun397/tiêu chuẩn-part10-120k

  • Mô tả cấu hình : Đào tạo và kiểm tra các phân tách từ phân vùng chính thức số 10. Hình ảnh được thay đổi kích thước để có tối đa 120.000 pixel và được nén với chất lượng 72 JPEG.

  • Chia tách :

Tách ra Ví dụ
'test' 19.850
'train' 19.850

Hình dung