sun397

Cơ sở dữ liệu chứa 108.753 hình ảnh thuộc 397 danh mục, được sử dụng trong tiêu chuẩn Không hiểu cảnh (SUN). Số lượng hình ảnh khác nhau giữa các danh mục, nhưng có ít nhất 100 hình ảnh cho mỗi danh mục.

Một số cấu hình của tập dữ liệu được cung cấp thông qua TFDS: - Một phân vùng tùy chỉnh (ngẫu nhiên) của toàn bộ tập dữ liệu với 76.128 hình ảnh đào tạo, 10.875 hình ảnh xác nhận và 21.750 hình ảnh thử nghiệm. Hình ảnh đã được thay đổi kích thước để có tối đa 120.000 pixel và được mã hóa dưới dạng JPEG với chất lượng 72. - "standard-part1-120k", "standard-part2-120k", ..., "standard-part10-120k": Mỗi trong số 10 phân vùng tàu / thử nghiệm chính thức với 50 hình ảnh cho mỗi lớp trong mỗi phần tách. Hình ảnh đã được thay đổi kích thước để có tối đa 120.000 pixel và được mã hóa dưới dạng JPEG với chất lượng 72.

FeaturesDict({
    'file_name': Text(shape=(), dtype=tf.string),
    'image': Image(shape=(None, None, 3), dtype=tf.uint8),
    'label': ClassLabel(shape=(), dtype=tf.int64, num_classes=397),
})
  • Tài liệu tính năng :
Tính năng Lớp Hình dạng Loại Sự mô tả
Các tính năng
tên_tệp Chữ tf.string
hình ảnh Hình ảnh (Không có, Không có, 3) tf.uint8
nhãn mác ClassLabel tf.int64
@INPROCEEDINGS{Xiao:2010,
author={J. {Xiao} and J. {Hays} and K. A. {Ehinger} and A. {Oliva} and A. {Torralba} },
booktitle={2010 IEEE Computer Society Conference on Computer Vision and Pattern Recognition},
title={SUN database: Large-scale scene recognition from abbey to zoo},
year={2010},
volume={},
number={},
pages={3485-3492},
keywords={computer vision;human factors;image classification;object recognition;visual databases;SUN database;large-scale scene recognition;abbey;zoo;scene categorization;computer vision;scene understanding research;scene category;object categorization;scene understanding database;state-of-the-art algorithms;human scene classification performance;finer-grained scene representation;Sun;Large-scale systems;Layout;Humans;Image databases;Computer vision;Anthropometry;Bridges;Legged locomotion;Spatial databases},
doi={10.1109/CVPR.2010.5539970},
ISSN={1063-6919},
month={June},}

sun397 / tfds (cấu hình mặc định)

  • Mô tả cấu hình : Phân vùng TFDS với phân chia tàu / xác thực / kiểm tra ngẫu nhiên với 70% / 10% / 20% hình ảnh, tương ứng. Hình ảnh được thay đổi kích thước để có tối đa 120.000 pixel và được nén với chất lượng 72 JPEG.

  • Tách :

Tách ra Các ví dụ
'test' 21.750
'train' 76.128
'validation' 10.875

sun397 / standard-part1-120k

  • Mô tả cấu hình : Đào tạo và kiểm tra phân tách từ phân vùng chính thức số 1. Hình ảnh được thay đổi kích thước để có tối đa 120.000 pixel và được nén với chất lượng 72 JPEG.

  • Tách :

Tách ra Các ví dụ
'test' 19.850
'train' 19.850

sun397 / standard-part2-120k

  • Mô tả cấu hình : Đào tạo và kiểm tra phân tách từ phân vùng chính thức số 2. Hình ảnh được thay đổi kích thước để có tối đa 120.000 pixel và được nén với chất lượng 72 JPEG.

  • Tách :

Tách ra Các ví dụ
'test' 19.850
'train' 19.850

sun397 / standard-part3-120k

  • Mô tả cấu hình : Đào tạo và kiểm tra phân tách từ phân vùng chính thức số 3. Hình ảnh được thay đổi kích thước để có tối đa 120.000 pixel và được nén với chất lượng 72 JPEG.

  • Tách :

Tách ra Các ví dụ
'test' 19.850
'train' 19.850

sun397 / standard-part4-120k

  • Mô tả cấu hình : Đào tạo và kiểm tra phân tách từ phân vùng chính thức số 4. Hình ảnh được thay đổi kích thước để có tối đa 120.000 pixel và được nén với chất lượng 72 JPEG.

  • Tách :

Tách ra Các ví dụ
'test' 19.850
'train' 19.850

sun397 / standard-part5-120k

  • Mô tả cấu hình : Đào tạo và kiểm tra phân tách từ phân vùng chính thức số 5. ​​Hình ảnh được thay đổi kích thước để có tối đa 120.000 pixel và được nén với chất lượng 72 JPEG.

  • Tách :

Tách ra Các ví dụ
'test' 19.850
'train' 19.850

sun397 / standard-part6-120k

  • Mô tả cấu hình : Đào tạo và kiểm tra phân tách từ phân vùng chính thức số 6. Hình ảnh được thay đổi kích thước để có tối đa 120.000 pixel và được nén với chất lượng 72 JPEG.

  • Tách :

Tách ra Các ví dụ
'test' 19.850
'train' 19.850

sun397 / standard-part7-120k

  • Mô tả cấu hình : Đào tạo và kiểm tra phân tách từ phân vùng chính thức số 7. Hình ảnh được thay đổi kích thước để có tối đa 120.000 pixel và được nén với chất lượng 72 JPEG.

  • Tách :

Tách ra Các ví dụ
'test' 19.850
'train' 19.850

sun397 / standard-part8-120k

  • Mô tả cấu hình : Đào tạo và kiểm tra phân tách từ phân vùng chính thức số 8. Hình ảnh được thay đổi kích thước để có tối đa 120.000 pixel và được nén với chất lượng 72 JPEG.

  • Tách :

Tách ra Các ví dụ
'test' 19.850
'train' 19.850

sun397 / standard-part9-120k

  • Mô tả cấu hình : Đào tạo và kiểm tra phân tách từ phân vùng chính thức số 9. Hình ảnh được thay đổi kích thước để có tối đa 120.000 pixel và được nén với chất lượng 72 JPEG.

  • Tách :

Tách ra Các ví dụ
'test' 19.850
'train' 19.850

sun397 / standard-part10-120k

  • Mô tả cấu hình : Đào tạo và kiểm tra phân tách từ phân vùng chính thức số 10. Hình ảnh được thay đổi kích thước để có tối đa 120.000 pixel và được nén với chất lượng 72 JPEG.

  • Tách :

Tách ra Các ví dụ
'test' 19.850
'train' 19.850