visual_domain_decathlon

  • Mô tả :

Điều này chứa 10 bộ dữ liệu được sử dụng trong Decathlon miền trực quan, một phần của PASCAL trong Thử thách hội thảo chi tiết (CVPR 2017). Mục tiêu của thử thách này là giải quyết đồng thời mười bài toán phân loại hình ảnh đại diện cho các miền thị giác rất khác nhau.

Một số bộ dữ liệu được bao gồm ở đây cũng có sẵn dưới dạng bộ dữ liệu riêng biệt trong TFDS. Tuy nhiên, hãy lưu ý rằng hình ảnh đã được xử lý trước cho Visual Domain Decathlon (thay đổi kích thước theo hướng đẳng hướng để có kích thước ngắn hơn là 72 pixel) và có thể có các phân chia đào tạo / xác thực / kiểm tra khác nhau. Ở đây chúng tôi sử dụng sự phân chia chính thức cho cuộc thi.

@ONLINE{hakanbilensylvestrerebuffitomasjakab2017,
    author = "Hakan Bilen, Sylvestre Rebuffi, Tomas Jakab",
    title  = "Visual Domain Decathlon",
    year   = "2017",
    url    = "https://www.robots.ox.ac.uk/~vgg/decathlon/"
}

visual_domain_decathlon / máy bay (cấu hình mặc định)

  • Mô tả cấu hình : Dữ liệu dựa trên "Máy bay", với hình ảnh được thay đổi kích thước đẳng hướng để có kích thước ngắn hơn là 72 pixel.

  • Kích thước tải xuống : 409.94 MiB

  • Kích thước tập dữ liệu : 20.96 MiB

  • Tự động lưu vào bộ nhớ đệm ( tài liệu ): Có

  • Tách :

Tách ra Các ví dụ
'test' 3.333
'train' 3.334
'validation' 3.333
  • Cấu trúc tính năng :
FeaturesDict({
    'image': Image(shape=(None, None, 3), dtype=tf.uint8),
    'label': ClassLabel(shape=(), dtype=tf.int64, num_classes=100),
    'name': Text(shape=(), dtype=tf.string),
})
  • Tài liệu tính năng :
Tính năng Lớp Hình dạng Loại Sự mô tả
Các tính năng
hình ảnh Hình ảnh (Không có, Không có, 3) tf.uint8
nhãn mác ClassLabel tf.int64
Tên Chữ tf.string

visual_domain_decathlon / cifar100

  • Mô tả cấu hình : Dữ liệu dựa trên "CIFAR-100", với hình ảnh được thay đổi kích thước đẳng hướng để có kích thước ngắn hơn là 72 pixel.

  • Kích thước tải xuống : 409.94 MiB

  • Kích thước tập dữ liệu: 119.43 MiB

  • Tự động lưu vào bộ nhớ đệm ( tài liệu ): Có

  • Tách :

Tách ra Các ví dụ
'test' 10.000
'train' 40.000
'validation' 10.000
  • Cấu trúc tính năng :
FeaturesDict({
    'image': Image(shape=(None, None, 3), dtype=tf.uint8),
    'label': ClassLabel(shape=(), dtype=tf.int64, num_classes=100),
    'name': Text(shape=(), dtype=tf.string),
})
  • Tài liệu tính năng :
Tính năng Lớp Hình dạng Loại Sự mô tả
Các tính năng
hình ảnh Hình ảnh (Không có, Không có, 3) tf.uint8
nhãn mác ClassLabel tf.int64
Tên Chữ tf.string

visual_domain_decathlon / daimlerpedcls

  • Mô tả cấu hình : Dữ liệu dựa trên "Phân loại người đi bộ của Daimler", với hình ảnh được thay đổi kích thước đẳng hướng để có kích thước ngắn hơn là 72 pixel.

  • Kích thước tải xuống : 409.94 MiB

  • Kích thước tập dữ liệu : 68.35 MiB

  • Tự động lưu vào bộ nhớ đệm ( tài liệu ): Có

  • Tách :

Tách ra Các ví dụ
'test' 19.600
'train' 23.520
'validation' 5,880
  • Cấu trúc tính năng :
FeaturesDict({
    'image': Image(shape=(None, None, 3), dtype=tf.uint8),
    'label': ClassLabel(shape=(), dtype=tf.int64, num_classes=2),
    'name': Text(shape=(), dtype=tf.string),
})
  • Tài liệu tính năng :
Tính năng Lớp Hình dạng Loại Sự mô tả
Các tính năng
hình ảnh Hình ảnh (Không có, Không có, 3) tf.uint8
nhãn mác ClassLabel tf.int64
Tên Chữ tf.string

visual_domain_decathlon / dtd

  • Mô tả cấu hình : Dữ liệu dựa trên "Kết cấu có thể mô tả", với hình ảnh được thay đổi kích thước theo hướng đẳng hướng để có kích thước ngắn hơn là 72 pixel.

  • Kích thước tải xuống : 409.94 MiB

  • Kích thước tập dữ liệu : 13.30 MiB

  • Tự động lưu vào bộ nhớ đệm ( tài liệu ): Có

  • Tách :

Tách ra Các ví dụ
'test' 1.880
'train' 1.880
'validation' 1.880
  • Cấu trúc tính năng :
FeaturesDict({
    'image': Image(shape=(None, None, 3), dtype=tf.uint8),
    'label': ClassLabel(shape=(), dtype=tf.int64, num_classes=47),
    'name': Text(shape=(), dtype=tf.string),
})
  • Tài liệu tính năng :
Tính năng Lớp Hình dạng Loại Sự mô tả
Các tính năng
hình ảnh Hình ảnh (Không có, Không có, 3) tf.uint8
nhãn mác ClassLabel tf.int64
Tên Chữ tf.string

visual_domain_decathlon / gtsrb

  • Mô tả cấu hình : Dữ liệu dựa trên "Biển báo giao thông của Đức", với hình ảnh được thay đổi kích thước đẳng hướng để có kích thước ngắn hơn là 72 pixel.

  • Kích thước tải xuống : 409.94 MiB

  • Kích thước tập dữ liệu: 80.58 MiB

  • Tự động lưu vào bộ nhớ đệm ( tài liệu ): Có

  • Tách :

Tách ra Các ví dụ
'test' 12.630
'train' 31.367
'validation' 7.842
  • Cấu trúc tính năng :
FeaturesDict({
    'image': Image(shape=(None, None, 3), dtype=tf.uint8),
    'label': ClassLabel(shape=(), dtype=tf.int64, num_classes=43),
    'name': Text(shape=(), dtype=tf.string),
})
  • Tài liệu tính năng :
Tính năng Lớp Hình dạng Loại Sự mô tả
Các tính năng
hình ảnh Hình ảnh (Không có, Không có, 3) tf.uint8
nhãn mác ClassLabel tf.int64
Tên Chữ tf.string

visual_domain_decathlon / imagenet12

  • Mô tả cấu hình : Dữ liệu dựa trên "Imagenet", với hình ảnh được thay đổi kích thước đẳng hướng để có kích thước ngắn hơn là 72 pixel.

  • Kích thước tải xuống : 6.11 GiB

  • Kích thước tập dữ liệu : 5.24 GiB

  • Tự động lưu vào bộ nhớ đệm ( tài liệu ): Không

  • Tách :

Tách ra Các ví dụ
'test' 48.238
'train' 1.232.167
'validation' 49.000
  • Cấu trúc tính năng :
FeaturesDict({
    'image': Image(shape=(None, None, 3), dtype=tf.uint8),
    'label': ClassLabel(shape=(), dtype=tf.int64, num_classes=1000),
    'name': Text(shape=(), dtype=tf.string),
})
  • Tài liệu tính năng :
Tính năng Lớp Hình dạng Loại Sự mô tả
Các tính năng
hình ảnh Hình ảnh (Không có, Không có, 3) tf.uint8
nhãn mác ClassLabel tf.int64
Tên Chữ tf.string

visual_domain_decathlon / omniglot

  • Mô tả cấu hình : Dữ liệu dựa trên "Omniglot", với hình ảnh được thay đổi kích thước đẳng hướng để có kích thước ngắn hơn là 72 pixel.

  • Kích thước tải xuống : 409.94 MiB

  • Kích thước tập dữ liệu: 41.46 MiB

  • Tự động lưu vào bộ nhớ đệm ( tài liệu ): Có

  • Tách :

Tách ra Các ví dụ
'test' 8.115
'train' 17.853
'validation' 6.492
  • Cấu trúc tính năng :
FeaturesDict({
    'image': Image(shape=(None, None, 3), dtype=tf.uint8),
    'label': ClassLabel(shape=(), dtype=tf.int64, num_classes=1623),
    'name': Text(shape=(), dtype=tf.string),
})
  • Tài liệu tính năng :
Tính năng Lớp Hình dạng Loại Sự mô tả
Các tính năng
hình ảnh Hình ảnh (Không có, Không có, 3) tf.uint8
nhãn mác ClassLabel tf.int64
Tên Chữ tf.string

visual_domain_decathlon / svhn

  • Mô tả cấu hình : Dữ liệu dựa trên "Số nhà ở Chế độ xem phố", với hình ảnh được thay đổi kích thước đẳng hướng để có kích thước ngắn hơn là 72 pixel.

  • Kích thước tải xuống : 409.94 MiB

  • Kích thước tập dữ liệu: 135.32 MiB

  • Tự động lưu vào bộ nhớ đệm ( tài liệu ): Có

  • Tách :

Tách ra Các ví dụ
'test' 26.032
'train' 47.217
'validation' 26.040
  • Cấu trúc tính năng :
FeaturesDict({
    'image': Image(shape=(None, None, 3), dtype=tf.uint8),
    'label': ClassLabel(shape=(), dtype=tf.int64, num_classes=10),
    'name': Text(shape=(), dtype=tf.string),
})
  • Tài liệu tính năng :
Tính năng Lớp Hình dạng Loại Sự mô tả
Các tính năng
hình ảnh Hình ảnh (Không có, Không có, 3) tf.uint8
nhãn mác ClassLabel tf.int64
Tên Chữ tf.string

visual_domain_decathlon / ucf101

  • Mô tả cấu hình : Dữ liệu dựa trên "Hình ảnh động UCF101", với hình ảnh được thay đổi kích thước đẳng hướng để có kích thước ngắn hơn là 72 pixel.

  • Kích thước tải xuống : 409.94 MiB

  • Kích thước tập dữ liệu : 19.73 MiB

  • Tự động lưu vào bộ nhớ đệm ( tài liệu ): Có

  • Tách :

Tách ra Các ví dụ
'test' 3.783
'train' 7,585
'validation' 1.952
  • Cấu trúc tính năng :
FeaturesDict({
    'image': Image(shape=(None, None, 3), dtype=tf.uint8),
    'label': ClassLabel(shape=(), dtype=tf.int64, num_classes=101),
    'name': Text(shape=(), dtype=tf.string),
})
  • Tài liệu tính năng :
Tính năng Lớp Hình dạng Loại Sự mô tả
Các tính năng
hình ảnh Hình ảnh (Không có, Không có, 3) tf.uint8
nhãn mác ClassLabel tf.int64
Tên Chữ tf.string

visual_domain_decathlon / vgg-hoa

  • Mô tả cấu hình : Dữ liệu dựa trên "VGG-Flowers", với hình ảnh được thay đổi kích thước đẳng hướng để có kích thước ngắn hơn là 72 pixel.

  • Kích thước tải xuống : 409.94 MiB

  • Kích thước tập dữ liệu: 20.87 MiB

  • Tự động lưu vào bộ nhớ đệm ( tài liệu ): Có

  • Tách :

Tách ra Các ví dụ
'test' 6.149
'train' 1,020
'validation' 1,020
  • Cấu trúc tính năng :
FeaturesDict({
    'image': Image(shape=(None, None, 3), dtype=tf.uint8),
    'label': ClassLabel(shape=(), dtype=tf.int64, num_classes=102),
    'name': Text(shape=(), dtype=tf.string),
})
  • Tài liệu tính năng :
Tính năng Lớp Hình dạng Loại Sự mô tả
Các tính năng
hình ảnh Hình ảnh (Không có, Không có, 3) tf.uint8
nhãn mác ClassLabel tf.int64
Tên Chữ tf.string