open_images_challenge2019_Detection

Sự miêu tả :

Open Images là bản phát hành hợp tác của ~9 triệu hình ảnh được chú thích bằng nhãn cấp độ hình ảnh, hộp giới hạn đối tượng, mặt nạ phân đoạn đối tượng và các mối quan hệ trực quan. Bộ dữ liệu đa dạng và lớn độc đáo này được thiết kế để thúc đẩy những tiến bộ hiện đại trong việc phân tích và hiểu hình ảnh.

Phần này chứa dữ liệu từ quá trình Phát hiện đối tượng của cuộc thi. Mục tiêu của bước này là dự đoán một hộp giới hạn chặt chẽ xung quanh tất cả các phiên bản đối tượng của 500 lớp.

Các hình ảnh được chú thích bằng nhãn cấp độ hình ảnh dương, cho biết có một số lớp đối tượng nhất định và bằng nhãn cấp độ hình ảnh âm, cho biết một số lớp nhất định không có. Trong cuộc thi, tất cả các lớp không được chú thích khác đều bị loại khỏi quá trình đánh giá trong hình ảnh đó. Đối với mỗi nhãn cấp độ hình ảnh tích cực trong một hình ảnh, mọi phiên bản của lớp đối tượng đó trong hình ảnh đều được chú thích.

Trang chủ : https://storage.googleapis.com/openimages/web/challenge2019.html
Mã nguồn : tfds.datasets.open_images_challenge2019_detection.Builder
Phiên bản :
- 1.0.0 (mặc định): Không có ghi chú phát hành.
Kích thước tải xuống : 534.63 GiB
Tự động lưu vào bộ nhớ đệm ( tài liệu ): Không
Chia tách :

Tách ra	Ví dụ
`'test'`	99.999
`'train'`	1.743.042
`'validation'`	41.620

Cấu trúc tính năng :

FeaturesDict({
    'bobjects': Sequence({
        'bbox': BBoxFeature(shape=(4,), dtype=float32),
        'is_group_of': bool,
        'label': ClassLabel(shape=(), dtype=int64, num_classes=500),
    }),
    'id': Text(shape=(), dtype=string),
    'image': Image(shape=(None, None, 3), dtype=uint8),
    'objects': Sequence({
        'confidence': float32,
        'label': ClassLabel(shape=(), dtype=int64, num_classes=500),
        'source': Text(shape=(), dtype=string),
    }),
})

Tài liệu tính năng :

Tính năng	Lớp học	Hình dạng	loại D
	Tính năngDict
đồ vật	Sự liên tiếp
bobjects/bbox	Tính năng BBox	(4,)	phao32
đối tượng/is_group_of	Tenxơ		bool
đối tượng/nhãn	Nhãn lớp		int64
nhận dạng	Chữ		sợi dây
hình ảnh	Hình ảnh	(Không, Không, 3)	uint8
các đối tượng	Sự liên tiếp
đồ vật/sự tự tin	Tenxơ		phao32
đồ vật/nhãn	Nhãn lớp		int64
đối tượng/nguồn	Chữ		sợi dây

Khóa được giám sát (Xem as_supervised doc ): None
Trích dẫn :

open_images_challenge2019_Detection/200k (cấu hình mặc định)

Mô tả cấu hình : Hình ảnh có tối đa 200.000 pixel, chất lượng 72 JPEG.
Kích thước tập dữ liệu : 59.06 GiB
Hình ( tfds.show_examples ):

Hình dung

Ví dụ ( tfds.as_dataframe ):

open_images_challenge2019_Detection/300k

Mô tả cấu hình : Hình ảnh có tối đa 300.000 pixel, chất lượng 72 JPEG.
Kích thước tập dữ liệu : 80.10 GiB
Hình ( tfds.show_examples ):

Hình dung

Ví dụ ( tfds.as_dataframe ):