مراجع:
برای بارگذاری این مجموعه داده در TFDS از دستور زیر استفاده کنید:
ds = tfds.load('huggingface:conceptual_captions')
- توضیحات :
Image captioning dataset
The resulting dataset (version 1.1) has been split into Training, Validation, and Test splits. The Training split consists of 3,318,333 image-URL/caption pairs, with a total number of 51,201 total token types in the captions (i.e., total vocabulary). The average number of tokens per captions is 10.3 (standard deviation of 4.5), while the median is 9.0 tokens per caption. The Validation split consists of 15,840 image-URL/caption pairs, with similar statistics.
- مجوز : مجوز شناخته شده ای وجود ندارد
- نسخه : 1.1.0
- تقسیم ها :
تقسیم کنید | نمونه ها |
---|---|
'train' | 3318333 |
'validation' | 15840 |
- ویژگی ها :
{
"id": {
"dtype": "string",
"id": null,
"_type": "Value"
},
"caption": {
"dtype": "string",
"id": null,
"_type": "Value"
},
"url": {
"dtype": "string",
"id": null,
"_type": "Value"
}
}
بدون برچسب
برای بارگذاری این مجموعه داده در TFDS از دستور زیر استفاده کنید:
ds = tfds.load('huggingface:conceptual_captions/unlabeled')
- توضیحات :
Google's Conceptual Captions dataset has more than 3 million images, paired with natural-language captions.
In contrast with the curated style of the MS-COCO images, Conceptual Captions images and their raw descriptions are harvested from the web,
and therefore represent a wider variety of styles. The raw descriptions are harvested from the Alt-text HTML attribute associated with web images.
The authors developed an automatic pipeline that extracts, filters, and transforms candidate image/caption pairs, with the goal of achieving a balance of cleanliness,
informativeness, fluency, and learnability of the resulting captions.
مجوز : مجموعه داده ممکن است آزادانه برای هر هدفی مورد استفاده قرار گیرد، اگرچه تأیید Google LLC ("Google") به عنوان منبع داده قدردانی می شود. مجموعه داده "همانطور که هست" بدون هیچ گونه ضمانت، صریح یا ضمنی ارائه شده است. Google مسئولیت هرگونه خسارت مستقیم یا غیرمستقیم ناشی از استفاده از مجموعه داده را رد می کند.
نسخه : 0.0.0
تقسیم ها :
تقسیم کنید | نمونه ها |
---|---|
'train' | 3318333 |
'validation' | 15840 |
- ویژگی ها :
{
"image_url": {
"dtype": "string",
"id": null,
"_type": "Value"
},
"caption": {
"dtype": "string",
"id": null,
"_type": "Value"
}
}
برچسب زده شده است
برای بارگذاری این مجموعه داده در TFDS از دستور زیر استفاده کنید:
ds = tfds.load('huggingface:conceptual_captions/labeled')
- توضیحات :
Google's Conceptual Captions dataset has more than 3 million images, paired with natural-language captions.
In contrast with the curated style of the MS-COCO images, Conceptual Captions images and their raw descriptions are harvested from the web,
and therefore represent a wider variety of styles. The raw descriptions are harvested from the Alt-text HTML attribute associated with web images.
The authors developed an automatic pipeline that extracts, filters, and transforms candidate image/caption pairs, with the goal of achieving a balance of cleanliness,
informativeness, fluency, and learnability of the resulting captions.
مجوز : مجموعه داده ممکن است آزادانه برای هر هدفی مورد استفاده قرار گیرد، اگرچه تأیید Google LLC ("Google") به عنوان منبع داده قدردانی می شود. مجموعه داده "همانطور که هست" بدون هیچ گونه ضمانت، صریح یا ضمنی ارائه شده است. Google مسئولیت هرگونه خسارت مستقیم یا غیرمستقیم ناشی از استفاده از مجموعه داده را رد می کند.
نسخه : 0.0.0
تقسیم ها :
تقسیم کنید | نمونه ها |
---|---|
'train' | 2007090 |
- ویژگی ها :
{
"image_url": {
"dtype": "string",
"id": null,
"_type": "Value"
},
"caption": {
"dtype": "string",
"id": null,
"_type": "Value"
},
"labels": {
"feature": {
"dtype": "string",
"id": null,
"_type": "Value"
},
"length": -1,
"id": null,
"_type": "Sequence"
},
"MIDs": {
"feature": {
"dtype": "string",
"id": null,
"_type": "Value"
},
"length": -1,
"id": null,
"_type": "Sequence"
},
"confidence_scores": {
"feature": {
"dtype": "float64",
"id": null,
"_type": "Value"
},
"length": -1,
"id": null,
"_type": "Sequence"
}
}