امنیست

مجموعه داده EMNIST مجموعه ای از ارقام دست نویس کاراکتر است که از پایگاه داده ویژه NIST 19 مشتق شده و به قالب تصویر 28x28 پیکسل و ساختار داده تبدیل شده است که مستقیماً با مجموعه داده MNIST مطابقت دارد.

@article{cohen_afshar_tapson_schaik_2017,
    title={EMNIST: Extending MNIST to handwritten letters},
    DOI={10.1109/ijcnn.2017.7966217},
    journal={2017 International Joint Conference on Neural Networks (IJCNN)},
    author={Cohen, Gregory and Afshar, Saeed and Tapson, Jonathan and Schaik, Andre Van},
    year={2017}
}

emnist/byclass (پیکربندی پیش فرض)

  • توضیحات پیکربندی : EMNIST ByClass

  • حجم مجموعه داده : 349.16 MiB

  • ذخیره خودکار ( اسناد ): خیر

  • تقسیم ها :

شکاف مثال ها
'test' 116,323
'train' 697,932
  • ساختار ویژگی :
FeaturesDict({
    'image': Image(shape=(28, 28, 1), dtype=uint8),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=62),
})
  • مستندات ویژگی :
ویژگی کلاس شکل نوع D شرح
FeaturesDict
تصویر تصویر (28، 28، 1) uint8
برچسب ClassLabel int64

تجسم

emnist/bymerge

  • توضیحات پیکربندی : EMNIST ByMerge

  • حجم مجموعه داده : 349.16 MiB

  • ذخیره خودکار ( اسناد ): خیر

  • تقسیم ها :

شکاف مثال ها
'test' 116,323
'train' 697,932
  • ساختار ویژگی :
FeaturesDict({
    'image': Image(shape=(28, 28, 1), dtype=uint8),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=47),
})
  • مستندات ویژگی :
ویژگی کلاس شکل نوع D شرح
FeaturesDict
تصویر تصویر (28، 28، 1) uint8
برچسب ClassLabel int64

تجسم

امنیست/متعادل

  • توضیحات پیکربندی : EMNIST Balanced

  • حجم مجموعه داده : 56.63 MiB

  • ذخیره خودکار ( اسناد ): بله

  • تقسیم ها :

شکاف مثال ها
'test' 18800
'train' 112800
  • ساختار ویژگی :
FeaturesDict({
    'image': Image(shape=(28, 28, 1), dtype=uint8),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=47),
})
  • مستندات ویژگی :
ویژگی کلاس شکل نوع D شرح
FeaturesDict
تصویر تصویر (28، 28، 1) uint8
برچسب ClassLabel int64

تجسم

emnist / نامه ها

  • توضیحات پیکربندی : نامه های EMNIST

  • حجم مجموعه داده : 44.14 MiB

  • ذخیره خودکار ( اسناد ): بله

  • تقسیم ها :

شکاف مثال ها
'test' 14800
'train' 88800
  • ساختار ویژگی :
FeaturesDict({
    'image': Image(shape=(28, 28, 1), dtype=uint8),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=37),
})
  • مستندات ویژگی :
ویژگی کلاس شکل نوع D شرح
FeaturesDict
تصویر تصویر (28، 28، 1) uint8
برچسب ClassLabel int64

تجسم

emnist / رقم

  • توضیحات پیکربندی : ارقام EMNIST

  • حجم مجموعه داده : 120.32 MiB

  • ذخیره خودکار ( اسناد ): بله

  • تقسیم ها :

شکاف مثال ها
'test' 40000
'train' 240000
  • ساختار ویژگی :
FeaturesDict({
    'image': Image(shape=(28, 28, 1), dtype=uint8),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=10),
})
  • مستندات ویژگی :
ویژگی کلاس شکل نوع D شرح
FeaturesDict
تصویر تصویر (28، 28، 1) uint8
برچسب ClassLabel int64

تجسم

emnist/mnist

  • توضیحات پیکربندی : EMNIST MNIST

  • حجم مجموعه داده : 30.09 MiB

  • ذخیره خودکار ( اسناد ): بله

  • تقسیم ها :

شکاف مثال ها
'test' 10000
'train' 60000
  • ساختار ویژگی :
FeaturesDict({
    'image': Image(shape=(28, 28, 1), dtype=uint8),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=10),
})
  • مستندات ویژگی :
ویژگی کلاس شکل نوع D شرح
FeaturesDict
تصویر تصویر (28، 28، 1) uint8
برچسب ClassLabel int64

تجسم