com.emnist

مجموعة بيانات EMNIST عبارة عن مجموعة من أرقام الأحرف المكتوبة بخط اليد المستمدة من قاعدة بيانات NIST الخاصة 19 وتم تحويلها إلى تنسيق صورة مقاس 28 × 28 بكسل وبنية مجموعة بيانات تتطابق مباشرة مع مجموعة بيانات MNIST.

@article{cohen_afshar_tapson_schaik_2017,
    title={EMNIST: Extending MNIST to handwritten letters},
    DOI={10.1109/ijcnn.2017.7966217},
    journal={2017 International Joint Conference on Neural Networks (IJCNN)},
    author={Cohen, Gregory and Afshar, Saeed and Tapson, Jonathan and Schaik, Andre Van},
    year={2017}
}

emnist/byclass (التكوين الافتراضي)

  • وصف التكوين : EMNIST ByClass

  • حجم مجموعة البيانات : 349.16 MiB

  • التخزين المؤقت التلقائي ( الوثائق ): لا

  • الإنشقاقات :

ينقسم أمثلة
'test' 116,323
'train' 697,932
  • هيكل الميزة :
FeaturesDict({
    'image': Image(shape=(28, 28, 1), dtype=uint8),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=62),
})
  • وثائق الميزة :
ميزة فصل شكل نوع D وصف
المميزاتDict
صورة صورة (28، 28، 1) uint8
ملصق ClassLabel int64

التصور

emnist/bymerge

  • وصف التكوين : EMNIST ByMerge

  • حجم مجموعة البيانات : 349.16 MiB

  • التخزين المؤقت التلقائي ( الوثائق ): لا

  • الإنشقاقات :

ينقسم أمثلة
'test' 116,323
'train' 697,932
  • هيكل الميزة :
FeaturesDict({
    'image': Image(shape=(28, 28, 1), dtype=uint8),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=47),
})
  • وثائق الميزة :
ميزة فصل شكل نوع D وصف
المميزاتDict
صورة صورة (28، 28، 1) uint8
ملصق ClassLabel int64

التصور

emnist / متوازن

  • وصف التكوين : EMNIST متوازن

  • حجم مجموعة البيانات : 56.63 MiB

  • التخزين المؤقت التلقائي ( الوثائق ): نعم

  • الإنشقاقات :

ينقسم أمثلة
'test' 18800
'train' 112,800
  • هيكل الميزة :
FeaturesDict({
    'image': Image(shape=(28, 28, 1), dtype=uint8),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=47),
})
  • وثائق الميزة :
ميزة فصل شكل نوع D وصف
المميزاتDict
صورة صورة (28، 28، 1) uint8
ملصق ClassLabel int64

التصور

emnist/رسائل

  • وصف التكوين : رسائل EMNIST

  • حجم مجموعة البيانات : 44.14 MiB

  • التخزين المؤقت التلقائي ( الوثائق ): نعم

  • الإنشقاقات :

ينقسم أمثلة
'test' 14800
'train' 88800
  • هيكل الميزة :
FeaturesDict({
    'image': Image(shape=(28, 28, 1), dtype=uint8),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=37),
})
  • وثائق الميزة :
ميزة فصل شكل نوع D وصف
المميزاتDict
صورة صورة (28، 28، 1) uint8
ملصق ClassLabel int64

التصور

emnist/أرقام

  • وصف التكوين : أرقام EMNIST

  • حجم مجموعة البيانات : 120.32 MiB

  • التخزين المؤقت التلقائي ( الوثائق ): نعم

  • الإنشقاقات :

ينقسم أمثلة
'test' 40.000
'train' 240.000
  • هيكل الميزة :
FeaturesDict({
    'image': Image(shape=(28, 28, 1), dtype=uint8),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=10),
})
  • وثائق الميزة :
ميزة فصل شكل نوع D وصف
المميزاتDict
صورة صورة (28، 28، 1) uint8
ملصق ClassLabel int64

التصور

emnist/mnist

  • وصف التكوين : EMNIST MNIST

  • حجم مجموعة البيانات : 30.09 MiB

  • التخزين المؤقت التلقائي ( الوثائق ): نعم

  • الإنشقاقات :

ينقسم أمثلة
'test' 10.000
'train' 60.000
  • هيكل الميزة :
FeaturesDict({
    'image': Image(shape=(28, 28, 1), dtype=uint8),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=10),
})
  • وثائق الميزة :
ميزة فصل شكل نوع D وصف
المميزاتDict
صورة صورة (28، 28، 1) uint8
ملصق ClassLabel int64

التصور