cmaterdb

Tập dữ liệu này chứa hình ảnh của - Chữ số Bangla viết tay - tập dữ liệu cân bằng gồm tổng số 6000 chữ số Bangla (màu 32x32 RGB, 6000 hình ảnh), mỗi chữ số có 600 hình ảnh mỗi lớp (mỗi chữ số). Chữ số Devanagari viết tay - bộ dữ liệu cân bằng có tổng số 3000 chữ số Devanagari (màu 32x32 RGB, 3000 hình ảnh), mỗi chữ số có 300 hình ảnh mỗi lớp (mỗi chữ số). Chữ số Telugu viết tay - bộ dữ liệu cân bằng gồm tổng số 3000 chữ số Telugu (màu 32x32 RGB, 3000 hình ảnh), mỗi chữ số có 300 hình ảnh mỗi lớp (mỗi chữ số).

CMATERdb là kho lưu trữ cơ sở dữ liệu nhận dạng mẫu được tạo tại phòng thí nghiệm nghiên cứu 'Trung tâm Ứng dụng Bộ vi xử lý cho Giáo dục và Nghiên cứu Đào tạo' (CMATER), Đại học Jadavpur, Ấn Độ.

FeaturesDict({
    'image': Image(shape=(32, 32, 3), dtype=uint8),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=10),
})
  • Tài liệu tính năng :
Tính năng Lớp Hình dạng Dtype Sự mô tả
Tính năngDict
hình ảnh Hình ảnh (32, 32, 3) uint8
nhãn mác LớpNhãn int64
  • Các khóa được giám sát (Xem as_supervised doc ): ('image', 'label')

  • trích dẫn :

@article{Das:2012:GAB:2161007.2161320,
  author = {Das, Nibaran and Sarkar, Ram and Basu, Subhadip and Kundu, Mahantapas
            and Nasipuri, Mita and Basu, Dipak Kumar},
  title = {A Genetic Algorithm Based Region Sampling for Selection of Local Features
          in Handwritten Digit Recognition Application},
  journal = {Appl. Soft Comput.},
  issue_date = {May, 2012},
  volume = {12},
  number = {5},
  month = may,
  year = {2012},
  issn = {1568-4946},
  pages = {1592--1606},
  numpages = {15},
  url = {http://dx.doi.org/10.1016/j.asoc.2011.11.030},
  doi = {10.1016/j.asoc.2011.11.030},
  acmid = {2161320},
  publisher = {Elsevier Science Publishers B. V.},
  address = {Amsterdam, The Netherlands, The Netherlands},
  keywords = {Feature selection, Genetic algorithm, N-Quality consensus,
  Optimal local regions, Region sampling, Variable sized local regions},
}
@article{Das:2012:SFC:2240301.2240421,
  author = {Das, Nibaran and Reddy, Jagan Mohan and Sarkar, Ram and Basu, Subhadip and Kundu,
            Mahantapas and Nasipuri, Mita and Basu, Dipak Kumar},
  title = {A Statistical-topological Feature Combination for Recognition of Handwritten Numerals},
  journal = {Appl. Soft Comput.},
  issue_date = {August, 2012},
  volume = {12},
  number = {8},
  month = aug,
  year = {2012},
  issn = {1568-4946},
  pages = {2486--2495},
  numpages = {10},
  url = {http://dx.doi.org/10.1016/j.asoc.2012.03.039},
  doi = {10.1016/j.asoc.2012.03.039},
  acmid = {2240421},
  publisher = {Elsevier Science Publishers B. V.},
  address = {Amsterdam, The Netherlands, The Netherlands},
  keywords = {Character recognition, Feature combination, MPCA, PCA, SVM, Statistical, Topological},
}

cmaterdb/bangla (cấu hình mặc định)

  • Mô tả cấu hình : CMATERdb Bangla Numerals

  • Kích thước tải xuống : 573.81 KiB

  • Kích thước tập dữ liệu : 1.71 MiB

  • Chia tách :

Tách ra ví dụ
'test' 1.000
'train' 5.000

Hình dung

cmaterdb/devanagari

  • Mô tả cấu hình : CMATERdb Devangari Numerals

  • Kích thước tải xuống : 275.29 KiB

  • Kích thước tập dữ liệu : 869.50 KiB

  • Chia tách :

Tách ra ví dụ
'test' 500
'train' 2.500

Hình dung

cmaterdb/telugu

  • Mô tả cấu hình : CMATERdb Telugu Numerals

  • Kích thước tải xuống : 283.90 KiB

  • Kích thước tập dữ liệu : 860.47 KiB

  • Chia tách :

Tách ra ví dụ
'test' 500
'train' 2.500

Hình dung