wikipedia

  • Mô tả:

Bộ dữ liệu Wikipedia chứa các bài viết đã được làm sạch của tất cả các ngôn ngữ. Các tập dữ liệu được xây dựng từ các bãi chứa Wikipedia ( https://dumps.wikimedia.org/ ) với một chia cho mỗi ngôn ngữ. Mỗi ví dụ chứa nội dung của một bài viết đầy đủ trên Wikipedia với việc làm sạch để loại bỏ các phần đánh dấu và không mong muốn (tài liệu tham khảo, v.v.).

FeaturesDict({
    'text': Text(shape=(), dtype=tf.string),
    'title': Text(shape=(), dtype=tf.string),
})
@ONLINE {wikidump,
    author = "Wikimedia Foundation",
    title  = "Wikimedia Downloads",
    url    = "https://dumps.wikimedia.org"
}

wikipedia / 20201201.aa (cấu hình mặc định)

  • Config mô tả: Wikipedia bộ dữ liệu cho aa, phân tích cú pháp từ 20201201 dump.

  • Dung lượng tải về: 45.29 KiB

  • Dataset kích thước: 3.46 KiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 1

wikipedia / 20201201.ab

  • Config mô tả: Wikipedia bộ dữ liệu cho ab, phân tích cú pháp từ 20201201 dump.

  • Dung lượng tải về: 1.80 MiB

  • Dataset kích thước: 2.86 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 7.136

wikipedia / 20201201.ace

  • Config mô tả: Wikipedia bộ dữ liệu cho ace, phân tích cú pháp từ 20201201 dump.

  • Dung lượng tải về: 3.17 MiB

  • Dataset kích thước: 3.73 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 11.561

wikipedia / 20201201.ady

  • Config mô tả: Wikipedia bộ dữ liệu cho ady, phân tích cú pháp từ 20201201 dump.

  • Dung lượng tải về: 457.46 KiB

  • Dataset kích thước: 515.14 KiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 562

wikipedia / 20201201.af

  • Config mô tả: Wikipedia bộ dữ liệu cho af, phân tích cú pháp từ 20201201 dump.

  • Dung lượng tải về: 111.81 MiB

  • Dataset kích thước: 192.73 MiB

  • Tự động lưu trữ ( tài liệu ): Chỉ khi shuffle_files=False (tàu)

  • tách:

Tách ra Các ví dụ
'train' 117.154

wikipedia / 20201201.ak

  • Config mô tả: Wikipedia bộ dữ liệu cho ak, phân tích cú pháp từ 20201201 dump.

  • Dung lượng tải về: 680.35 KiB

  • Dataset kích thước: 732.95 KiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 1,424

wikipedia / 20201201.als

  • Config mô tả: Wikipedia bộ dữ liệu cho als, phân tích cú pháp từ 20201201 dump.

  • Dung lượng tải về: 52.48 MiB

  • Dataset kích thước: 70.04 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 29.826

wikipedia / 20201201.am

  • Config mô tả: Wikipedia bộ dữ liệu cho sáng, phân tích cú pháp từ 20201201 dump.

  • Dung lượng tải về: 7.12 MiB

  • Dataset kích thước: 17.44 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 13.502

wikipedia / 20201201.an

  • Config mô tả: Wikipedia bộ dữ liệu cho một, phân tích cú pháp từ 20201201 dump.

  • Dung lượng tải về: 34.56 MiB

  • Dataset kích thước: 48.50 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 53.071

wikipedia / 20201201.ang

  • Config mô tả: Wikipedia bộ dữ liệu cho ang, phân tích cú pháp từ 20201201 dump.

  • Dung lượng tải về: 4.32 MiB

  • Dataset kích thước: 2.46 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 3,360

wikipedia / 20201201.ar

  • Config mô tả: Wikipedia bộ dữ liệu cho ar, phân tích cú pháp từ 20201201 dump.

  • Dung lượng tải về: 1.22 GiB

  • Kích thước tập dữ liệu: 2.32 GiB

  • Tự động lưu trữ ( tài liệu ): Không

  • tách:

Tách ra Các ví dụ
'train' 2.049.549

wikipedia / 20201201.arc

  • Config mô tả: Wikipedia bộ dữ liệu cho hồ quang, phân tích cú pháp từ 20201201 dump.

  • Dung lượng tải về: 1.09 MiB

  • Dataset kích thước: 851.19 KiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 3.534

wikipedia / 20201201.arz

  • Config mô tả: Wikipedia bộ dữ liệu cho arz, phân tích cú pháp từ 20201201 dump.

  • Dung lượng tải về: 153.51 MiB

  • Dataset kích thước: 851.84 MiB

  • Tự động lưu trữ ( tài liệu ): Không

  • tách:

Tách ra Các ví dụ
'train' 1.182.669

wikipedia / 20201201.as

  • Config mô tả: Wikipedia bộ dữ liệu càng, phân tích cú pháp từ 20201201 dump.

  • Dung lượng tải về: 24.77 MiB

  • Dataset kích thước: 48.62 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 7.643

wikipedia / 20201201.ast

  • Config mô tả: Wikipedia bộ dữ liệu cho ast, phân tích cú pháp từ 20201201 dump.

  • Dung lượng tải về: 218.95 MiB

  • Dataset kích thước: 447.75 MiB

  • Tự động lưu trữ ( tài liệu ): Không

  • tách:

Tách ra Các ví dụ
'train' 116.833

wikipedia / 20201201.atj

  • Config mô tả: Wikipedia bộ dữ liệu cho Atj, phân tích cú pháp từ 20201201 dump.

  • Dung lượng tải về: 602.22 KiB

  • Dataset kích thước: 756.58 KiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 1,424

wikipedia / 20201201.av

  • Config mô tả: Wikipedia bộ dữ liệu cho av, phân tích cú pháp từ 20201201 dump.

  • Dung lượng tải về: 5.27 MiB

  • Dataset kích thước: 3.54 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 3.173

wikipedia / 20201201.ay

  • Config mô tả: Wikipedia bộ dữ liệu cho ay, phân tích cú pháp từ 20201201 dump.

  • Dung lượng tải về: 2.26 MiB

  • Dataset kích thước: 4.14 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 5.253

wikipedia / 20201201.az

  • Config mô tả: Wikipedia bộ dữ liệu cho az, phân tích cú pháp từ 20201201 dump.

  • Dung lượng tải về: 200.75 MiB

  • Dataset kích thước: 344.59 MiB

  • Tự động lưu trữ ( tài liệu ): Không

  • tách:

Tách ra Các ví dụ
'train' 203.051

wikipedia / 20201201.azb

  • Config mô tả: Wikipedia bộ dữ liệu cho AZB, phân tích cú pháp từ 20201201 dump.

  • Dung lượng tải về: 91.79 MiB

  • Dataset kích thước: 156.66 MiB

  • Tự động lưu trữ ( tài liệu ): Chỉ khi shuffle_files=False (tàu)

  • tách:

Tách ra Các ví dụ
'train' 265.450

wikipedia / 20201201.ba

  • Config mô tả: Wikipedia bộ dữ liệu cho ba, phân tích cú pháp từ 20201201 dump.

  • Dung lượng tải về: 72.92 MiB

  • Dataset kích thước: 207.55 MiB

  • Tự động lưu trữ ( tài liệu ): Chỉ khi shuffle_files=False (tàu)

  • tách:

Tách ra Các ví dụ
'train' 61.290

wikipedia / 20201201.bar

  • Config mô tả: Wikipedia bộ dữ liệu cho thanh, phân tích cú pháp từ 20201201 dump.

  • Dung lượng tải về: 33.42 MiB

  • Dataset kích thước: 41.25 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 46,935

wikipedia / 20201201.bat-smg

  • Config mô tả: Wikipedia bộ dữ liệu cho dơi-SMG, phân tích cú pháp từ 20201201 dump.

  • Dung lượng tải về: 4.91 MiB

  • Dataset kích thước: 6.68 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 19.779

wikipedia / 20201201.bcl

  • Config mô tả: Wikipedia bộ dữ liệu cho bcl, phân tích cú pháp từ 20201201 dump.

  • Dung lượng tải về: 10.22 MiB

  • Dataset kích thước: 10.45 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 10,763

wikipedia / 20201201.be

  • Config mô tả: Wikipedia bộ dữ liệu cho be, phân tích cú pháp từ 20201201 dump.

  • Dung lượng tải về: 224.26 MiB

  • Dataset kích thước: 465.50 MiB

  • Tự động lưu trữ ( tài liệu ): Không

  • tách:

Tách ra Các ví dụ
'train' 198,957

wikipedia / 20201201.be-x-old

  • Config mô tả: Wikipedia bộ dữ liệu cho be-x-cũ, phân tích cú pháp từ 20201201 dump.

  • Dung lượng tải về: 84.30 MiB

  • Dataset kích thước: 187.21 MiB

  • Tự động lưu trữ ( tài liệu ): Chỉ khi shuffle_files=False (tàu)

  • tách:

Tách ra Các ví dụ
'train' 103.888

wikipedia / 20201201.bg

  • Config mô tả: Wikipedia bộ dữ liệu cho bg, phân tích cú pháp từ 20201201 dump.

  • Dung lượng tải về: 362.31 MiB

  • Dataset kích thước: 909.59 MiB

  • Tự động lưu trữ ( tài liệu ): Không

  • tách:

Tách ra Các ví dụ
'train' 387.980

wikipedia / 20201201.bh

  • Config mô tả: Wikipedia bộ dữ liệu cho bh, phân tích cú pháp từ 20201201 dump.

  • Dung lượng tải về: 14.57 MiB

  • Dataset kích thước: 11.10 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 7.395

wikipedia / 20201201.bi

  • Config mô tả: Wikipedia bộ dữ liệu cho bi, phân tích cú pháp từ 20201201 dump.

  • Dung lượng tải về: 461.56 KiB

  • Dataset kích thước: 306.05 KiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 1.406

wikipedia / 20201201.bjn

  • Config mô tả: Wikipedia bộ dữ liệu cho bjn, phân tích cú pháp từ 20201201 dump.

  • Dung lượng tải về: 3.44 MiB

  • Dataset kích thước: 3.20 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 3.790

wikipedia / 20201201.bm

  • Config mô tả: Wikipedia bộ dữ liệu cho bm, phân tích cú pháp từ 20201201 dump.

  • Dung lượng tải về: 602.51 KiB

  • Dataset kích thước: 353.23 KiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 754

wikipedia / 20201201.bn

  • Config mô tả: Wikipedia bộ dữ liệu cho tỷ, phân tích cú pháp từ 20201201 dump.

  • Dung lượng tải về: 223.59 MiB

  • Dataset kích thước: 594.36 MiB

  • Tự động lưu trữ ( tài liệu ): Không

  • tách:

Tách ra Các ví dụ
'train' 156.991

wikipedia / 20201201.bo

  • Config mô tả: Wikipedia bộ dữ liệu cho bo, phân tích cú pháp từ 20201201 dump.

  • Dung lượng tải về: 13.32 MiB

  • Dataset kích thước: 117.09 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 11.670

wikipedia / 20201201.bpy

  • Config mô tả: Wikipedia bộ dữ liệu cho bpy, phân tích cú pháp từ 20201201 dump.

  • Dung lượng tải về: 5.23 MiB

  • Dataset kích thước: 39.40 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 25.475

wikipedia / 20201201.br

  • Config mô tả: Wikipedia bộ dữ liệu cho br, phân tích cú pháp từ 20201201 dump.

  • Dung lượng tải về: 52.28 MiB

  • Dataset kích thước: 74.03 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 79,725

wikipedia / 20201201.bs

  • Config mô tả: Wikipedia bộ dữ liệu cho bs, phân tích cú pháp từ 20201201 dump.

  • Dung lượng tải về: 117.25 MiB

  • Dataset kích thước: 159.74 MiB

  • Tự động lưu trữ ( tài liệu ): Chỉ khi shuffle_files=False (tàu)

  • tách:

Tách ra Các ví dụ
'train' 190.059

wikipedia / 20201201.bug

  • Config mô tả: Wikipedia bộ dữ liệu cho lỗi, phân tích cú pháp từ 20201201 dump.

  • Dung lượng tải về: 1.84 MiB

  • Dataset kích thước: 2.73 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 14.424

wikipedia / 20201201.bxr

  • Config mô tả: Wikipedia bộ dữ liệu cho BXR, phân tích cú pháp từ 20201201 dump.

  • Dung lượng tải về: 3.29 MiB

  • Dataset kích thước: 5.68 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 2.665

wikipedia / 20201201.ca

  • Config mô tả: Wikipedia bộ dữ liệu cho ca, phân tích cú pháp từ 20201201 dump.

  • Dung lượng tải về: 947.73 MiB

  • Kích thước tập dữ liệu: 1.57 GiB

  • Tự động lưu trữ ( tài liệu ): Không

  • tách:

Tách ra Các ví dụ
'train' 740.415

wikipedia / 20201201.cbk-zam

  • Config mô tả: Wikipedia bộ dữ liệu cho CBK-Zam, phân tích cú pháp từ 20201201 dump.

  • Dung lượng tải về: 3.37 MiB

  • Dataset kích thước: 3.23 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 4.479

wikipedia / 20201201.cdo

  • Config mô tả: Wikipedia bộ dữ liệu cho CDO, phân tích cú pháp từ 20201201 dump.

  • Dung lượng tải về: 4.46 MiB

  • Dataset kích thước: 4.03 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 16.879

wikipedia / 20201201.ce

  • Config mô tả: Wikipedia bộ dữ liệu cho ce, phân tích cú pháp từ 20201201 dump.

  • Dung lượng tải về: 60.74 MiB

  • Dataset kích thước: 323.18 MiB

  • Tự động lưu trữ ( tài liệu ): Không

  • tách:

Tách ra Các ví dụ
'train' 349.688

wikipedia / 20201201.ceb

  • Config mô tả: Wikipedia bộ dữ liệu cho CEB, phân tích cú pháp từ 20201201 dump.

  • Dung lượng tải về: 1.87 GiB

  • Kích thước tập dữ liệu: 3.69 GiB

  • Tự động lưu trữ ( tài liệu ): Không

  • tách:

Tách ra Các ví dụ
'train' 5.377.442

wikipedia / 20201201.ch

  • Config mô tả: Wikipedia bộ dữ liệu cho ch, phân tích cú pháp từ 20201201 dump.

  • Dung lượng tải về: 723.85 KiB

  • Dataset kích thước: 168.11 KiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 544

wikipedia / 20201201.cho

  • Config mô tả: Wikipedia bộ dữ liệu cho cho, phân tích cú pháp từ 20201201 dump.

  • Dung lượng tải về: 27.02 KiB

  • Dataset kích thước: 7.44 KiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 14

wikipedia / 20201201.chr

  • Config mô tả: Wikipedia bộ dữ liệu cho chr, phân tích cú pháp từ 20201201 dump.

  • Dung lượng tải về: 659.67 KiB

  • Dataset kích thước: 641.72 KiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 969

wikipedia / 20201201.chy

  • Config mô tả: Wikipedia bộ dữ liệu cho chy, phân tích cú pháp từ 20201201 dump.

  • Dung lượng tải về: 353.22 KiB

  • Dataset kích thước: 116.82 KiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 783

wikipedia / 20201201.ckb

  • Config mô tả: Wikipedia bộ dữ liệu cho CKB, phân tích cú pháp từ 20201201 dump.

  • Dung lượng tải về: 31.97 MiB

  • Dataset kích thước: 55.92 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 30.058

wikipedia / 20201201.co

  • Config mô tả: Wikipedia bộ dữ liệu cho đồng, phân tích cú pháp từ 20201201 dump.

  • Dung lượng tải về: 4.56 MiB

  • Dataset kích thước: 6.14 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 6.617

wikipedia / 20201201.cr

  • Config mô tả: Wikipedia bộ dữ liệu cho cr, phân tích cú pháp từ 20201201 dump.

  • Dung lượng tải về: 287.29 KiB

  • Dataset kích thước: 65.23 KiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 135

wikipedia / 20201201.crh

  • Config mô tả: Wikipedia bộ dữ liệu cho CRH, phân tích cú pháp từ 20201201 dump.

  • Dung lượng tải về: 4.79 MiB

  • Dataset kích thước: 3.06 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 8.237

wikipedia / 20201201.cs

  • Config mô tả: Wikipedia bộ dữ liệu cho cs, phân tích cú pháp từ 20201201 dump.

  • Dung lượng tải về: 882.62 MiB

  • Kích thước tập dữ liệu: 1.22 GiB

  • Tự động lưu trữ ( tài liệu ): Không

  • tách:

Tách ra Các ví dụ
'train' 603.353

wikipedia / 20201201.csb

  • Config mô tả: Wikipedia bộ dữ liệu cho CSB, phân tích cú pháp từ 20201201 dump.

  • Dung lượng tải về: 2.19 MiB

  • Dataset kích thước: 3.40 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 5.727

wikipedia / 20201201.cu

  • Config mô tả: Wikipedia bộ dữ liệu cho cu, phân tích cú pháp từ 20201201 dump.

  • Dung lượng tải về: 695.33 KiB

  • Dataset kích thước: 706.87 KiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 1.592

wikipedia / 20201201.cv

  • Config mô tả: Wikipedia bộ dữ liệu cho cv, phân tích cú pháp từ 20201201 dump.

  • Dung lượng tải về: 25.37 MiB

  • Dataset kích thước: 63.07 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 48.049

wikipedia / 20201201.cy

  • Config mô tả: Wikipedia bộ dữ liệu cho cy, phân tích cú pháp từ 20201201 dump.

  • Dung lượng tải về: 78.15 MiB

  • Dataset kích thước: 114.47 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 173.604

wikipedia / 20201201.da

  • Config mô tả: Wikipedia bộ dữ liệu cho da, phân tích cú pháp từ 20201201 dump.

  • Dung lượng tải về: 356.47 MiB

  • Dataset kích thước: 471.83 MiB

  • Tự động lưu trữ ( tài liệu ): Không

  • tách:

Tách ra Các ví dụ
'train' 263.308

wikipedia / 20201201.de

  • Config mô tả: Wikipedia bộ dữ liệu cho de, phân tích cú pháp từ 20201201 dump.

  • Dung lượng tải về: 5.58 GiB

  • Kích thước tập dữ liệu: 7.85 GiB

  • Tự động lưu trữ ( tài liệu ): Không

  • tách:

Tách ra Các ví dụ
'train' 3.229.667

wikipedia / 20201201.din

  • Config mô tả: Wikipedia bộ dữ liệu cho din, phân tích cú pháp từ 20201201 dump.

  • Dung lượng tải về: 506.05 KiB

  • Dataset kích thước: 486.08 KiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 303

wikipedia / 20201201.diq

  • Config mô tả: Wikipedia bộ dữ liệu cho diq, phân tích cú pháp từ 20201201 dump.

  • Dung lượng tải về: 11.05 MiB

  • Dataset kích thước: 16.11 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 42.014

wikipedia / 20201201.dsb

  • Config mô tả: Wikipedia bộ dữ liệu cho DSB, phân tích cú pháp từ 20201201 dump.

  • Dung lượng tải về: 3.81 MiB

  • Dataset kích thước: 3.13 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 3.541

wikipedia / 20201201.dty

  • Config mô tả: Wikipedia bộ dữ liệu cho DTY, phân tích cú pháp từ 20201201 dump.

  • Dung lượng tải về: 6.95 MiB

  • Dataset kích thước: 6.03 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 3.584

wikipedia / 20201201.dv

  • Config mô tả: Wikipedia bộ dữ liệu cho dv, phân tích cú pháp từ 20201201 dump.

  • Dung lượng tải về: 4.36 MiB

  • Dataset kích thước: 12.42 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 4.271

wikipedia / 20201201.dz

  • Config mô tả: Wikipedia bộ dữ liệu cho dz, phân tích cú pháp từ 20201201 dump.

  • Dung lượng tải về: 386.98 KiB

  • Dataset kích thước: 800.32 KiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 290

wikipedia / 20201201.ee

  • Config mô tả: Wikipedia bộ dữ liệu cho ee, phân tích cú pháp từ 20201201 dump.

  • Dung lượng tải về: 478.59 KiB

  • Dataset kích thước: 217.86 KiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 385

wikipedia / 20201201.el

  • Config mô tả: Wikipedia bộ dữ liệu cho el, phân tích cú pháp từ 20201201 dump.

  • Dung lượng tải về: 390.18 MiB

  • Dataset kích thước: 1008.24 MiB

  • Tự động lưu trữ ( tài liệu ): Không

  • tách:

Tách ra Các ví dụ
'train' 259.509

wikipedia / 20201201.eml

  • Config mô tả: Wikipedia bộ dữ liệu cho eml, phân tích cú pháp từ 20201201 dump.

  • Dung lượng tải về: 8.58 MiB

  • Dataset kích thước: 3.16 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 14,658

wikipedia / 20201201.en

  • Config mô tả: Wikipedia bộ dữ liệu cho en, phân tích cú pháp từ 20201201 dump.

  • Dung lượng tải về: 17.70 GiB

  • Kích thước tập dữ liệu: 17.76 GiB

  • Tự động lưu trữ ( tài liệu ): Không

  • tách:

Tách ra Các ví dụ
'train' 6.210.110

wikipedia / 20201201.eo

  • Config mô tả: Wikipedia bộ dữ liệu cho eo, phân tích cú pháp từ 20201201 dump.

  • Dung lượng tải về: 281.09 MiB

  • Dataset kích thước: 427.66 MiB

  • Tự động lưu trữ ( tài liệu ): Không

  • tách:

Tách ra Các ví dụ
'train' 398,951

wikipedia / 20201201.es

  • Config mô tả: Wikipedia bộ dữ liệu cho es, phân tích cú pháp từ 20201201 dump.

  • Dung lượng tải về: 3.38 GiB

  • Kích thước tập dữ liệu: 4.84 GiB

  • Tự động lưu trữ ( tài liệu ): Không

  • tách:

Tách ra Các ví dụ
'train' 2.943.343

wikipedia / 20201201.et

  • Config mô tả: Wikipedia bộ dữ liệu cho et, phân tích cú pháp từ 20201201 dump.

  • Dung lượng tải về: 223.58 MiB

  • Dataset kích thước: 369.36 MiB

  • Tự động lưu trữ ( tài liệu ): Không

  • tách:

Tách ra Các ví dụ
'train' 328.713

wikipedia / 20201201.eu

  • Config mô tả: Wikipedia bộ dữ liệu cho eu, phân tích cú pháp từ 20201201 dump.

  • Dung lượng tải về: 214.93 MiB

  • Dataset kích thước: 417.98 MiB

  • Tự động lưu trữ ( tài liệu ): Không

  • tách:

Tách ra Các ví dụ
'train' 463.673

wikipedia / 20201201.ext

  • Config mô tả: Wikipedia bộ dữ liệu cho ext, phân tích cú pháp từ 20201201 dump.

  • Dung lượng tải về: 2.55 MiB

  • Dataset kích thước: 3.62 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 3.536

wikipedia / 20201201.fa

  • Config mô tả: Wikipedia bộ dữ liệu cho fa, phân tích cú pháp từ 20201201 dump.

  • Dung lượng tải về: 850.45 MiB

  • Kích thước tập dữ liệu: 1.45 GiB

  • Tự động lưu trữ ( tài liệu ): Không

  • tách:

Tách ra Các ví dụ
'train' 2.427.541

wikipedia / 20201201.ff

  • Config mô tả: Wikipedia bộ dữ liệu cho ff, phân tích cú pháp từ 20201201 dump.

  • Dung lượng tải về: 516.43 KiB

  • Dataset kích thước: 524.57 KiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 364

wikipedia / 20201201.fi

  • Config mô tả: Wikipedia bộ dữ liệu cho fi, phân tích cú pháp từ 20201201 dump.

  • Dung lượng tải về: 744.51 MiB

  • Dataset kích thước: 964.66 MiB

  • Tự động lưu trữ ( tài liệu ): Không

  • tách:

Tách ra Các ví dụ
'train' 682.734

wikipedia / 20201201.fiu-vro

  • Config mô tả: Wikipedia bộ dữ liệu cho FIU-VRO, phân tích cú pháp từ 20201201 dump.

  • Dung lượng tải về: 2.16 MiB

  • Dataset kích thước: 3.46 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 6.266

wikipedia / 20201201.fj

  • Config mô tả: Wikipedia bộ dữ liệu cho fj, phân tích cú pháp từ 20201201 dump.

  • Dung lượng tải về: 781.90 KiB

  • Dataset kích thước: 456.89 KiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 1.118

wikipedia / 20201201.fo

  • Config mô tả: Wikipedia bộ dữ liệu cho fo, phân tích cú pháp từ 20201201 dump.

  • Dung lượng tải về: 14.37 MiB

  • Dataset kích thước: 13.68 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 13.453

wikipedia / 20201201.fr

  • Config mô tả: Wikipedia bộ dữ liệu cho fr, phân tích cú pháp từ 20201201 dump.

  • Dung lượng tải về: 4.75 GiB

  • Kích thước tập dữ liệu: 6.34 GiB

  • Tự động lưu trữ ( tài liệu ): Không

  • tách:

Tách ra Các ví dụ
'train' 2.274.691

wikipedia / 20201201.frp

  • Config mô tả: Wikipedia bộ dữ liệu cho frp, phân tích cú pháp từ 20201201 dump.

  • Dung lượng tải về: 2.60 MiB

  • Dataset kích thước: 1.95 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 6.125

wikipedia / 20201201.frr

  • Config mô tả: Wikipedia bộ dữ liệu cho FRR, phân tích cú pháp từ 20201201 dump.

  • Dung lượng tải về: 9.78 MiB

  • Dataset kích thước: 6.88 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 13,251

wikipedia / 20201201.fur

  • Config mô tả: Wikipedia bộ dữ liệu để lấy lông, phân tích cú pháp từ 20201201 dump.

  • Dung lượng tải về: 2.45 MiB

  • Dataset kích thước: 3.66 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 3.658

wikipedia / 20201201.fy

  • Config mô tả: Wikipedia bộ dữ liệu cho fy, phân tích cú pháp từ 20201201 dump.

  • Dung lượng tải về: 53.07 MiB

  • Dataset kích thước: 100.08 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 44.749

wikipedia / 20201201.ga

  • Config mô tả: Wikipedia bộ dữ liệu cho ga, phân tích cú pháp từ 20201201 dump.

  • Dung lượng tải về: 29.73 MiB

  • Dataset kích thước: 46.66 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 61.009

wikipedia / 20201201.gag

  • Config mô tả: Wikipedia bộ dữ liệu cho gag, phân tích cú pháp từ 20201201 dump.

  • Dung lượng tải về: 2.07 MiB

  • Dataset kích thước: 2.28 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 3.021

wikipedia / 20201201.gan

  • Config mô tả: Wikipedia bộ dữ liệu cho gan, phân tích cú pháp từ 20201201 dump.

  • Dung lượng tải về: 3.91 MiB

  • Dataset kích thước: 2.45 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 6,525

wikipedia / 20201201.gd

  • Config mô tả: Wikipedia bộ dữ liệu cho gd, phân tích cú pháp từ 20201201 dump.

  • Dung lượng tải về: 8.95 MiB

  • Dataset kích thước: 12.58 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 15.270

wikipedia / 20201201.gl

  • Config mô tả: Wikipedia bộ dữ liệu cho gl, phân tích cú pháp từ 20201201 dump.

  • Dung lượng tải về: 268.72 MiB

  • Dataset kích thước: 397.80 MiB

  • Tự động lưu trữ ( tài liệu ): Không

  • tách:

Tách ra Các ví dụ
'train' 226.449

wikipedia / 20201201.glk

  • Config mô tả: Wikipedia bộ dữ liệu cho glk, phân tích cú pháp từ 20201201 dump.

  • Dung lượng tải về: 2.16 MiB

  • Dataset kích thước: 4.46 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 7.001

wikipedia / 20201201.gn

  • Config mô tả: Wikipedia bộ dữ liệu cho gn, phân tích cú pháp từ 20201201 dump.

  • Dung lượng tải về: 3.81 MiB

  • Dataset kích thước: 5.47 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 4.887

wikipedia / 20201201.gom

  • Config mô tả: Wikipedia bộ dữ liệu cho gom, phân tích cú pháp từ 20201201 dump.

  • Dung lượng tải về: 6.70 MiB

  • Dataset kích thước: 29.64 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 4.482

wikipedia / 20201201.gor

  • Config mô tả: Wikipedia bộ dữ liệu cho Gor, phân tích cú pháp từ 20201201 dump.

  • Dung lượng tải về: 3.02 MiB

  • Dataset kích thước: 4.37 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 11.335

wikipedia / 20201201.got

  • Config mô tả: Wikipedia bộ dữ liệu cho GOT, phân tích cú pháp từ 20201201 dump.

  • Dung lượng tải về: 699.97 KiB

  • Dataset kích thước: 1.32 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 955

wikipedia / 20201201.gu

  • Config mô tả: Wikipedia bộ dữ liệu cho gu, phân tích cú pháp từ 20201201 dump.

  • Dung lượng tải về: 29.64 MiB

  • Dataset kích thước: 108.56 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 29.449

wikipedia / 20201201.gv

  • Config mô tả: Wikipedia bộ dữ liệu cho gv, phân tích cú pháp từ 20201201 dump.

  • Dung lượng tải về: 5.47 MiB

  • Dataset kích thước: 4.40 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 5,036

wikipedia / 20201201.ha

  • Config mô tả: Wikipedia bộ dữ liệu cho ha, phân tích cú pháp từ 20201201 dump.

  • Dung lượng tải về: 5.19 MiB

  • Dataset kích thước: 7.80 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 7.017

wikipedia / 20201201.hak

  • Config mô tả: Wikipedia bộ dữ liệu cho hak, phân tích cú pháp từ 20201201 dump.

  • Dung lượng tải về: 3.84 MiB

  • Dataset kích thước: 4.04 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 12.053

wikipedia / 20201201.haw

  • Config mô tả: Wikipedia bộ dữ liệu cho haw, phân tích cú pháp từ 20201201 dump.

  • Dung lượng tải về: 1.05 MiB

  • Dataset kích thước: 1.26 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 2,516

wikipedia / 20201201.he

  • Config mô tả: Wikipedia bộ dữ liệu cho ông, phân tích cú pháp từ 20201201 dump.

  • Dung lượng tải về: 690.54 MiB

  • Kích thước tập dữ liệu: 1.48 GiB

  • Tự động lưu trữ ( tài liệu ): Không

  • tách:

Tách ra Các ví dụ
'train' 454.321

wikipedia / 20201201.hi

  • Config mô tả: Wikipedia bộ dữ liệu cho hi, phân tích cú pháp từ 20201201 dump.

  • Dung lượng tải về: 166.88 MiB

  • Dataset kích thước: 545.88 MiB

  • Tự động lưu trữ ( tài liệu ): Không

  • tách:

Tách ra Các ví dụ
'train' 178.324

wikipedia / 20201201.hif

  • Config mô tả: Wikipedia bộ dữ liệu cho HIF, phân tích cú pháp từ 20201201 dump.

  • Dung lượng tải về: 4.88 MiB

  • Dataset kích thước: 4.32 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 10.118

wikipedia / 20201201.ho

  • Config mô tả: Wikipedia bộ dữ liệu cho ho, phân tích cú pháp từ 20201201 dump.

  • Dung lượng tải về: 19.30 KiB

  • Dataset kích thước: 3.27 KiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 3

wikipedia / 20201201.hr

  • Config mô tả: Wikipedia bộ dữ liệu cho hr, phân tích cú pháp từ 20201201 dump.

  • Dung lượng tải về: 277.38 MiB

  • Dataset kích thước: 408.92 MiB

  • Tự động lưu trữ ( tài liệu ): Không

  • tách:

Tách ra Các ví dụ
'train' 254.662

wikipedia / 20201201.hsb

  • Config mô tả: Wikipedia bộ dữ liệu cho HSB, phân tích cú pháp từ 20201201 dump.

  • Dung lượng tải về: 10.84 MiB

  • Dataset kích thước: 14.61 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 15.025

wikipedia / 20201201.ht

  • Config mô tả: Wikipedia bộ dữ liệu cho ht, phân tích cú pháp từ 20201201 dump.

  • Dung lượng tải về: 14.88 MiB

  • Dataset kích thước: 42.39 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 61.756

wikipedia / 20201201.hu

  • Config mô tả: Wikipedia bộ dữ liệu cho hu, phân tích cú pháp từ 20201201 dump.

  • Dung lượng tải về: 909.08 MiB

  • Kích thước tập dữ liệu: 1.25 GiB

  • Tự động lưu trữ ( tài liệu ): Không

  • tách:

Tách ra Các ví dụ
'train' 673.740

wikipedia / 20201201.hy

  • Config mô tả: Wikipedia bộ dữ liệu cho hy, phân tích cú pháp từ 20201201 dump.

  • Dung lượng tải về: 357.39 MiB

  • Dataset kích thước: 967.47 MiB

  • Tự động lưu trữ ( tài liệu ): Không

  • tách:

Tách ra Các ví dụ
'train' 627.523

wikipedia / 20201201.ia

  • Config mô tả: Wikipedia bộ dữ liệu cho ia, phân tích cú pháp từ 20201201 dump.

  • Dung lượng tải về: 9.15 MiB

  • Dataset kích thước: 11.96 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 20,254

wikipedia / 20201201.id

  • Config mô tả: Wikipedia bộ dữ liệu cho id, phân tích cú pháp từ 20201201 dump.

  • Dung lượng tải về: 658.39 MiB

  • Dataset kích thước: 865.16 MiB

  • Tự động lưu trữ ( tài liệu ): Không

  • tách:

Tách ra Các ví dụ
'train' 1.077.758

wikipedia / 20201201.ie

  • Config mô tả: Wikipedia bộ dữ liệu cho ví dụ, phân tích cú pháp từ 20201201 dump.

  • Dung lượng tải về: 2.18 MiB

  • Dataset kích thước: 3.28 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 5.272

wikipedia / 20201201.ig

  • Config mô tả: Wikipedia bộ dữ liệu cho ig, phân tích cú pháp từ 20201201 dump.

  • Dung lượng tải về: 2.14 MiB

  • Dataset kích thước: 2.83 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 3,426

wikipedia / 20201201.ii

  • Config mô tả: Wikipedia bộ dữ liệu cho ii, phân tích cú pháp từ 20201201 dump.

  • Dung lượng tải về: 31.96 KiB

  • Dataset kích thước: 8.31 KiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 14

wikipedia / 20201201.ik

  • Config mô tả: Wikipedia bộ dữ liệu cho ik, phân tích cú pháp từ 20201201 dump.

  • Dung lượng tải về: 257.86 KiB

  • Dataset kích thước: 93.95 KiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 668

wikipedia / 20201201.ilo

  • Config mô tả: Wikipedia bộ dữ liệu cho ilo, phân tích cú pháp từ 20201201 dump.

  • Dung lượng tải về: 18.14 MiB

  • Dataset kích thước: 15.81 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 15.390

wikipedia / 20201201.inh

  • Config mô tả: Wikipedia bộ dữ liệu cho inh, phân tích cú pháp từ 20201201 dump.

  • Dung lượng tải về: 2.98 MiB

  • Dataset kích thước: 1.34 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 2.017

wikipedia / 20201201.io

  • Config mô tả: Wikipedia bộ dữ liệu cho io, phân tích cú pháp từ 20201201 dump.

  • Dung lượng tải về: 13.81 MiB

  • Dataset kích thước: 30.11 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 31.448

wikipedia / 20201201.is

  • Config mô tả: Wikipedia dataset cho là, phân tích cú pháp từ 20201201 dump.

  • Dung lượng tải về: 47.31 MiB

  • Dataset kích thước: 73.85 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 73.114

wikipedia / 20201201.it

  • Config mô tả: Wikipedia bộ dữ liệu cho nó, phân tích cú pháp từ 20201201 dump.

  • Dung lượng tải về: 3.03 GiB

  • Kích thước tập dữ liệu: 3.91 GiB

  • Tự động lưu trữ ( tài liệu ): Không

  • tách:

Tách ra Các ví dụ
'train' 2.001.603

wikipedia / 20201201.iu

  • Config mô tả: Wikipedia bộ dữ liệu cho iu, phân tích cú pháp từ 20201201 dump.

  • Dung lượng tải về: 311.91 KiB

  • Dataset kích thước: 148.25 KiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 587

wikipedia / 20201201.ja

  • Config mô tả: Wikipedia bộ dữ liệu cho ja, phân tích cú pháp từ 20201201 dump.

  • Dung lượng tải về: 3.14 GiB

  • Kích thước tập dữ liệu: 5.61 GiB

  • Tự động lưu trữ ( tài liệu ): Không

  • tách:

Tách ra Các ví dụ
'train' 1.529.692

wikipedia / 20201201.jam

  • Config mô tả: Wikipedia bộ dữ liệu cho mứt, phân tích cú pháp từ 20201201 dump.

  • Dung lượng tải về: 925.16 KiB

  • Dataset kích thước: 1.01 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 1.720

wikipedia / 20201201.jbo

  • Config mô tả: Wikipedia bộ dữ liệu cho JBO, phân tích cú pháp từ 20201201 dump.

  • Dung lượng tải về: 1.13 MiB

  • Dataset kích thước: 2.32 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 1.330

wikipedia / 20201201.jv

  • Config mô tả: Wikipedia bộ dữ liệu cho liên doanh, phân tích cú pháp từ 20201201 dump.

  • Dung lượng tải về: 46.35 MiB

  • Dataset kích thước: 57.72 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 79.598

wikipedia / 20201201.ka

  • Config mô tả: Wikipedia bộ dữ liệu cho ka, phân tích cú pháp từ 20201201 dump.

  • Dung lượng tải về: 159.31 MiB

  • Dataset kích thước: 543.59 MiB

  • Tự động lưu trữ ( tài liệu ): Không

  • tách:

Tách ra Các ví dụ
'train' 182.623

wikipedia / 20201201.kaa

  • Config mô tả: Wikipedia bộ dữ liệu cho kaa, phân tích cú pháp từ 20201201 dump.

  • Dung lượng tải về: 1.44 MiB

  • Dataset kích thước: 1.78 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 2.197

wikipedia / 20201201.kab

  • Config mô tả: Wikipedia bộ dữ liệu cho kab, phân tích cú pháp từ 20201201 dump.

  • Dung lượng tải về: 3.55 MiB

  • Dataset kích thước: 3.40 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 5,058

wikipedia / 20201201.kbd

  • Config mô tả: Wikipedia bộ dữ liệu cho kbd, phân tích cú pháp từ 20201201 dump.

  • Dung lượng tải về: 1.69 MiB

  • Dataset kích thước: 2.74 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 1.607

wikipedia / 20201201.kbp

  • Config mô tả: Wikipedia bộ dữ liệu cho kbp, phân tích cú pháp từ 20201201 dump.

  • Dung lượng tải về: 1.40 MiB

  • Dataset kích thước: 3.36 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 1.915

wikipedia / 20201201.kg

  • Config mô tả: Wikipedia bộ dữ liệu cho kg, phân tích cú pháp từ 20201201 dump.

  • Dung lượng tải về: 484.12 KiB

  • Dataset kích thước: 292.64 KiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 1.271

wikipedia / 20201201.ki

  • Config mô tả: Wikipedia bộ dữ liệu cho ki, phân tích cú pháp từ 20201201 dump.

  • Dung lượng tải về: 390.92 KiB

  • Dataset kích thước: 309.05 KiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 1.486

wikipedia / 20201201.kj

  • Config mô tả: Wikipedia bộ dữ liệu cho kj, phân tích cú pháp từ 20201201 dump.

  • Dung lượng tải về: 17.54 KiB

  • Dataset kích thước: 4.93 KiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 5

wikipedia / 20201201.kk

  • Config mô tả: Wikipedia bộ dữ liệu cho kk, phân tích cú pháp từ 20201201 dump.

  • Dung lượng tải về: 120.88 MiB

  • Dataset kích thước: 424.64 MiB

  • Tự động lưu trữ ( tài liệu ): Không

  • tách:

Tách ra Các ví dụ
'train' 270.628

wikipedia / 20201201.kl

  • Config mô tả: Wikipedia bộ dữ liệu cho kl, phân tích cú pháp từ 20201201 dump.

  • Dung lượng tải về: 654.67 KiB

  • Dataset kích thước: 447.23 KiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 867

wikipedia / 20201201.km

  • Config mô tả: Wikipedia bộ dữ liệu cho km, phân tích cú pháp từ 20201201 dump.

  • Dung lượng tải về: 25.74 MiB

  • Dataset kích thước: 150.43 MiB

  • Tự động lưu trữ ( tài liệu ): Chỉ khi shuffle_files=False (tàu)

  • tách:

Tách ra Các ví dụ
'train' 11.995

wikipedia / 20201201.kn

  • Config mô tả: Wikipedia bộ dữ liệu cho kn, phân tích cú pháp từ 20201201 dump.

  • Dung lượng tải về: 76.13 MiB

  • Dataset kích thước: 333.31 MiB

  • Tự động lưu trữ ( tài liệu ): Không

  • tách:

Tách ra Các ví dụ
'train' 27.325

wikipedia / 20201201.ko

  • Config mô tả: Wikipedia bộ dữ liệu cho ko, phân tích cú pháp từ 20201201 dump.

  • Dung lượng tải về: 747.33 MiB

  • Kích thước tập dữ liệu: 1.09 GiB

  • Tự động lưu trữ ( tài liệu ): Không

  • tách:

Tách ra Các ví dụ
'train' 1.139.678

wikipedia / 20201201.koi

  • Config mô tả: Wikipedia bộ dữ liệu cho koi, phân tích cú pháp từ 20201201 dump.

  • Dung lượng tải về: 2.26 MiB

  • Dataset kích thước: 4.74 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 3.967

wikipedia / 20201201.krc

  • Config mô tả: Wikipedia bộ dữ liệu cho KRC, phân tích cú pháp từ 20201201 dump.

  • Dung lượng tải về: 3.25 MiB

  • Dataset kích thước: 4.27 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 2.341

wikipedia / 20201201.ks

  • Config mô tả: Wikipedia bộ dữ liệu cho ks, phân tích cú pháp từ 20201201 dump.

  • Dung lượng tải về: 363.64 KiB

  • Dataset kích thước: 199.02 KiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 509

wikipedia / 20201201.ksh

  • Config mô tả: Wikipedia bộ dữ liệu cho ksh, phân tích cú pháp từ 20201201 dump.

  • Dung lượng tải về: 3.18 MiB

  • Dataset kích thước: 2.92 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 3.409

wikipedia / 20201201.ku

  • Config mô tả: Wikipedia bộ dữ liệu cho ku, phân tích cú pháp từ 20201201 dump.

  • Dung lượng tải về: 21.18 MiB

  • Dataset kích thước: 28.62 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 43.802

wikipedia / 20201201.kv

  • Config mô tả: Wikipedia bộ dữ liệu cho kv, phân tích cú pháp từ 20201201 dump.

  • Dung lượng tải về: 3.58 MiB

  • Dataset kích thước: 8.28 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 6.790

wikipedia / 20201201.kw

  • Config mô tả: Wikipedia bộ dữ liệu cho kw, phân tích cú pháp từ 20201201 dump.

  • Dung lượng tải về: 2.42 MiB

  • Dataset kích thước: 2.15 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 4,524

wikipedia / 20201201.ky

  • Config mô tả: Wikipedia bộ dữ liệu cho ky, phân tích cú pháp từ 20201201 dump.

  • Dung lượng tải về: 34.15 MiB

  • Dataset kích thước: 147.20 MiB

  • Tự động lưu trữ ( tài liệu ): Chỉ khi shuffle_files=False (tàu)

  • tách:

Tách ra Các ví dụ
'train' 79,798

wikipedia / 20201201.la

  • Config mô tả: Wikipedia bộ dữ liệu cho la, phân tích cú pháp từ 20201201 dump.

  • Dung lượng tải về: 89.33 MiB

  • Dataset kích thước: 128.71 MiB

  • Tự động lưu trữ ( tài liệu ): Chỉ khi shuffle_files=False (tàu)

  • tách:

Tách ra Các ví dụ
'train' 134.356

wikipedia / 20201201.lad

  • Config mô tả: Wikipedia bộ dữ liệu cho thanh niên, phân tích cú pháp từ 20201201 dump.

  • Dung lượng tải về: 3.41 MiB

  • Dataset kích thước: 4.58 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 4.957

wikipedia / 20201201.lb

  • Config mô tả: Wikipedia bộ dữ liệu cho lb, phân tích cú pháp từ 20201201 dump.

  • Dung lượng tải về: 49.54 MiB

  • Dataset kích thước: 78.17 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 65.562

wikipedia / 20201201.lbe

  • Config mô tả: Wikipedia bộ dữ liệu cho LBE, phân tích cú pháp từ 20201201 dump.

  • Dung lượng tải về: 1.39 MiB

  • Dataset kích thước: 644.30 KiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 1.554

wikipedia / 20201201.lez

  • Config mô tả: Wikipedia bộ dữ liệu cho lez, phân tích cú pháp từ 20201201 dump.

  • Dung lượng tải về: 4.75 MiB

  • Dataset kích thước: 8.89 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 4,593

wikipedia / 20201201.lfn

  • Config mô tả: Wikipedia bộ dữ liệu cho lfn, phân tích cú pháp từ 20201201 dump.

  • Dung lượng tải về: 4.00 MiB

  • Dataset kích thước: 8.32 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 4.647

wikipedia / 20201201.lg

  • Config mô tả: Wikipedia bộ dữ liệu cho lg, phân tích cú pháp từ 20201201 dump.

  • Dung lượng tải về: 1.69 MiB

  • Dataset kích thước: 3.79 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 2.405

wikipedia / 20201201.li

  • Config mô tả: Wikipedia bộ dữ liệu cho li, phân tích cú pháp từ 20201201 dump.

  • Dung lượng tải về: 15.16 MiB

  • Dataset kích thước: 26.01 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 15.238

wikipedia / 20201201.lij

  • Config mô tả: Wikipedia bộ dữ liệu cho lij, phân tích cú pháp từ 20201201 dump.

  • Dung lượng tải về: 3.94 MiB

  • Dataset kích thước: 5.27 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 5.441

wikipedia / 20201201.lmo

  • Config mô tả: Wikipedia bộ dữ liệu cho LMO, phân tích cú pháp từ 20201201 dump.

  • Dung lượng tải về: 24.17 MiB

  • Dataset kích thước: 32.41 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 51.386

wikipedia / 20201201.ln

  • Config mô tả: Wikipedia bộ dữ liệu cho ln, phân tích cú pháp từ 20201201 dump.

  • Dung lượng tải về: 1.94 MiB

  • Dataset kích thước: 1.69 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 3.294

wikipedia / 20201201.lo

  • Config mô tả: Wikipedia bộ dữ liệu cho lo, phân tích cú pháp từ 20201201 dump.

  • Dung lượng tải về: 4.56 MiB

  • Dataset kích thước: 12.09 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 4,536

wikipedia / 20201201.lrc

  • Config mô tả: Wikipedia bộ dữ liệu cho lrc, phân tích cú pháp từ 20201201 dump.

  • Dung lượng tải về: 6.94 MiB

  • Dataset kích thước: 4.63 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 7.216

wikipedia / 20201201.lt

  • Config mô tả: Wikipedia bộ dữ liệu cho lt, phân tích cú pháp từ 20201201 dump.

  • Dung lượng tải về: 188.31 MiB

  • Dataset kích thước: 293.73 MiB

  • Tự động lưu trữ ( tài liệu ): Không

  • tách:

Tách ra Các ví dụ
'train' 226.648

wikipedia / 20201201.ltg

  • Config mô tả: Wikipedia bộ dữ liệu cho LTG, phân tích cú pháp từ 20201201 dump.

  • Dung lượng tải về: 900.39 KiB

  • Dataset kích thước: 860.83 KiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 1.005

wikipedia / 20201201.lv

  • Config mô tả: Wikipedia bộ dữ liệu cho lv, phân tích cú pháp từ 20201201 dump.

  • Dung lượng tải về: 145.93 MiB

  • Dataset kích thước: 179.44 MiB

  • Tự động lưu trữ ( tài liệu ): Chỉ khi shuffle_files=False (tàu)

  • tách:

Tách ra Các ví dụ
'train' 104.487

wikipedia / 20201201.mai

  • Config mô tả: Wikipedia bộ dữ liệu cho mai, phân tích cú pháp từ 20201201 dump.

  • Dung lượng tải về: 11.77 MiB

  • Dataset kích thước: 18.57 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 14.891

wikipedia / 20201201.map-bms

  • Config mô tả: Wikipedia bộ dữ liệu cho bản đồ-BMS, phân tích cú pháp từ 20201201 dump.

  • Dung lượng tải về: 4.65 MiB

  • Dataset kích thước: 4.67 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 13.882

wikipedia / 20201201.mdf

  • Config mô tả: Wikipedia bộ dữ liệu cho MDF, phân tích cú pháp từ 20201201 dump.

  • Dung lượng tải về: 1.21 MiB

  • Dataset kích thước: 1.75 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 1.363

wikipedia / 20201201.mg

  • Config mô tả: Wikipedia bộ dữ liệu cho mg, phân tích cú pháp từ 20201201 dump.

  • Dung lượng tải về: 27.85 MiB

  • Dataset kích thước: 63.42 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 129.968

wikipedia / 20201201.mh

  • Config mô tả: Wikipedia bộ dữ liệu cho mh, phân tích cú pháp từ 20201201 dump.

  • Dung lượng tải về: 28.69 KiB

  • Dataset kích thước: 11.04 KiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' số 8

wikipedia / 20201201.mhr

  • Config mô tả: Wikipedia bộ dữ liệu cho MHR, phân tích cú pháp từ 20201201 dump.

  • Dung lượng tải về: 6.15 MiB

  • Dataset kích thước: 16.94 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 12.408

wikipedia / 20201201.mi

  • Config mô tả: Wikipedia bộ dữ liệu cho mi, phân tích cú pháp từ 20201201 dump.

  • Dung lượng tải về: 2.04 MiB

  • Dataset kích thước: 3.51 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 7.203

wikipedia / 20201201.phút

  • Config mô tả: Wikipedia bộ dữ liệu cho min, phân tích cú pháp từ 20201201 dump.

  • Dung lượng tải về: 29.45 MiB

  • Dataset kích thước: 99.59 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 228,196

wikipedia / 20201201.mk

  • Config mô tả: Wikipedia bộ dữ liệu cho mk, phân tích cú pháp từ 20201201 dump.

  • Dung lượng tải về: 166.60 MiB

  • Dataset kích thước: 465.95 MiB

  • Tự động lưu trữ ( tài liệu ): Không

  • tách:

Tách ra Các ví dụ
'train' 150.831

wikipedia / 20201201.ml

  • Config description : Wikipedia dataset for ml, parsed from 20201201 dump.

  • Download size : 143.17 MiB

  • Dataset size : 369.54 MiB

  • Tự động lưu trữ ( tài liệu ): Không

  • tách:

Tách ra Các ví dụ
'train' 131,128

wikipedia/20201201.mn

  • Config description : Wikipedia dataset for mn, parsed from 20201201 dump.

  • Download size : 32.25 MiB

  • Dataset size : 73.71 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 25,077

wikipedia/20201201.mr

  • Config description : Wikipedia dataset for mr, parsed from 20201201 dump.

  • Download size : 58.88 MiB

  • Dataset size : 170.52 MiB

  • Tự động lưu trữ ( tài liệu ): Chỉ khi shuffle_files=False (tàu)

  • tách:

Tách ra Các ví dụ
'train' 112,917

wikipedia/20201201.mrj

  • Config description : Wikipedia dataset for mrj, parsed from 20201201 dump.

  • Download size : 3.20 MiB

  • Dataset size : 8.29 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 10,810

wikipedia/20201201.ms

  • Config description : Wikipedia dataset for ms, parsed from 20201201 dump.

  • Download size : 250.50 MiB

  • Dataset size : 341.93 MiB

  • Tự động lưu trữ ( tài liệu ): Không

  • tách:

Tách ra Các ví dụ
'train' 386,945

wikipedia/20201201.mt

  • Config description : Wikipedia dataset for mt, parsed from 20201201 dump.

  • Download size : 9.06 MiB

  • Dataset size : 13.35 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 4,967

wikipedia/20201201.mus

  • Config description : Wikipedia dataset for mus, parsed from 20201201 dump.

  • Download size : 15.13 KiB

  • Dataset size : 875 bytes

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 2

wikipedia/20201201.mwl

  • Config description : Wikipedia dataset for mwl, parsed from 20201201 dump.

  • Download size : 9.19 MiB

  • Dataset size : 18.37 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 4,400

wikipedia/20201201.my

  • Config description : Wikipedia dataset for my, parsed from 20201201 dump.

  • Download size : 42.95 MiB

  • Dataset size : 195.80 MiB

  • Tự động lưu trữ ( tài liệu ): Chỉ khi shuffle_files=False (tàu)

  • tách:

Tách ra Các ví dụ
'train' 54,562

wikipedia/20201201.myv

  • Config description : Wikipedia dataset for myv, parsed from 20201201 dump.

  • Download size : 9.65 MiB

  • Dataset size : 8.85 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 7,155

wikipedia/20201201.mzn

  • Config description : Wikipedia dataset for mzn, parsed from 20201201 dump.

  • Download size : 6.80 MiB

  • Dataset size : 11.24 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 18,599

wikipedia/20201201.na

  • Config description : Wikipedia dataset for na, parsed from 20201201 dump.

  • Download size : 531.75 KiB

  • Dataset size : 357.01 KiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 1,576

wikipedia/20201201.nah

  • Config description : Wikipedia dataset for nah, parsed from 20201201 dump.

  • Download size : 4.51 MiB

  • Dataset size : 7.86 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 10,714

wikipedia/20201201.nap

  • Config description : Wikipedia dataset for nap, parsed from 20201201 dump.

  • Download size : 5.31 MiB

  • Dataset size : 5.91 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 15,278

wikipedia/20201201.nds

  • Config description : Wikipedia dataset for nds, parsed from 20201201 dump.

  • Download size : 42.06 MiB

  • Dataset size : 85.20 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 87,896

wikipedia/20201201.nds-nl

  • Config description : Wikipedia dataset for nds-nl, parsed from 20201201 dump.

  • Download size : 7.29 MiB

  • Dataset size : 11.39 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 9,429

wikipedia/20201201.ne

  • Config description : Wikipedia dataset for ne, parsed from 20201201 dump.

  • Download size : 37.50 MiB

  • Dataset size : 88.48 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 32,310

wikipedia/20201201.new

  • Config description : Wikipedia dataset for new, parsed from 20201201 dump.

  • Download size : 17.27 MiB

  • Dataset size : 140.32 MiB

  • Tự động lưu trữ ( tài liệu ): Chỉ khi shuffle_files=False (tàu)

  • tách:

Tách ra Các ví dụ
'train' 72,998

wikipedia/20201201.ng

  • Config description : Wikipedia dataset for ng, parsed from 20201201 dump.

  • Download size : 92.26 KiB

  • Dataset size : 66.12 KiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 21

wikipedia/20201201.nl

  • Config description : Wikipedia dataset for nl, parsed from 20201201 dump.

  • Download size : 1.53 GiB

  • Dataset size : 2.21 GiB

  • Tự động lưu trữ ( tài liệu ): Không

  • tách:

Tách ra Các ví dụ
'train' 2,523,440

wikipedia/20201201.nn

  • Config description : Wikipedia dataset for nn, parsed from 20201201 dump.

  • Download size : 139.43 MiB

  • Dataset size : 208.84 MiB

  • Tự động lưu trữ ( tài liệu ): Chỉ khi shuffle_files=False (tàu)

  • tách:

Tách ra Các ví dụ
'train' 231,090

wikipedia/20201201.no

  • Config description : Wikipedia dataset for no, parsed from 20201201 dump.

  • Download size : 649.54 MiB

  • Dataset size : 890.97 MiB

  • Tự động lưu trữ ( tài liệu ): Không

  • tách:

Tách ra Các ví dụ
'train' 847,202

wikipedia/20201201.nov

  • Config description : Wikipedia dataset for nov, parsed from 20201201 dump.

  • Download size : 1.16 MiB

  • Dataset size : 810.66 KiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 1,792

wikipedia/20201201.nrm

  • Config description : Wikipedia dataset for nrm, parsed from 20201201 dump.

  • Download size : 1.86 MiB

  • Dataset size : 2.79 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 4,541

wikipedia/20201201.nso

  • Config description : Wikipedia dataset for nso, parsed from 20201201 dump.

  • Download size : 2.29 MiB

  • Dataset size : 2.12 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 8,282

wikipedia/20201201.nv

  • Config description : Wikipedia dataset for nv, parsed from 20201201 dump.

  • Download size : 4.32 MiB

  • Dataset size : 10.20 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 15,855

wikipedia/20201201.ny

  • Config description : Wikipedia dataset for ny, parsed from 20201201 dump.

  • Download size : 1.45 MiB

  • Dataset size : 963.44 KiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 850

wikipedia/20201201.oc

  • Config description : Wikipedia dataset for oc, parsed from 20201201 dump.

  • Download size : 75.53 MiB

  • Dataset size : 111.16 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 94,068

wikipedia/20201201.olo

  • Config description : Wikipedia dataset for olo, parsed from 20201201 dump.

  • Download size : 1.95 MiB

  • Dataset size : 2.61 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 4,508

wikipedia/20201201.om

  • Config description : Wikipedia dataset for om, parsed from 20201201 dump.

  • Download size : 1.26 MiB

  • Dataset size : 1.70 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 1,163

wikipedia/20201201.or

  • Config description : Wikipedia dataset for or, parsed from 20201201 dump.

  • Download size : 28.60 MiB

  • Dataset size : 59.16 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 31,029

wikipedia/20201201.os

  • Config description : Wikipedia dataset for os, parsed from 20201201 dump.

  • Download size : 9.08 MiB

  • Dataset size : 9.88 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 14,964

wikipedia/20201201.pa

  • Config description : Wikipedia dataset for pa, parsed from 20201201 dump.

  • Download size : 49.00 MiB

  • Dataset size : 129.86 MiB

  • Tự động lưu trữ ( tài liệu ): Chỉ khi shuffle_files=False (tàu)

  • tách:

Tách ra Các ví dụ
'train' 44,984

wikipedia/20201201.pag

  • Config description : Wikipedia dataset for pag, parsed from 20201201 dump.

  • Download size : 1.66 MiB

  • Dataset size : 1.72 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 4,942

wikipedia/20201201.pam

  • Config description : Wikipedia dataset for pam, parsed from 20201201 dump.

  • Download size : 9.11 MiB

  • Dataset size : 7.38 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 8,794

wikipedia/20201201.pap

  • Config description : Wikipedia dataset for pap, parsed from 20201201 dump.

  • Download size : 1.50 MiB

  • Dataset size : 2.03 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 2,179

wikipedia/20201201.pcd

  • Config description : Wikipedia dataset for pcd, parsed from 20201201 dump.

  • Download size : 4.89 MiB

  • Dataset size : 4.96 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 5,113

wikipedia/20201201.pdc

  • Config description : Wikipedia dataset for pdc, parsed from 20201201 dump.

  • Download size : 1.16 MiB

  • Dataset size : 1.09 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 2,424

wikipedia/20201201.pfl

  • Config description : Wikipedia dataset for pfl, parsed from 20201201 dump.

  • Download size : 3.51 MiB

  • Dataset size : 3.43 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 3,933

wikipedia/20201201.pi

  • Config description : Wikipedia dataset for pi, parsed from 20201201 dump.

  • Download size : 631.83 KiB

  • Dataset size : 2.05 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 3,074

wikipedia/20201201.pih

  • Config description : Wikipedia dataset for pih, parsed from 20201201 dump.

  • Download size : 750.70 KiB

  • Dataset size : 230.96 KiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 844

wikipedia/20201201.pl

  • Config description : Wikipedia dataset for pl, parsed from 20201201 dump.

  • Download size : 1.98 GiB

  • Dataset size : 2.46 GiB

  • Tự động lưu trữ ( tài liệu ): Không

  • tách:

Tách ra Các ví dụ
'train' 1,765,088

wikipedia/20201201.pms

  • Config description : Wikipedia dataset for pms, parsed from 20201201 dump.

  • Download size : 13.90 MiB

  • Dataset size : 30.80 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 66,115

wikipedia/20201201.pnb

  • Config description : Wikipedia dataset for pnb, parsed from 20201201 dump.

  • Download size : 72.45 MiB

  • Dataset size : 209.71 MiB

  • Tự động lưu trữ ( tài liệu ): Chỉ khi shuffle_files=False (tàu)

  • tách:

Tách ra Các ví dụ
'train' 64,698

wikipedia/20201201.pnt

  • Config description : Wikipedia dataset for pnt, parsed from 20201201 dump.

  • Download size : 549.36 KiB

  • Dataset size : 590.82 KiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 532

wikipedia/20201201.ps

  • Config description : Wikipedia dataset for ps, parsed from 20201201 dump.

  • Download size : 21.45 MiB

  • Dataset size : 46.15 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 13,138

wikipedia/20201201.pt

  • Config description : Wikipedia dataset for pt, parsed from 20201201 dump.

  • Download size : 1.79 GiB

  • Dataset size : 2.24 GiB

  • Tự động lưu trữ ( tài liệu ): Không

  • tách:

Tách ra Các ví dụ
'train' 1,491,646

wikipedia/20201201.qu

  • Config description : Wikipedia dataset for qu, parsed from 20201201 dump.

  • Download size : 12.49 MiB

  • Dataset size : 15.85 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 31,387

wikipedia/20201201.rm

  • Config description : Wikipedia dataset for rm, parsed from 20201201 dump.

  • Download size : 6.92 MiB

  • Dataset size : 16.52 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 3,863

wikipedia/20201201.rmy

  • Config description : Wikipedia dataset for rmy, parsed from 20201201 dump.

  • Download size : 553.83 KiB

  • Dataset size : 396.09 KiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 733

wikipedia/20201201.rn

  • Config description : Wikipedia dataset for rn, parsed from 20201201 dump.

  • Download size : 815.81 KiB

  • Dataset size : 361.36 KiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 713

wikipedia/20201201.ro

  • Config description : Wikipedia dataset for ro, parsed from 20201201 dump.

  • Download size : 502.59 MiB

  • Dataset size : 693.68 MiB

  • Tự động lưu trữ ( tài liệu ): Không

  • tách:

Tách ra Các ví dụ
'train' 414,477

wikipedia/20201201.roa-rup

  • Config description : Wikipedia dataset for roa-rup, parsed from 20201201 dump.

  • Download size : 1002.33 KiB

  • Dataset size : 1.11 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 1,260

wikipedia/20201201.roa-tara

  • Config description : Wikipedia dataset for roa-tara, parsed from 20201201 dump.

  • Download size : 6.20 MiB

  • Dataset size : 6.37 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 9,375

wikipedia/20201201.ru

  • Config description : Wikipedia dataset for ru, parsed from 20201201 dump.

  • Download size : 4.02 GiB

  • Dataset size : 8.08 GiB

  • Tự động lưu trữ ( tài liệu ): Không

  • tách:

Tách ra Các ví dụ
'train' 2,732,016

wikipedia/20201201.rue

  • Config description : Wikipedia dataset for rue, parsed from 20201201 dump.

  • Download size : 5.41 MiB

  • Dataset size : 9.82 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 8,503

wikipedia/20201201.rw

  • Config description : Wikipedia dataset for rw, parsed from 20201201 dump.

  • Download size : 1.21 MiB

  • Dataset size : 1.60 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 2,142

wikipedia/20201201.sa

  • Config description : Wikipedia dataset for sa, parsed from 20201201 dump.

  • Download size : 15.19 MiB

  • Dataset size : 58.08 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 22,040

wikipedia/20201201.sah

  • Config description : Wikipedia dataset for sah, parsed from 20201201 dump.

  • Download size : 13.61 MiB

  • Dataset size : 35.90 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 16,796

wikipedia/20201201.sat

  • Config description : Wikipedia dataset for sat, parsed from 20201201 dump.

  • Download size : 10.00 MiB

  • Dataset size : 23.52 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 5,480

wikipedia/20201201.sc

  • Config description : Wikipedia dataset for sc, parsed from 20201201 dump.

  • Download size : 6.11 MiB

  • Dataset size : 9.70 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 6,970

wikipedia/20201201.scn

  • Config description : Wikipedia dataset for scn, parsed from 20201201 dump.

  • Download size : 12.05 MiB

  • Dataset size : 16.53 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 31,416

wikipedia/20201201.sco

  • Config description : Wikipedia dataset for sco, parsed from 20201201 dump.

  • Download size : 57.27 MiB

  • Dataset size : 47.09 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 42,615

wikipedia/20201201.sd

  • Config description : Wikipedia dataset for sd, parsed from 20201201 dump.

  • Download size : 17.62 MiB

  • Dataset size : 31.18 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 20,282

wikipedia/20201201.se

  • Config description : Wikipedia dataset for se, parsed from 20201201 dump.

  • Download size : 3.88 MiB

  • Dataset size : 3.36 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 8,561

wikipedia/20201201.sg

  • Config description : Wikipedia dataset for sg, parsed from 20201201 dump.

  • Download size : 313.06 KiB

  • Dataset size : 93.31 KiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 295

wikipedia/20201201.sh

  • Config description : Wikipedia dataset for sh, parsed from 20201201 dump.

  • Download size : 423.87 MiB

  • Dataset size : 822.87 MiB

  • Tự động lưu trữ ( tài liệu ): Không

  • tách:

Tách ra Các ví dụ
'train' 3,935,417

wikipedia/20201201.si

  • Config description : Wikipedia dataset for si, parsed from 20201201 dump.

  • Download size : 41.32 MiB

  • Dataset size : 112.97 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 27,846

wikipedia/20201201.simple

  • Config description : Wikipedia dataset for simple, parsed from 20201201 dump.

  • Download size : 193.55 MiB

  • Dataset size : 197.50 MiB

  • Tự động lưu trữ ( tài liệu ): Chỉ khi shuffle_files=False (tàu)

  • tách:

Tách ra Các ví dụ
'train' 177,615

wikipedia/20201201.sk

  • Config description : Wikipedia dataset for sk, parsed from 20201201 dump.

  • Download size : 275.53 MiB

  • Dataset size : 356.27 MiB

  • Tự động lưu trữ ( tài liệu ): Không

  • tách:

Tách ra Các ví dụ
'train' 253,372

wikipedia/20201201.sl

  • Config description : Wikipedia dataset for sl, parsed from 20201201 dump.

  • Download size : 228.16 MiB

  • Dataset size : 360.64 MiB

  • Tự động lưu trữ ( tài liệu ): Không

  • tách:

Tách ra Các ví dụ
'train' 202,357

wikipedia/20201201.sm

  • Config description : Wikipedia dataset for sm, parsed from 20201201 dump.

  • Download size : 839.52 KiB

  • Dataset size : 750.10 KiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 1,023

wikipedia/20201201.sn

  • Config description : Wikipedia dataset for sn, parsed from 20201201 dump.

  • Download size : 2.97 MiB

  • Dataset size : 4.90 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 6,779

wikipedia/20201201.so

  • Config description : Wikipedia dataset for so, parsed from 20201201 dump.

  • Download size : 9.13 MiB

  • Dataset size : 9.83 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 6,979

wikipedia/20201201.sq

  • Config description : Wikipedia dataset for sq, parsed from 20201201 dump.

  • Download size : 92.58 MiB

  • Dataset size : 153.56 MiB

  • Tự động lưu trữ ( tài liệu ): Chỉ khi shuffle_files=False (tàu)

  • tách:

Tách ra Các ví dụ
'train' 111,846

wikipedia/20201201.sr

  • Config description : Wikipedia dataset for sr, parsed from 20201201 dump.

  • Download size : 825.89 MiB

  • Dataset size : 1.58 GiB

  • Tự động lưu trữ ( tài liệu ): Không

  • tách:

Tách ra Các ví dụ
'train' 3,116,253

wikipedia/20201201.srn

  • Config description : Wikipedia dataset for srn, parsed from 20201201 dump.

  • Download size : 655.77 KiB

  • Dataset size : 614.35 KiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 1,253

wikipedia/20201201.ss

  • Config description : Wikipedia dataset for ss, parsed from 20201201 dump.

  • Download size : 827.67 KiB

  • Dataset size : 490.69 KiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 554

wikipedia/20201201.st

  • Config description : Wikipedia dataset for st, parsed from 20201201 dump.

  • Download size : 673.61 KiB

  • Dataset size : 580.35 KiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 1,136

wikipedia/20201201.stq

  • Config description : Wikipedia dataset for stq, parsed from 20201201 dump.

  • Download size : 3.44 MiB

  • Dataset size : 4.62 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 4,510

wikipedia/20201201.su

  • Config description : Wikipedia dataset for su, parsed from 20201201 dump.

  • Download size : 25.46 MiB

  • Dataset size : 40.87 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 66,493

wikipedia/20201201.sv

  • Config description : Wikipedia dataset for sv, parsed from 20201201 dump.

  • Download size : 1.67 GiB

  • Dataset size : 2.79 GiB

  • Tự động lưu trữ ( tài liệu ): Không

  • tách:

Tách ra Các ví dụ
'train' 5,750,968

wikipedia/20201201.sw

  • Config description : Wikipedia dataset for sw, parsed from 20201201 dump.

  • Download size : 33.18 MiB

  • Dataset size : 52.26 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 60,185

wikipedia/20201201.szl

  • Config description : Wikipedia dataset for szl, parsed from 20201201 dump.

  • Download size : 11.88 MiB

  • Dataset size : 17.27 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 53,270

wikipedia/20201201.ta

  • Config description : Wikipedia dataset for ta, parsed from 20201201 dump.

  • Download size : 165.13 MiB

  • Dataset size : 632.77 MiB

  • Tự động lưu trữ ( tài liệu ): Không

  • tách:

Tách ra Các ví dụ
'train' 167,112

wikipedia/20201201.tcy

  • Config description : Wikipedia dataset for tcy, parsed from 20201201 dump.

  • Download size : 3.64 MiB

  • Dataset size : 7.79 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 1,684

wikipedia/20201201.te

  • Config description : Wikipedia dataset for te, parsed from 20201201 dump.

  • Download size : 110.19 MiB

  • Dataset size : 591.09 MiB

  • Tự động lưu trữ ( tài liệu ): Không

  • tách:

Tách ra Các ví dụ
'train' 94,652

wikipedia/20201201.tet

  • Config description : Wikipedia dataset for tet, parsed from 20201201 dump.

  • Download size : 1.25 MiB

  • Dataset size : 1.32 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 1,602

wikipedia/20201201.tg

  • Config description : Wikipedia dataset for tg, parsed from 20201201 dump.

  • Download size : 42.76 MiB

  • Dataset size : 110.97 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 105,298

wikipedia/20201201.th

  • Config description : Wikipedia dataset for th, parsed from 20201201 dump.

  • Download size : 290.74 MiB

  • Dataset size : 823.58 MiB

  • Tự động lưu trữ ( tài liệu ): Không

  • tách:

Tách ra Các ví dụ
'train' 245,869

wikipedia/20201201.ti

  • Config description : Wikipedia dataset for ti, parsed from 20201201 dump.

  • Download size : 533.37 KiB

  • Dataset size : 376.02 KiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 369

wikipedia/20201201.tk

  • Config description : Wikipedia dataset for tk, parsed from 20201201 dump.

  • Download size : 5.03 MiB

  • Dataset size : 10.63 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 7,122

wikipedia/20201201.tl

  • Config description : Wikipedia dataset for tl, parsed from 20201201 dump.

  • Download size : 61.86 MiB

  • Dataset size : 66.60 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 64,930

wikipedia/20201201.tn

  • Config description : Wikipedia dataset for tn, parsed from 20201201 dump.

  • Download size : 1.42 MiB

  • Dataset size : 1.48 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 834

wikipedia/20201201.to

  • Config description : Wikipedia dataset for to, parsed from 20201201 dump.

  • Download size : 818.38 KiB

  • Dataset size : 921.00 KiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 1,628

wikipedia/20201201.tpi

  • Config description : Wikipedia dataset for tpi, parsed from 20201201 dump.

  • Download size : 1.45 MiB

  • Dataset size : 408.34 KiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 1,656

wikipedia/20201201.tr

  • Config description : Wikipedia dataset for tr, parsed from 20201201 dump.

  • Download size : 613.30 MiB

  • Dataset size : 724.38 MiB

  • Tự động lưu trữ ( tài liệu ): Không

  • tách:

Tách ra Các ví dụ
'train' 624,333

wikipedia/20201201.ts

  • Config description : Wikipedia dataset for ts, parsed from 20201201 dump.

  • Dung lượng tải về: 1.59 MiB

  • Dataset size : 713.63 KiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 713

wikipedia/20201201.tt

  • Config description : Wikipedia dataset for tt, parsed from 20201201 dump.

  • Download size : 75.07 MiB

  • Dataset size : 248.79 MiB

  • Tự động lưu trữ ( tài liệu ): Chỉ khi shuffle_files=False (tàu)

  • tách:

Tách ra Các ví dụ
'train' 278,882

wikipedia/20201201.tum

  • Config description : Wikipedia dataset for tum, parsed from 20201201 dump.

  • Download size : 352.25 KiB

  • Dataset size : 231.66 KiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 718

wikipedia/20201201.tw

  • Config description : Wikipedia dataset for tw, parsed from 20201201 dump.

  • Download size : 449.69 KiB

  • Dataset size : 339.91 KiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 782

wikipedia/20201201.ty

  • Config description : Wikipedia dataset for ty, parsed from 20201201 dump.

  • Download size : 517.96 KiB

  • Dataset size : 260.86 KiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 1,291

wikipedia/20201201.tyv

  • Config description : Wikipedia dataset for tyv, parsed from 20201201 dump.

  • Download size : 4.59 MiB

  • Dataset size : 11.86 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 3,779

wikipedia/20201201.udm

  • Config description : Wikipedia dataset for udm, parsed from 20201201 dump.

  • Download size : 3.39 MiB

  • Dataset size : 6.07 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 6,191

wikipedia/20201201.ug

  • Config description : Wikipedia dataset for ug, parsed from 20201201 dump.

  • Download size : 7.70 MiB

  • Dataset size : 36.13 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 7,258

wikipedia/20201201.uk

  • Config description : Wikipedia dataset for uk, parsed from 20201201 dump.

  • Download size : 1.60 GiB

  • Dataset size : 3.66 GiB

  • Tự động lưu trữ ( tài liệu ): Không

  • tách:

Tách ra Các ví dụ
'train' 1,611,728

wikipedia/20201201.ur

  • Config description : Wikipedia dataset for ur, parsed from 20201201 dump.

  • Download size : 162.89 MiB

  • Dataset size : 264.08 MiB

  • Tự động lưu trữ ( tài liệu ): Không

  • tách:

Tách ra Các ví dụ
'train' 350,090

wikipedia/20201201.uz

  • Config description : Wikipedia dataset for uz, parsed from 20201201 dump.

  • Download size : 67.47 MiB

  • Dataset size : 99.16 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 158,823

wikipedia/20201201.ve

  • Config description : Wikipedia dataset for ve, parsed from 20201201 dump.

  • Download size : 283.99 KiB

  • Dataset size : 219.86 KiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 446

wikipedia/20201201.vec

  • Config description : Wikipedia dataset for vec, parsed from 20201201 dump.

  • Download size : 21.88 MiB

  • Dataset size : 28.21 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 71,790

wikipedia/20201201.vep

  • Config description : Wikipedia dataset for vep, parsed from 20201201 dump.

  • Download size : 6.30 MiB

  • Dataset size : 9.16 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 8,027

wikipedia/20201201.vi

  • Config description : Wikipedia dataset for vi, parsed from 20201201 dump.

  • Download size : 793.00 MiB

  • Dataset size : 1.32 GiB

  • Tự động lưu trữ ( tài liệu ): Không

  • tách:

Tách ra Các ví dụ
'train' 1,465,721

wikipedia/20201201.vls

  • Config description : Wikipedia dataset for vls, parsed from 20201201 dump.

  • Download size : 7.03 MiB

  • Dataset size : 10.33 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 7,778

wikipedia/20201201.vo

  • Config description : Wikipedia dataset for vo, parsed from 20201201 dump.

  • Download size : 24.97 MiB

  • Dataset size : 80.77 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 125,494

wikipedia/20201201.wa

  • Config description : Wikipedia dataset for wa, parsed from 20201201 dump.

  • Download size : 8.29 MiB

  • Dataset size : 12.44 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 14,373

wikipedia/20201201.war

  • Config description : Wikipedia dataset for war, parsed from 20201201 dump.

  • Download size : 263.43 MiB

  • Dataset size : 412.79 MiB

  • Tự động lưu trữ ( tài liệu ): Không

  • tách:

Tách ra Các ví dụ
'train' 1,264,845

wikipedia/20201201.wo

  • Config description : Wikipedia dataset for wo, parsed from 20201201 dump.

  • Download size : 1.97 MiB

  • Dataset size : 3.25 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 1,664

wikipedia/20201201.wuu

  • Config description : Wikipedia dataset for wuu, parsed from 20201201 dump.

  • Download size : 15.28 MiB

  • Dataset size : 20.74 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 42,762

wikipedia/20201201.xal

  • Config description : Wikipedia dataset for xal, parsed from 20201201 dump.

  • Download size : 1.71 MiB

  • Dataset size : 1.17 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 2,801

wikipedia/20201201.xh

  • Config description : Wikipedia dataset for xh, parsed from 20201201 dump.

  • Download size : 1.52 MiB

  • Dataset size : 1.77 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 1,373

wikipedia/20201201.xmf

  • Config description : Wikipedia dataset for xmf, parsed from 20201201 dump.

  • Download size : 11.13 MiB

  • Dataset size : 26.69 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 16,061

wikipedia/20201201.yi

  • Config description : Wikipedia dataset for yi, parsed from 20201201 dump.

  • Download size : 12.62 MiB

  • Dataset size : 33.30 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 25,227

wikipedia/20201201.yo

  • Config description : Wikipedia dataset for yo, parsed from 20201201 dump.

  • Download size : 14.22 MiB

  • Dataset size : 12.09 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 33,548

wikipedia/20201201.za

  • Config description : Wikipedia dataset for za, parsed from 20201201 dump.

  • Download size : 791.45 KiB

  • Dataset size : 721.42 KiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 2,496

wikipedia/20201201.zea

  • Config description : Wikipedia dataset for zea, parsed from 20201201 dump.

  • Download size : 2.56 MiB

  • Dataset size : 4.46 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 5,599

wikipedia/20201201.zh

  • Config description : Wikipedia dataset for zh, parsed from 20201201 dump.

  • Download size : 2.05 GiB

  • Dataset size : 2.08 GiB

  • Tự động lưu trữ ( tài liệu ): Không

  • tách:

Tách ra Các ví dụ
'train' 1,670,356

wikipedia/20201201.zh-classical

  • Config description : Wikipedia dataset for zh-classical, parsed from 20201201 dump.

  • Download size : 14.89 MiB

  • Dataset size : 10.27 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 12,237

wikipedia/20201201.zh-min-nan

  • Config description : Wikipedia dataset for zh-min-nan, parsed from 20201201 dump.

  • Download size : 73.64 MiB

  • Dataset size : 130.73 MiB

  • Tự động lưu trữ ( tài liệu ): Chỉ khi shuffle_files=False (tàu)

  • tách:

Tách ra Các ví dụ
'train' 448,229

wikipedia/20201201.zh-yue

  • Config description : Wikipedia dataset for zh-yue, parsed from 20201201 dump.

  • Download size : 67.14 MiB

  • Dataset size : 71.77 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 103,834

wikipedia/20201201.zu

  • Config description : Wikipedia dataset for zu, parsed from 20201201 dump.

  • Download size : 2.43 MiB

  • Dataset size : 2.08 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 5,359

wikipedia/20200301.aa

  • Config description : Wikipedia dataset for aa, parsed from 20200301 dump.

  • Download size : 44.96 KiB

  • Dataset size : 3.46 KiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 1

wikipedia/20200301.ab

  • Config description : Wikipedia dataset for ab, parsed from 20200301 dump.

  • Download size : 1.74 MiB

  • Dataset size : 2.79 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 7,108

wikipedia/20200301.ace

  • Config description : Wikipedia dataset for ace, parsed from 20200301 dump.

  • Download size : 2.93 MiB

  • Dataset size : 3.69 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 11,501

wikipedia/20200301.ady

  • Config description : Wikipedia dataset for ady, parsed from 20200301 dump.

  • Download size : 394.09 KiB

  • Dataset size : 505.97 KiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 553

wikipedia/20200301.af

  • Config description : Wikipedia dataset for af, parsed from 20200301 dump.

  • Download size : 99.17 MiB

  • Dataset size : 179.95 MiB

  • Tự động lưu trữ ( tài liệu ): Chỉ khi shuffle_files=False (tàu)

  • tách:

Tách ra Các ví dụ
'train' 110,483

wikipedia/20200301.ak

  • Config description : Wikipedia dataset for ak, parsed from 20200301 dump.

  • Download size : 462.66 KiB

  • Dataset size : 247.24 KiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 993

wikipedia/20200301.als

  • Config description : Wikipedia dataset for als, parsed from 20200301 dump.

  • Download size : 51.03 MiB

  • Dataset size : 68.56 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 29,318

wikipedia/20200301.am

  • Config description : Wikipedia dataset for am, parsed from 20200301 dump.

  • Download size : 6.82 MiB

  • Dataset size : 16.64 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 13,400

wikipedia/20200301.an

  • Config description : Wikipedia dataset for an, parsed from 20200301 dump.

  • Download size : 32.94 MiB

  • Dataset size : 46.63 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 50,774

wikipedia/20200301.ang

  • Config description : Wikipedia dataset for ang, parsed from 20200301 dump.

  • Download size : 4.13 MiB

  • Dataset size : 2.43 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 3,249

wikipedia/20200301.ar

  • Config description : Wikipedia dataset for ar, parsed from 20200301 dump.

  • Download size : 1.08 GiB

  • Dataset size : 2.09 GiB

  • Tự động lưu trữ ( tài liệu ): Không

  • tách:

Tách ra Các ví dụ
'train' 1,972,799

wikipedia/20200301.arc

  • Config description : Wikipedia dataset for arc, parsed from 20200301 dump.

  • Download size : 1.03 MiB

  • Dataset size : 778.26 KiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 3,305

wikipedia/20200301.arz

  • Config description : Wikipedia dataset for arz, parsed from 20200301 dump.

  • Download size : 36.61 MiB

  • Dataset size : 115.13 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 157,001

wikipedia/20200301.as

  • Config description : Wikipedia dataset for as, parsed from 20200301 dump.

  • Download size : 21.48 MiB

  • Dataset size : 40.49 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 6,509

wikipedia/20200301.ast

  • Config description : Wikipedia dataset for ast, parsed from 20200301 dump.

  • Download size : 217.68 MiB

  • Dataset size : 445.91 MiB

  • Tự động lưu trữ ( tài liệu ): Không

  • tách:

Tách ra Các ví dụ
'train' 108,220

wikipedia/20200301.atj

  • Config description : Wikipedia dataset for atj, parsed from 20200301 dump.

  • Download size : 546.89 KiB

  • Dataset size : 664.04 KiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 1,175

wikipedia/20200301.av

  • Config description : Wikipedia dataset for av, parsed from 20200301 dump.

  • Dung lượng tải về: 4.47 MiB

  • Dataset size : 3.23 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 3,075

wikipedia/20200301.ay

  • Config description : Wikipedia dataset for ay, parsed from 20200301 dump.

  • Download size : 2.19 MiB

  • Dataset size : 4.04 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 5,039

wikipedia/20200301.az

  • Config description : Wikipedia dataset for az, parsed from 20200301 dump.

  • Download size : 181.30 MiB

  • Dataset size : 317.17 MiB

  • Tự động lưu trữ ( tài liệu ): Không

  • tách:

Tách ra Các ví dụ
'train' 175,038

wikipedia/20200301.azb

  • Config description : Wikipedia dataset for azb, parsed from 20200301 dump.

  • Download size : 76.38 MiB

  • Dataset size : 131.83 MiB

  • Tự động lưu trữ ( tài liệu ): Chỉ khi shuffle_files=False (tàu)

  • tách:

Tách ra Các ví dụ
'train' 208,456

wikipedia/20200301.ba

  • Config description : Wikipedia dataset for ba, parsed from 20200301 dump.

  • Download size : 64.46 MiB

  • Dataset size : 181.18 MiB

  • Tự động lưu trữ ( tài liệu ): Chỉ khi shuffle_files=False (tàu)

  • tách:

Tách ra Các ví dụ
'train' 56,822

wikipedia/20200301.bar

  • Config description : Wikipedia dataset for bar, parsed from 20200301 dump.

  • Download size : 32.17 MiB

  • Dataset size : 40.40 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 46,363

wikipedia/20200301.bat-smg

  • Config description : Wikipedia dataset for bat-smg, parsed from 20200301 dump.

  • Download size : 4.82 MiB

  • Dataset size : 6.63 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 19,665

wikipedia/20200301.bcl

  • Config description : Wikipedia dataset for bcl, parsed from 20200301 dump.

  • Download size : 7.59 MiB

  • Dataset kích thước: 8.70 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 9,581

wikipedia/20200301.be

  • Config description : Wikipedia dataset for be, parsed from 20200301 dump.

  • Download size : 208.69 MiB

  • Dataset size : 433.16 MiB

  • Tự động lưu trữ ( tài liệu ): Không

  • tách:

Tách ra Các ví dụ
'train' 185,758

wikipedia/20200301.be-x-old

  • Config description : Wikipedia dataset for be-x-old, parsed from 20200301 dump.

  • Download size : 79.73 MiB

  • Dataset size : 178.12 MiB

  • Tự động lưu trữ ( tài liệu ): Chỉ khi shuffle_files=False (tàu)

  • tách:

Tách ra Các ví dụ
'train' 99,513

wikipedia/20200301.bg

  • Config description : Wikipedia dataset for bg, parsed from 20200301 dump.

  • Download size : 344.69 MiB

  • Dataset size : 866.33 MiB

  • Tự động lưu trữ ( tài liệu ): Không

  • tách:

Tách ra Các ví dụ
'train' 377,391

wikipedia/20200301.bh

  • Config description : Wikipedia dataset for bh, parsed from 20200301 dump.

  • Download size : 13.79 MiB

  • Dataset size : 10.36 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 7,035

wikipedia/20200301.bi

  • Config description : Wikipedia dataset for bi, parsed from 20200301 dump.

  • Download size : 444.50 KiB

  • Dataset size : 298.56 KiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 1,392

wikipedia/20200301.bjn

  • Config description : Wikipedia dataset for bjn, parsed from 20200301 dump.

  • Download size : 2.68 MiB

  • Dataset size : 2.57 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 3,431

wikipedia/20200301.bm

  • Config description : Wikipedia dataset for bm, parsed from 20200301 dump.

  • Download size : 464.48 KiB

  • Dataset size : 351.32 KiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 745

wikipedia/20200301.bn

  • Config description : Wikipedia dataset for bn, parsed from 20200301 dump.

  • Download size : 183.92 MiB

  • Dataset size : 482.94 MiB

  • Tự động lưu trữ ( tài liệu ): Không

  • tách:

Tách ra Các ví dụ
'train' 119,216

wikipedia/20200301.bo

  • Config description : Wikipedia dataset for bo, parsed from 20200301 dump.

  • Download size : 13.17 MiB

  • Dataset size : 116.42 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 11,575

wikipedia/20200301.bpy

  • Config description : Wikipedia dataset for bpy, parsed from 20200301 dump.

  • Download size : 5.11 MiB

  • Dataset size : 39.43 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 25,416

wikipedia/20200301.br

  • Config description : Wikipedia dataset for br, parsed from 20200301 dump.

  • Download size : 50.39 MiB

  • Dataset size : 72.08 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 77,940

wikipedia/20200301.bs

  • Config description : Wikipedia dataset for bs, parsed from 20200301 dump.

  • Download size : 110.31 MiB

  • Dataset size : 150.33 MiB

  • Tự động lưu trữ ( tài liệu ): Chỉ khi shuffle_files=False (tàu)

  • tách:

Tách ra Các ví dụ
'train' 185,885

wikipedia/20200301.bug

  • Config description : Wikipedia dataset for bug, parsed from 20200301 dump.

  • Download size : 1.82 MiB

  • Dataset size : 2.74 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 14,411

wikipedia/20200301.bxr

  • Config description : Wikipedia dataset for bxr, parsed from 20200301 dump.

  • Download size : 3.26 MiB

  • Dataset size : 5.67 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 2,653

wikipedia/20200301.ca

  • Config description : Wikipedia dataset for ca, parsed from 20200301 dump.

  • Download size : 899.00 MiB

  • Dataset size : 1.50 GiB

  • Tự động lưu trữ ( tài liệu ): Không

  • tách:

Tách ra Các ví dụ
'train' 698,894

wikipedia/20200301.cbk-zam

  • Config description : Wikipedia dataset for cbk-zam, parsed from 20200301 dump.

  • Download size : 1.86 MiB

  • Dataset size : 2.94 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 3,366

wikipedia/20200301.cdo

  • Config description : Wikipedia dataset for cdo, parsed from 20200301 dump.

  • Download size : 4.37 MiB

  • Dataset size : 3.99 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 16,785

wikipedia/20200301.ce

  • Config description : Wikipedia dataset for ce, parsed from 20200301 dump.

  • Download size : 49.70 MiB

  • Dataset size : 254.09 MiB

  • Tự động lưu trữ ( tài liệu ): Không

  • tách:

Tách ra Các ví dụ
'train' 259,152

wikipedia/20200301.ceb

  • Config description : Wikipedia dataset for ceb, parsed from 20200301 dump.

  • Download size : 1.84 GiB

  • Dataset size : 3.68 GiB

  • Tự động lưu trữ ( tài liệu ): Không

  • tách:

Tách ra Các ví dụ
'train' 5,378,741

wikipedia/20200301.ch

  • Config description : Wikipedia dataset for ch, parsed from 20200301 dump.

  • Download size : 707.12 KiB

  • Dataset size : 167.80 KiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 541

wikipedia/20200301.cho

  • Config description : Wikipedia dataset for cho, parsed from 20200301 dump.

  • Download size : 26.88 KiB

  • Dataset size : 7.44 KiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 14

wikipedia/20200301.chr

  • Config description : Wikipedia dataset for chr, parsed from 20200301 dump.

  • Download size : 644.28 KiB

  • Dataset size : 629.37 KiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 962

wikipedia/20200301.chy

  • Config description : Wikipedia dataset for chy, parsed from 20200301 dump.

  • Download size : 340.35 KiB

  • Dataset size : 116.39 KiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 780

wikipedia/20200301.ckb

  • Config description : Wikipedia dataset for ckb, parsed from 20200301 dump.

  • Download size : 26.96 MiB

  • Dataset size : 46.82 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 25,695

wikipedia/20200301.co

  • Config description : Wikipedia dataset for co, parsed from 20200301 dump.

  • Download size : 3.54 MiB

  • Dataset size : 5.85 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 6,465

wikipedia/20200301.cr

  • Config description : Wikipedia dataset for cr, parsed from 20200301 dump.

  • Download size : 271.60 KiB

  • Dataset size : 31.60 KiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 120

wikipedia/20200301.crh

  • Config description : Wikipedia dataset for crh, parsed from 20200301 dump.

  • Download size : 4.38 MiB

  • Dataset size : 2.74 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 7,093

wikipedia/20200301.cs

  • Config description : Wikipedia dataset for cs, parsed from 20200301 dump.

  • Download size : 825.14 MiB

  • Dataset size : 1.15 GiB

  • Tự động lưu trữ ( tài liệu ): Không

  • tách:

Tách ra Các ví dụ
'train' 574,136

wikipedia/20200301.csb

  • Config description : Wikipedia dataset for csb, parsed from 20200301 dump.

  • Download size : 2.13 MiB

  • Dataset size : 3.36 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 5,696

wikipedia/20200301.cu

  • Config description : Wikipedia dataset for cu, parsed from 20200301 dump.

  • Download size : 665.69 KiB

  • Dataset size : 672.01 KiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 1,520

wikipedia/20200301.cv

  • Config description : Wikipedia dataset for cv, parsed from 20200301 dump.

  • Download size : 23.37 MiB

  • Dataset size : 59.96 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 45,907

wikipedia/20200301.cy

  • Config description : Wikipedia dataset for cy, parsed from 20200301 dump.

  • Download size : 69.14 MiB

  • Dataset size : 100.36 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 147,899

wikipedia/20200301.da

  • Config description : Wikipedia dataset for da, parsed from 20200301 dump.

  • Download size : 341.55 MiB

  • Dataset size : 457.15 MiB

  • Tự động lưu trữ ( tài liệu ): Không

  • tách:

Tách ra Các ví dụ
'train' 257,349

wikipedia/20200301.de

  • Config description : Wikipedia dataset for de, parsed from 20200301 dump.

  • Download size : 5.32 GiB

  • Dataset size : 7.52 GiB

  • Tự động lưu trữ ( tài liệu ): Không

  • tách:

Tách ra Các ví dụ
'train' 3,104,703

wikipedia/20200301.din

  • Config description : Wikipedia dataset for din, parsed from 20200301 dump.

  • Download size : 490.49 KiB

  • Dataset size : 462.00 KiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 284

wikipedia/20200301.diq

  • Config description : Wikipedia dataset for diq, parsed from 20200301 dump.

  • Download size : 8.36 MiB

  • Dataset size : 7.87 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 16,255

wikipedia/20200301.dsb

  • Config description : Wikipedia dataset for dsb, parsed from 20200301 dump.

  • Download size : 3.73 MiB

  • Dataset size : 3.06 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 3,495

wikipedia/20200301.dty

  • Config description : Wikipedia dataset for dty, parsed from 20200301 dump.

  • Download size : 6.52 MiB

  • Dataset size : 5.89 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 3,559

wikipedia/20200301.dv

  • Config description : Wikipedia dataset for dv, parsed from 20200301 dump.

  • Download size : 4.35 MiB

  • Dataset size : 12.40 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 4,262

wikipedia/20200301.dz

  • Config description : Wikipedia dataset for dz, parsed from 20200301 dump.

  • Download size : 377.61 KiB

  • Dataset size : 799.74 KiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 294

wikipedia/20200301.ee

  • Config description : Wikipedia dataset for ee, parsed from 20200301 dump.

  • Download size : 460.80 KiB

  • Dataset size : 207.60 KiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 381

wikipedia/20200301.el

  • Config description : Wikipedia dataset for el, parsed from 20200301 dump.

  • Download size : 359.36 MiB

  • Dataset size : 937.56 MiB

  • Tự động lưu trữ ( tài liệu ): Không

  • tách:

Tách ra Các ví dụ
'train' 244,313

wikipedia/20200301.eml

  • Config description : Wikipedia dataset for eml, parsed from 20200301 dump.

  • Download size : 8.14 MiB

  • Dataset size : 3.44 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 14,208

wikipedia/20200301.en

  • Config description : Wikipedia dataset for en, parsed from 20200301 dump.

  • Download size : 16.73 GiB

  • Dataset size : 17.05 GiB

  • Tự động lưu trữ ( tài liệu ): Không

  • tách:

Tách ra Các ví dụ
'train' 6,033,151

wikipedia/20200301.eo

  • Config description : Wikipedia dataset for eo, parsed from 20200301 dump.

  • Download size : 264.90 MiB

  • Dataset size : 405.95 MiB

  • Tự động lưu trữ ( tài liệu ): Không

  • tách:

Tách ra Các ví dụ
'train' 379,859

wikipedia/20200301.es

  • Config description : Wikipedia dataset for es, parsed from 20200301 dump.

  • Download size : 3.16 GiB

  • Dataset size : 4.58 GiB

  • Tự động lưu trữ ( tài liệu ): Không

  • tách:

Tách ra Các ví dụ
'train' 2,837,472

wikipedia/20200301.et

  • Config description : Wikipedia dataset for et, parsed from 20200301 dump.

  • Download size : 211.83 MiB

  • Dataset size : 352.11 MiB

  • Tự động lưu trữ ( tài liệu ): Không

  • tách:

Tách ra Các ví dụ
'train' 317,330

wikipedia/20200301.eu

  • Config description : Wikipedia dataset for eu, parsed from 20200301 dump.

  • Download size : 195.51 MiB

  • Dataset size : 386.22 MiB

  • Tự động lưu trữ ( tài liệu ): Không

  • tách:

Tách ra Các ví dụ
'train' 437,022

wikipedia/20200301.ext

  • Config description : Wikipedia dataset for ext, parsed from 20200301 dump.

  • Download size : 2.50 MiB

  • Dataset size : 3.56 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 3,486

wikipedia/20200301.fa

  • Config description : Wikipedia dataset for fa, parsed from 20200301 dump.

  • Download size : 769.97 MiB

  • Dataset size : 1.33 GiB

  • Tự động lưu trữ ( tài liệu ): Không

  • tách:

Tách ra Các ví dụ
'train' 2,316,555

wikipedia/20200301.ff

  • Config description : Wikipedia dataset for ff, parsed from 20200301 dump.

  • Download size : 417.26 KiB

  • Dataset size : 280.51 KiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 313

wikipedia/20200301.fi

  • Config description : Wikipedia dataset for fi, parsed from 20200301 dump.

  • Download size : 703.73 MiB

  • Dataset size : 923.20 MiB

  • Tự động lưu trữ ( tài liệu ): Không

  • tách:

Tách ra Các ví dụ
'train' 656,462

wikipedia/20200301.fiu-vro

  • Config description : Wikipedia dataset for fiu-vro, parsed from 20200301 dump.

  • Download size : 2.06 MiB

  • Dataset size : 3.41 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 6,132

wikipedia/20200301.fj

  • Config description : Wikipedia dataset for fj, parsed from 20200301 dump.

  • Download size : 400.67 KiB

  • Dataset size : 278.31 KiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 853

wikipedia/20200301.fo

  • Config description : Wikipedia dataset for fo, parsed from 20200301 dump.

  • Download size : 14.07 MiB

  • Dataset size : 13.50 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 13,325

wikipedia/20200301.fr

  • Config description : Wikipedia dataset for fr, parsed from 20200301 dump.

  • Download size : 4.46 GiB

  • Dataset size : 6.00 GiB

  • Tự động lưu trữ ( tài liệu ): Không

  • tách:

Tách ra Các ví dụ
'train' 2,186,354

wikipedia/20200301.frp

  • Config description : Wikipedia dataset for frp, parsed from 20200301 dump.

  • Download size : 2.19 MiB

  • Dataset size : 1.53 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 4,937

wikipedia/20200301.frr

  • Config description : Wikipedia dataset for frr, parsed from 20200301 dump.

  • Download size : 8.73 MiB

  • Dataset size : 5.93 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 11,448

wikipedia/20200301.fur

  • Config description : Wikipedia dataset for fur, parsed from 20200301 dump.

  • Download size : 2.33 MiB

  • Dataset size : 3.47 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 3,563

wikipedia/20200301.fy

  • Config description : Wikipedia dataset for fy, parsed from 20200301 dump.

  • Download size : 49.88 MiB

  • Dataset size : 94.24 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 43,510

wikipedia/20200301.ga

  • Config description : Wikipedia dataset for ga, parsed from 20200301 dump.

  • Download size : 27.12 MiB

  • Dataset size : 43.30 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 58,490

wikipedia/20200301.gag

  • Config description : Wikipedia dataset for gag, parsed from 20200301 dump.

  • Download size : 2.04 MiB

  • Dataset size : 2.28 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 3,011

wikipedia/20200301.gan

  • Config description : Wikipedia dataset for gan, parsed from 20200301 dump.

  • Download size : 3.85 MiB

  • Dataset size : 2.44 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 6,513

wikipedia/20200301.gd

  • Config description : Wikipedia dataset for gd, parsed from 20200301 dump.

  • Download size : 8.72 MiB

  • Dataset size : 12.45 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 15,158

wikipedia/20200301.gl

  • Config description : Wikipedia dataset for gl, parsed from 20200301 dump.

  • Download size : 254.09 MiB

  • Dataset size : 376.97 MiB

  • Tự động lưu trữ ( tài liệu ): Không

  • tách:

Tách ra Các ví dụ
'train' 215,685

wikipedia/20200301.glk

  • Config description : Wikipedia dataset for glk, parsed from 20200301 dump.

  • Download size : 2.02 MiB

  • Dataset size : 4.25 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 6,784

wikipedia/20200301.gn

  • Config description : Wikipedia dataset for gn, parsed from 20200301 dump.

  • Download size : 3.50 MiB

  • Dataset size : 5.27 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 4,493

wikipedia/20200301.gom

  • Config description : Wikipedia dataset for gom, parsed from 20200301 dump.

  • Download size : 6.24 MiB

  • Dataset size : 29.42 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 4,436

wikipedia/20200301.gor

  • Config description : Wikipedia dataset for gor, parsed from 20200301 dump.

  • Download size : 1.67 MiB

  • Dataset size : 2.20 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 4,006

wikipedia/20200301.got

  • Config description : Wikipedia dataset for got, parsed from 20200301 dump.

  • Download size : 673.14 KiB

  • Dataset size : 1.27 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 940

wikipedia/20200301.gu

  • Config description : Wikipedia dataset for gu, parsed from 20200301 dump.

  • Download size : 28.55 MiB

  • Dataset size : 106.99 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 29,103

wikipedia/20200301.gv

  • Config description : Wikipedia dataset for gv, parsed from 20200301 dump.

  • Download size : 5.36 MiB

  • Dataset size : 4.38 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 5,020

wikipedia/20200301.ha

  • Config description : Wikipedia dataset for ha, parsed from 20200301 dump.

  • Download size : 2.54 MiB

  • Dataset size : 3.01 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 4,856

wikipedia/20200301.hak

  • Config description : Wikipedia dataset for hak, parsed from 20200301 dump.

  • Download size : 3.74 MiB

  • Dataset size : 3.97 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 11,894

wikipedia/20200301.haw

  • Config description : Wikipedia dataset for haw, parsed from 20200301 dump.

  • Download size : 1.50 MiB

  • Dataset size : 2.86 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 4,308

wikipedia/20200301.he

  • Config description : Wikipedia dataset for he, parsed from 20200301 dump.

  • Download size : 626.91 MiB

  • Dataset size : 1.36 GiB

  • Tự động lưu trữ ( tài liệu ): Không

  • tách:

Tách ra Các ví dụ
'train' 424,381

wikipedia/20200301.hi

  • Config description : Wikipedia dataset for hi, parsed from 20200301 dump.

  • Download size : 151.17 MiB

  • Dataset size : 520.31 MiB

  • Tự động lưu trữ ( tài liệu ): Không

  • tách:

Tách ra Các ví dụ
'train' 168,552

wikipedia/20200301.hif

  • Config description : Wikipedia dataset for hif, parsed from 20200301 dump.

  • Download size : 4.62 MiB

  • Dataset size : 4.24 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 10,054

wikipedia/20200301.ho

  • Config description : Wikipedia dataset for ho, parsed from 20200301 dump.

  • Download size : 19.24 KiB

  • Dataset size : 3.27 KiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 3

wikipedia/20200301.hr

  • Config description : Wikipedia dataset for hr, parsed from 20200301 dump.

  • Download size : 261.83 MiB

  • Dataset size : 389.49 MiB

  • Tự động lưu trữ ( tài liệu ): Không

  • tách:

Tách ra Các ví dụ
'train' 243,050

wikipedia/20200301.hsb

  • Config description : Wikipedia dataset for hsb, parsed from 20200301 dump.

  • Download size : 10.63 MiB

  • Dataset size : 14.40 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 14,878

wikipedia/20200301.ht

  • Config description : Wikipedia dataset for ht, parsed from 20200301 dump.

  • Download size : 13.19 MiB

  • Dataset size : 38.84 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 59,271

wikipedia/20200301.hu

  • Config description : Wikipedia dataset for hu, parsed from 20200301 dump.

  • Download size : 863.44 MiB

  • Dataset size : 1.19 GiB

  • Tự động lưu trữ ( tài liệu ): Không

  • tách:

Tách ra Các ví dụ
'train' 654,141

wikipedia/20200301.hy

  • Config description : Wikipedia dataset for hy, parsed from 20200301 dump.

  • Download size : 309.20 MiB

  • Dataset size : 846.57 MiB

  • Tự động lưu trữ ( tài liệu ): Không

  • tách:

Tách ra Các ví dụ
'train' 589,352

wikipedia/20200301.ia

  • Config description : Wikipedia dataset for ia, parsed from 20200301 dump.

  • Download size : 8.64 MiB

  • Dataset size : 11.52 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 19,556

wikipedia/20200301.id

  • Config description : Wikipedia dataset for id, parsed from 20200301 dump.

  • Download size : 595.70 MiB

  • Dataset size : 809.23 MiB

  • Tự động lưu trữ ( tài liệu ): Không

  • tách:

Tách ra Các ví dụ
'train' 1,033,265

wikipedia/20200301.ie

  • Config description : Wikipedia dataset for ie, parsed from 20200301 dump.

  • Download size : 1.85 MiB

  • Dataset size : 2.82 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 4,766

wikipedia/20200301.ig

  • Config description : Wikipedia dataset for ig, parsed from 20200301 dump.

  • Download size : 1.13 MiB

  • Dataset size : 1.18 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 2,797

wikipedia/20200301.ii

  • Config description : Wikipedia dataset for ii, parsed from 20200301 dump.

  • Download size : 31.73 KiB

  • Dataset size : 8.31 KiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 14

wikipedia/20200301.ik

  • Config description : Wikipedia dataset for ik, parsed from 20200301 dump.

  • Download size : 251.48 KiB

  • Dataset size : 94.27 KiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 669

wikipedia/20200301.ilo

  • Config description : Wikipedia dataset for ilo, parsed from 20200301 dump.

  • Download size : 16.98 MiB

  • Dataset size : 14.92 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 14,221

wikipedia/20200301.inh

  • Config description : Wikipedia dataset for inh, parsed from 20200301 dump.

  • Download size : 2.15 MiB

  • Dataset size : 1.10 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 1,597

wikipedia/20200301.io

  • Config description : Wikipedia dataset for io, parsed from 20200301 dump.

  • Download size : 13.17 MiB

  • Dataset size : 29.29 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 30,720

wikipedia/20200301.is

  • Config description : Wikipedia dataset for is, parsed from 20200301 dump.

  • Download size : 44.88 MiB

  • Dataset size : 70.66 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 70,348

wikipedia/20200301.it

  • Config description : Wikipedia dataset for it, parsed from 20200301 dump.

  • Download size : 2.85 GiB

  • Dataset size : 3.72 GiB

  • Tự động lưu trữ ( tài liệu ): Không

  • tách:

Tách ra Các ví dụ
'train' 1,907,437

wikipedia/20200301.iu

  • Config description : Wikipedia dataset for iu, parsed from 20200301 dump.

  • Download size : 292.01 KiB

  • Dataset size : 153.39 KiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 512

wikipedia/20200301.ja

  • Config description : Wikipedia dataset for ja, parsed from 20200301 dump.

  • Download size : 2.95 GiB

  • Dataset size : 5.33 GiB

  • Tự động lưu trữ ( tài liệu ): Không

  • tách:

Tách ra Các ví dụ
'train' 1,459,322

wikipedia/20200301.jam

  • Config description : Wikipedia dataset for jam, parsed from 20200301 dump.

  • Download size : 908.86 KiB

  • Dataset size : 1.01 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 1,708

wikipedia/20200301.jbo

  • Config description : Wikipedia dataset for jbo, parsed from 20200301 dump.

  • Download size : 1.09 MiB

  • Dataset size : 2.31 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 1.320

wikipedia/20200301.jv

  • Config description : Wikipedia dataset for jv, parsed from 20200301 dump.

  • Download size : 42.41 MiB

  • Dataset size : 54.26 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 75,864

wikipedia/20200301.ka

  • Config description : Wikipedia dataset for ka, parsed from 20200301 dump.

  • Download size : 142.65 MiB

  • Dataset size : 480.54 MiB

  • Tự động lưu trữ ( tài liệu ): Không

  • tách:

Tách ra Các ví dụ
'train' 170,803

wikipedia/20200301.kaa

  • Config description : Wikipedia dataset for kaa, parsed from 20200301 dump.

  • Download size : 1.38 MiB

  • Dataset size : 1.73 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 2,183

wikipedia/20200301.kab

  • Config description : Wikipedia dataset for kab, parsed from 20200301 dump.

  • Download size : 2.99 MiB

  • Dataset size : 2.96 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 4,612

wikipedia/20200301.kbd

  • Config description : Wikipedia dataset for kbd, parsed from 20200301 dump.

  • Download size : 1.67 MiB

  • Dataset size : 2.74 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 1,611

wikipedia/20200301.kbp

  • Config description : Wikipedia dataset for kbp, parsed from 20200301 dump.

  • Download size : 1.33 MiB

  • Dataset size : 3.19 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 1,797

wikipedia/20200301.kg

  • Config description : Wikipedia dataset for kg, parsed from 20200301 dump.

  • Download size : 452.75 KiB

  • Dataset size : 255.06 KiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 1,242

wikipedia/20200301.ki

  • Config description : Wikipedia dataset for ki, parsed from 20200301 dump.

  • Download size : 377.70 KiB

  • Dataset size : 310.31 KiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 1,486

wikipedia/20200301.kj

  • Config description : Wikipedia dataset for kj, parsed from 20200301 dump.

  • Download size : 17.46 KiB

  • Dataset size : 4.93 KiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 5

wikipedia/20200301.kk

  • Config description : Wikipedia dataset for kk, parsed from 20200301 dump.

  • Download size : 116.81 MiB

  • Dataset size : 417.74 MiB

  • Tự động lưu trữ ( tài liệu ): Không

  • tách:

Tách ra Các ví dụ
'train' 269,235

wikipedia/20200301.kl

  • Config description : Wikipedia dataset for kl, parsed from 20200301 dump.

  • Download size : 874.37 KiB

  • Dataset size : 574.59 KiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 1,708

wikipedia/20200301.km

  • Config description : Wikipedia dataset for km, parsed from 20200301 dump.

  • Download size : 23.63 MiB

  • Dataset size : 132.41 MiB

  • Tự động lưu trữ ( tài liệu ): Chỉ khi shuffle_files=False (tàu)

  • tách:

Tách ra Các ví dụ
'train' 11,773

wikipedia/20200301.kn

  • Config description : Wikipedia dataset for kn, parsed from 20200301 dump.

  • Download size : 73.08 MiB

  • Dataset size : 323.92 MiB

  • Tự động lưu trữ ( tài liệu ): Không

  • tách:

Tách ra Các ví dụ
'train' 26,349

wikipedia/20200301.ko

  • Config description : Wikipedia dataset for ko, parsed from 20200301 dump.

  • Download size : 685.64 MiB

  • Dataset size : 1.02 GiB

  • Tự động lưu trữ ( tài liệu ): Không

  • tách:

Tách ra Các ví dụ
'train' 1,053,176

wikipedia/20200301.koi

  • Config description : Wikipedia dataset for koi, parsed from 20200301 dump.

  • Download size : 2.18 MiB

  • Dataset size : 4.74 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 3,968

wikipedia/20200301.krc

  • Config description : Wikipedia dataset for krc, parsed from 20200301 dump.

  • Download size : 3.20 MiB

  • Dataset size : 4.24 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 2,329

wikipedia/20200301.ks

  • Config description : Wikipedia dataset for ks, parsed from 20200301 dump.

  • Download size : 331.45 KiB

  • Dataset size : 153.64 KiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 443

wikipedia/20200301.ksh

  • Config description : Wikipedia dataset for ksh, parsed from 20200301 dump.

  • Download size : 3.11 MiB

  • Dataset size : 2.86 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 3,375

wikipedia/20200301.ku

  • Config description : Wikipedia dataset for ku, parsed from 20200301 dump.

  • Download size : 18.20 MiB

  • Dataset size : 24.55 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 34,513

wikipedia/20200301.kv

  • Config description : Wikipedia dataset for kv, parsed from 20200301 dump.

  • Download size : 3.46 MiB

  • Dataset size : 8.16 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 6,759

wikipedia/20200301.kw

  • Config description : Wikipedia dataset for kw, parsed from 20200301 dump.

  • Download size : 1.92 MiB

  • Dataset size : 1.76 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 4,027

wikipedia/20200301.ky

  • Config description : Wikipedia dataset for ky, parsed from 20200301 dump.

  • Download size : 33.38 MiB

  • Dataset size : 146.62 MiB

  • Tự động lưu trữ ( tài liệu ): Chỉ khi shuffle_files=False (tàu)

  • tách:

Tách ra Các ví dụ
'train' 79,687

wikipedia/20200301.la

  • Config description : Wikipedia dataset for la, parsed from 20200301 dump.

  • Download size : 85.88 MiB

  • Dataset size : 123.90 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 132,256

wikipedia/20200301.lad

  • Config description : Wikipedia dataset for lad, parsed from 20200301 dump.

  • Download size : 3.37 MiB

  • Dataset size : 4.57 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 4,943

wikipedia/20200301.lb

  • Config description : Wikipedia dataset for lb, parsed from 20200301 dump.

  • Download size : 47.48 MiB

  • Dataset size : 75.73 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 63,849

wikipedia/20200301.lbe

  • Config description : Wikipedia dataset for lbe, parsed from 20200301 dump.

  • Download size : 1.30 MiB

  • Dataset size : 643.83 KiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 1,549

wikipedia/20200301.lez

  • Config description : Wikipedia dataset for lez, parsed from 20200301 dump.

  • Download size : 4.42 MiB

  • Dataset size : 8.31 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 4,448

wikipedia/20200301.lfn

  • Config description : Wikipedia dataset for lfn, parsed from 20200301 dump.

  • Download size : 3.65 MiB

  • Dataset size : 7.58 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 4,308

wikipedia/20200301.lg

  • Config description : Wikipedia dataset for lg, parsed from 20200301 dump.

  • Dung lượng tải về: 1.59 MiB

  • Dataset size : 3.69 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 2,365

wikipedia/20200301.li

  • Config description : Wikipedia dataset for li, parsed from 20200301 dump.

  • Download size : 14.58 MiB

  • Dataset size : 25.08 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 14,721

wikipedia/20200301.lij

  • Config description : Wikipedia dataset for lij, parsed from 20200301 dump.

  • Download size : 3.02 MiB

  • Dataset size : 4.28 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 4,543

wikipedia/20200301.lmo

  • Config description : Wikipedia dataset for lmo, parsed from 20200301 dump.

  • Download size : 21.87 MiB

  • Dataset size : 28.70 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 45,704

wikipedia/20200301.ln

  • Config description : Wikipedia dataset for ln, parsed from 20200301 dump.

  • Download size : 1.89 MiB

  • Dataset size : 1.67 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 3,265

wikipedia/20200301.lo

  • Config description : Wikipedia dataset for lo, parsed from 20200301 dump.

  • Download size : 4.24 MiB

  • Dataset size : 11.47 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 4,463

wikipedia/20200301.lrc

  • Config description : Wikipedia dataset for lrc, parsed from 20200301 dump.

  • Download size : 5.55 MiB

  • Dataset size : 3.52 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 5,953

wikipedia/20200301.lt

  • Config description : Wikipedia dataset for lt, parsed from 20200301 dump.

  • Download size : 182.22 MiB

  • Dataset size : 286.61 MiB

  • Tự động lưu trữ ( tài liệu ): Không

  • tách:

Tách ra Các ví dụ
'train' 223,184

wikipedia/20200301.ltg

  • Config description : Wikipedia dataset for ltg, parsed from 20200301 dump.

  • Download size : 878.96 KiB

  • Dataset size : 860.05 KiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 1,002

wikipedia/20200301.lv

  • Config description : Wikipedia dataset for lv, parsed from 20200301 dump.

  • Download size : 137.56 MiB

  • Dataset size : 170.66 MiB

  • Tự động lưu trữ ( tài liệu ): Chỉ khi shuffle_files=False (tàu)

  • tách:

Tách ra Các ví dụ
'train' 100,641

wikipedia/20200301.mai

  • Config description : Wikipedia dataset for mai, parsed from 20200301 dump.

  • Download size : 11.43 MiB

  • Dataset size : 18.05 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 14,774

wikipedia/20200301.map-bms

  • Config description : Wikipedia dataset for map-bms, parsed from 20200301 dump.

  • Download size : 4.55 MiB

  • Dataset size : 4.60 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 13,680

wikipedia/20200301.mdf

  • Config description : Wikipedia dataset for mdf, parsed from 20200301 dump.

  • Download size : 1.14 MiB

  • Dataset size : 1.73 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 1,354

wikipedia/20200301.mg

  • Config description : Wikipedia dataset for mg, parsed from 20200301 dump.

  • Download size : 26.66 MiB

  • Dataset size : 61.98 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 128,813

wikipedia/20200301.mh

  • Config description : Wikipedia dataset for mh, parsed from 20200301 dump.

  • Download size : 28.59 KiB

  • Dataset size : 11.04 KiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 8

wikipedia/20200301.mhr

  • Config description : Wikipedia dataset for mhr, parsed from 20200301 dump.

  • Download size : 5.90 MiB

  • Dataset size : 16.53 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 12,302

wikipedia/20200301.mi

  • Config description : Wikipedia dataset for mi, parsed from 20200301 dump.

  • Download size : 1.99 MiB

  • Dataset size : 3.50 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 7,187

wikipedia/20200301.min

  • Config description : Wikipedia dataset for min, parsed from 20200301 dump.

  • Download size : 27.69 MiB

  • Dataset size : 98.11 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 227,688

wikipedia/20200301.mk

  • Config description : Wikipedia dataset for mk, parsed from 20200301 dump.

  • Download size : 152.75 MiB

  • Dataset size : 432.82 MiB

  • Tự động lưu trữ ( tài liệu ): Không

  • tách:

Tách ra Các ví dụ
'train' 145,820

wikipedia/20200301.ml

  • Config description : Wikipedia dataset for ml, parsed from 20200301 dump.

  • Download size : 130.77 MiB

  • Dataset size : 340.30 MiB

  • Tự động lưu trữ ( tài liệu ): Không

  • tách:

Tách ra Các ví dụ
'train' 123,672

wikipedia/20200301.mn

  • Config description : Wikipedia dataset for mn, parsed from 20200301 dump.

  • Download size : 30.40 MiB

  • Dataset size : 71.21 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 24,252

wikipedia/20200301.mr

  • Config description : Wikipedia dataset for mr, parsed from 20200301 dump.

  • Download size : 53.71 MiB

  • Dataset size : 149.28 MiB

  • Tự động lưu trữ ( tài liệu ): Chỉ khi shuffle_files=False (tàu)

  • tách:

Tách ra Các ví dụ
'train' 101,310

wikipedia/20200301.mrj

  • Config description : Wikipedia dataset for mrj, parsed from 20200301 dump.

  • Download size : 3.10 MiB

  • Dataset size : 8.31 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 10,831

wikipedia/20200301.ms

  • Config description : Wikipedia dataset for ms, parsed from 20200301 dump.

  • Download size : 228.62 MiB

  • Dataset size : 318.42 MiB

  • Tự động lưu trữ ( tài liệu ): Không

  • tách:

Tách ra Các ví dụ
'train' 373,578

wikipedia/20200301.mt

  • Config description : Wikipedia dataset for mt, parsed from 20200301 dump.

  • Download size : 8.53 MiB

  • Dataset size : 12.70 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 4,748

wikipedia/20200301.mus

  • Config description : Wikipedia dataset for mus, parsed from 20200301 dump.

  • Download size : 15.08 KiB

  • Dataset size : 875 bytes

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 2

wikipedia/20200301.mwl

  • Config description : Wikipedia dataset for mwl, parsed from 20200301 dump.

  • Download size : 9.09 MiB

  • Dataset size : 18.23 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 4,332

wikipedia/20200301.my

  • Config description : Wikipedia dataset for my, parsed from 20200301 dump.

  • Download size : 37.69 MiB

  • Dataset size : 177.44 MiB

  • Tự động lưu trữ ( tài liệu ): Chỉ khi shuffle_files=False (tàu)

  • tách:

Tách ra Các ví dụ
'train' 48,451

wikipedia/20200301.myv

  • Config description : Wikipedia dataset for myv, parsed from 20200301 dump.

  • Download size : 8.87 MiB

  • Dataset size : 7.87 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 6,566

wikipedia/20200301.mzn

  • Config description : Wikipedia dataset for mzn, parsed from 20200301 dump.

  • Download size : 6.63 MiB

  • Dataset size : 11.11 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 18,486

wikipedia/20200301.na

  • Config description : Wikipedia dataset for na, parsed from 20200301 dump.

  • Download size : 495.83 KiB

  • Dataset size : 334.74 KiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 1.319

wikipedia/20200301.nah

  • Config description : Wikipedia dataset for nah, parsed from 20200301 dump.

  • Download size : 4.37 MiB

  • Dataset size : 7.84 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 10,672

wikipedia/20200301.nap

  • Config description : Wikipedia dataset for nap, parsed from 20200301 dump.

  • Download size : 5.15 MiB

  • Dataset size : 5.83 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 15,191

wikipedia/20200301.nds

  • Config description : Wikipedia dataset for nds, parsed from 20200301 dump.

  • Download size : 37.74 MiB

  • Dataset size : 75.85 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 65,024

wikipedia/20200301.nds-nl

  • Config description : Wikipedia dataset for nds-nl, parsed from 20200301 dump.

  • Download size : 6.92 MiB

  • Dataset size : 10.86 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 8,976

wikipedia/20200301.ne

  • Config description : Wikipedia dataset for ne, parsed from 20200301 dump.

  • Download size : 32.89 MiB

  • Dataset size : 86.01 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 34,609

wikipedia/20200301.new

  • Config description : Wikipedia dataset for new, parsed from 20200301 dump.

  • Download size : 16.96 MiB

  • Dataset size : 140.19 MiB

  • Tự động lưu trữ ( tài liệu ): Chỉ khi shuffle_files=False (tàu)

  • tách:

Tách ra Các ví dụ
'train' 72,895

wikipedia/20200301.ng

  • Config description : Wikipedia dataset for ng, parsed from 20200301 dump.

  • Download size : 91.98 KiB

  • Dataset size : 66.12 KiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 21

wikipedia/20200301.nl

  • Config description : Wikipedia dataset for nl, parsed from 20200301 dump.

  • Download size : 1.45 GiB

  • Dataset size : 2.13 GiB

  • Tự động lưu trữ ( tài liệu ): Không

  • tách:

Tách ra Các ví dụ
'train' 2,464,920

wikipedia/20200301.nn

  • Config description : Wikipedia dataset for nn, parsed from 20200301 dump.

  • Download size : 132.55 MiB

  • Dataset size : 200.31 MiB

  • Tự động lưu trữ ( tài liệu ): Chỉ khi shuffle_files=False (tàu)

  • tách:

Tách ra Các ví dụ
'train' 225,543

wikipedia/20200301.no

  • Config description : Wikipedia dataset for no, parsed from 20200301 dump.

  • Download size : 619.74 MiB

  • Dataset size : 861.07 MiB

  • Tự động lưu trữ ( tài liệu ): Không

  • tách:

Tách ra Các ví dụ
'train' 822,320

wikipedia/20200301.nov

  • Config description : Wikipedia dataset for nov, parsed from 20200301 dump.

  • Download size : 1.14 MiB

  • Dataset size : 810.05 KiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 1,790

wikipedia/20200301.nrm

  • Config description : Wikipedia dataset for nrm, parsed from 20200301 dump.

  • Download size : 1.74 MiB

  • Dataset size : 2.70 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 4,356

wikipedia/20200301.nso

  • Config description : Wikipedia dataset for nso, parsed from 20200301 dump.

  • Download size : 2.26 MiB

  • Dataset size : 2.12 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 8,248

wikipedia/20200301.nv

  • Config description : Wikipedia dataset for nv, parsed from 20200301 dump.

  • Download size : 3.48 MiB

  • Dataset size : 8.00 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 12,199

wikipedia/20200301.ny

  • Config description : Wikipedia dataset for ny, parsed from 20200301 dump.

  • Download size : 1.29 MiB

  • Dataset size : 752.91 KiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 630

wikipedia/20200301.oc

  • Config description : Wikipedia dataset for oc, parsed from 20200301 dump.

  • Download size : 73.98 MiB

  • Dataset size : 110.92 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 95,125

wikipedia/20200301.olo

  • Config description : Wikipedia dataset for olo, parsed from 20200301 dump.

  • Download size : 1.80 MiB

  • Dataset size : 2.52 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 4,278

wikipedia/20200301.om

  • Config description : Wikipedia dataset for om, parsed from 20200301 dump.

  • Download size : 1.10 MiB

  • Dataset size : 1.59 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 1,099

wikipedia/20200301.or

  • Config description : Wikipedia dataset for or, parsed from 20200301 dump.

  • Download size : 26.72 MiB

  • Dataset size : 55.44 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 30,267

wikipedia/20200301.os

  • Config description : Wikipedia dataset for os, parsed from 20200301 dump.

  • Download size : 7.76 MiB

  • Dataset kích thước: 9.04 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 14,078

wikipedia/20200301.pa

  • Config description : Wikipedia dataset for pa, parsed from 20200301 dump.

  • Download size : 45.93 MiB

  • Dataset size : 118.68 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 43,772

wikipedia/20200301.pag

  • Config description : Wikipedia dataset for pag, parsed from 20200301 dump.

  • Download size : 1.32 MiB

  • Dataset size : 2.05 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 5,052

wikipedia/20200301.pam

  • Config description : Wikipedia dataset for pam, parsed from 20200301 dump.

  • Download size : 8.19 MiB

  • Dataset size : 7.22 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 8,729

wikipedia/20200301.pap

  • Config description : Wikipedia dataset for pap, parsed from 20200301 dump.

  • Download size : 1.40 MiB

  • Dataset size : 1.92 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 2,116

wikipedia/20200301.pcd

  • Config description : Wikipedia dataset for pcd, parsed from 20200301 dump.

  • Download size : 4.54 MiB

  • Dataset size : 4.67 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 4,839

wikipedia/20200301.pdc

  • Config description : Wikipedia dataset for pdc, parsed from 20200301 dump.

  • Download size : 1.12 MiB

  • Dataset size : 1.05 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 2,354

wikipedia/20200301.pfl

  • Config description : Wikipedia dataset for pfl, parsed from 20200301 dump.

  • Download size : 3.39 MiB

  • Dataset size : 3.32 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 3,886

wikipedia/20200301.pi

  • Config description : Wikipedia dataset for pi, parsed from 20200301 dump.

  • Download size : 606.15 KiB

  • Dataset size : 2.03 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 3,068

wikipedia/20200301.pih

  • Config description : Wikipedia dataset for pih, parsed from 20200301 dump.

  • Download size : 726.58 KiB

  • Dataset size : 213.73 KiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 834

wikipedia/20200301.pl

  • Config description : Wikipedia dataset for pl, parsed from 20200301 dump.

  • Download size : 1.87 GiB

  • Dataset size : 2.35 GiB

  • Tự động lưu trữ ( tài liệu ): Không

  • tách:

Tách ra Các ví dụ
'train' 1,694,759

wikipedia/20200301.pms

  • Config description : Wikipedia dataset for pms, parsed from 20200301 dump.

  • Download size : 13.59 MiB

  • Dataset size : 30.61 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 65,817

wikipedia/20200301.pnb

  • Config description : Wikipedia dataset for pnb, parsed from 20200301 dump.

  • Download size : 38.95 MiB

  • Dataset size : 97.39 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 57,145

wikipedia/20200301.pnt

  • Config description : Wikipedia dataset for pnt, parsed from 20200301 dump.

  • Download size : 536.03 KiB

  • Dataset size : 588.72 KiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 527

wikipedia/20200301.ps

  • Config description : Wikipedia dataset for ps, parsed from 20200301 dump.

  • Download size : 16.28 MiB

  • Dataset size : 36.91 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 12,100

wikipedia/20200301.pt

  • Config description : Wikipedia dataset for pt, parsed from 20200301 dump.

  • Download size : 1.69 GiB

  • Dataset size : 2.13 GiB

  • Tự động lưu trữ ( tài liệu ): Không

  • tách:

Tách ra Các ví dụ
'train' 1,451,953

wikipedia/20200301.qu

  • Config description : Wikipedia dataset for qu, parsed from 20200301 dump.

  • Download size : 11.85 MiB

  • Dataset size : 15.12 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 30,353

wikipedia/20200301.rm

  • Config description : Wikipedia dataset for rm, parsed from 20200301 dump.

  • Download size : 6.50 MiB

  • Dataset size : 15.51 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 3,796

wikipedia/20200301.rmy

  • Config description : Wikipedia dataset for rmy, parsed from 20200301 dump.

  • Download size : 530.59 KiB

  • Dataset size : 367.95 KiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 709

wikipedia/20200301.rn

  • Config description : Wikipedia dataset for rn, parsed from 20200301 dump.

  • Download size : 796.83 KiB

  • Dataset size : 347.72 KiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 701

wikipedia/20200301.ro

  • Config description : Wikipedia dataset for ro, parsed from 20200301 dump.

  • Download size : 478.19 MiB

  • Dataset size : 661.55 MiB

  • Tự động lưu trữ ( tài liệu ): Không

  • tách:

Tách ra Các ví dụ
'train' 405,150

wikipedia/20200301.roa-rup

  • Config description : Wikipedia dataset for roa-rup, parsed from 20200301 dump.

  • Download size : 963.66 KiB

  • Dataset size : 1.11 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 1,253

wikipedia/20200301.roa-tara

  • Config description : Wikipedia dataset for roa-tara, parsed from 20200301 dump.

  • Download size : 5.98 MiB

  • Dataset size : 6.17 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 9,297

wikipedia/20200301.ru

  • Config description : Wikipedia dataset for ru, parsed from 20200301 dump.

  • Download size : 3.77 GiB

  • Dataset size : 7.62 GiB

  • Tự động lưu trữ ( tài liệu ): Không

  • tách:

Tách ra Các ví dụ
'train' 2,592,128

wikipedia/20200301.rue

  • Config description : Wikipedia dataset for rue, parsed from 20200301 dump.

  • Download size : 4.78 MiB

  • Dataset size : 8.47 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 8,035

wikipedia/20200301.rw

  • Config description : Wikipedia dataset for rw, parsed from 20200301 dump.

  • Download size : 908.39 KiB

  • Dataset size : 977.34 KiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 1,961

wikipedia/20200301.sa

  • Config description : Wikipedia dataset for sa, parsed from 20200301 dump.

  • Download size : 14.82 MiB

  • Dataset size : 56.70 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 21,969

wikipedia/20200301.sah

  • Config description : Wikipedia dataset for sah, parsed from 20200301 dump.

  • Download size : 12.32 MiB

  • Dataset size : 32.33 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 15,941

wikipedia/20200301.sat

  • Config description : Wikipedia dataset for sat, parsed from 20200301 dump.

  • Download size : 6.21 MiB

  • Dataset size : 13.48 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 3,060

wikipedia/20200301.sc

  • Config description : Wikipedia dataset for sc, parsed from 20200301 dump.

  • Download size : 5.01 MiB

  • Dataset size : 7.90 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 6,567

wikipedia/20200301.scn

  • Config description : Wikipedia dataset for scn, parsed from 20200301 dump.

  • Download size : 11.88 MiB

  • Dataset size : 16.49 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 31,362

wikipedia/20200301.sco

  • Config description : Wikipedia dataset for sco, parsed from 20200301 dump.

  • Download size : 61.94 MiB

  • Dataset size : 54.09 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 56,522

wikipedia/20200301.sd

  • Config description : Wikipedia dataset for sd, parsed from 20200301 dump.

  • Download size : 15.68 MiB

  • Dataset size : 28.68 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 18,865

wikipedia/20200301.se

  • Config description : Wikipedia dataset for se, parsed from 20200301 dump.

  • Download size : 3.66 MiB

  • Dataset size : 3.20 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 8,374

wikipedia/20200301.sg

  • Config description : Wikipedia dataset for sg, parsed from 20200301 dump.

  • Download size : 299.28 KiB

  • Dataset size : 95.17 KiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 290

wikipedia/20200301.sh

  • Config description : Wikipedia dataset for sh, parsed from 20200301 dump.

  • Download size : 412.87 MiB

  • Dataset size : 814.81 MiB

  • Tự động lưu trữ ( tài liệu ): Không

  • tách:

Tách ra Các ví dụ
'train' 3,930,504

wikipedia/20200301.si

  • Config description : Wikipedia dataset for si, parsed from 20200301 dump.

  • Download size : 38.91 MiB

  • Dataset size : 106.82 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 26,983

wikipedia/20200301.simple

  • Config description : Wikipedia dataset for simple, parsed from 20200301 dump.

  • Download size : 172.58 MiB

  • Dataset size : 181.12 MiB

  • Tự động lưu trữ ( tài liệu ): Chỉ khi shuffle_files=False (tàu)

  • tách:

Tách ra Các ví dụ
'train' 155,877

wikipedia/20200301.sk

  • Config description : Wikipedia dataset for sk, parsed from 20200301 dump.

  • Download size : 265.58 MiB

  • Dataset size : 345.16 MiB

  • Tự động lưu trữ ( tài liệu ): Không

  • tách:

Tách ra Các ví dụ
'train' 249,815

wikipedia/20200301.sl

  • Config description : Wikipedia dataset for sl, parsed from 20200301 dump.

  • Download size : 214.19 MiB

  • Dataset size : 341.62 MiB

  • Tự động lưu trữ ( tài liệu ): Không

  • tách:

Tách ra Các ví dụ
'train' 197,474

wikipedia/20200301.sm

  • Config description : Wikipedia dataset for sm, parsed from 20200301 dump.

  • Download size : 723.35 KiB

  • Dataset size : 677.25 KiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 976

wikipedia/20200301.sn

  • Config description : Wikipedia dataset for sn, parsed from 20200301 dump.

  • Download size : 2.43 MiB

  • Dataset size : 3.66 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 5,381

wikipedia/20200301.so

  • Config description : Wikipedia dataset for so, parsed from 20200301 dump.

  • Download size : 8.45 MiB

  • Dataset size : 9.53 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 6,987

wikipedia/20200301.sq

  • Config description : Wikipedia dataset for sq, parsed from 20200301 dump.

  • Download size : 83.93 MiB

  • Dataset size : 140.82 MiB

  • Tự động lưu trữ ( tài liệu ): Chỉ khi shuffle_files=False (tàu)

  • tách:

Tách ra Các ví dụ
'train' 106,777

wikipedia/20200301.sr

  • Config description : Wikipedia dataset for sr, parsed from 20200301 dump.

  • Download size : 778.54 MiB

  • Dataset size : 1.51 GiB

  • Tự động lưu trữ ( tài liệu ): Không

  • tách:

Tách ra Các ví dụ
'train' 3,091,798

wikipedia/20200301.srn

  • Config description : Wikipedia dataset for srn, parsed from 20200301 dump.

  • Download size : 644.18 KiB

  • Dataset size : 620.41 KiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 1,249

wikipedia/20200301.ss

  • Config description : Wikipedia dataset for ss, parsed from 20200301 dump.

  • Download size : 795.23 KiB

  • Dataset size : 469.17 KiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 533

wikipedia/20200301.st

  • Config description : Wikipedia dataset for st, parsed from 20200301 dump.

  • Download size : 558.97 KiB

  • Dataset size : 332.01 KiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 753

wikipedia/20200301.stq

  • Config description : Wikipedia dataset for stq, parsed from 20200301 dump.

  • Download size : 3.37 MiB

  • Dataset size : 4.58 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 4,500

wikipedia/20200301.su

  • Config description : Wikipedia dataset for su, parsed from 20200301 dump.

  • Download size : 24.10 MiB

  • Dataset size : 39.52 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 65,709

wikipedia/20200301.sv

  • Config description : Wikipedia dataset for sv, parsed from 20200301 dump.

  • Download size : 1.68 GiB

  • Dataset size : 2.93 GiB

  • Tự động lưu trữ ( tài liệu ): Không

  • tách:

Tách ra Các ví dụ
'train' 5,993,395

wikipedia/20200301.sw

  • Config description : Wikipedia dataset for sw, parsed from 20200301 dump.

  • Download size : 30.67 MiB

  • Dataset size : 48.36 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 55,913

wikipedia/20200301.szl

  • Config description : Wikipedia dataset for szl, parsed from 20200301 dump.

  • Download size : 11.53 MiB

  • Dataset size : 17.13 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 52,672

wikipedia/20200301.ta

  • Config description : Wikipedia dataset for ta, parsed from 20200301 dump.

  • Download size : 154.80 MiB

  • Dataset size : 604.28 MiB

  • Tự động lưu trữ ( tài liệu ): Không

  • tách:

Tách ra Các ví dụ
'train' 161,622

wikipedia/20200301.tcy

  • Config description : Wikipedia dataset for tcy, parsed from 20200301 dump.

  • Download size : 2.81 MiB

  • Dataset size : 6.36 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 1,536

wikipedia/20200301.te

  • Config description : Wikipedia dataset for te, parsed from 20200301 dump.

  • Download size : 102.37 MiB

  • Dataset size : 556.43 MiB

  • Tự động lưu trữ ( tài liệu ): Không

  • tách:

Tách ra Các ví dụ
'train' 93,223

wikipedia/20200301.tet

  • Config description : Wikipedia dataset for tet, parsed from 20200301 dump.

  • Download size : 1.25 MiB

  • Dataset size : 1.28 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 1,600

wikipedia/20200301.tg

  • Config description : Wikipedia dataset for tg, parsed from 20200301 dump.

  • Download size : 39.93 MiB

  • Dataset size : 106.84 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 101,637

wikipedia/20200301.th

  • Config description : Wikipedia dataset for th, parsed from 20200301 dump.

  • Download size : 271.37 MiB

  • Dataset size : 789.74 MiB

  • Tự động lưu trữ ( tài liệu ): Không

  • tách:

Tách ra Các ví dụ
'train' 235,109

wikipedia/20200301.ti

  • Config description : Wikipedia dataset for ti, parsed from 20200301 dump.

  • Download size : 365.94 KiB

  • Dataset size : 369.20 KiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 347

wikipedia/20200301.tk

  • Config description : Wikipedia dataset for tk, parsed from 20200301 dump.

  • Download size : 4.61 MiB

  • Dataset size : 9.94 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 6,869

wikipedia/20200301.tl

  • Config description : Wikipedia dataset for tl, parsed from 20200301 dump.

  • Download size : 54.88 MiB

  • Dataset size : 61.05 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 75,676

wikipedia/20200301.tn

  • Config description : Wikipedia dataset for tn, parsed from 20200301 dump.

  • Download size : 1.40 MiB

  • Dataset size : 1.45 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 828

wikipedia/20200301.to

  • Config description : Wikipedia dataset for to, parsed from 20200301 dump.

  • Download size : 797.75 KiB

  • Dataset size : 911.82 KiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 1,623

wikipedia/20200301.tpi

  • Config description : Wikipedia dataset for tpi, parsed from 20200301 dump.

  • Download size : 1.43 MiB

  • Dataset size : 399.11 KiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 1,639

wikipedia/20200301.tr

  • Config description : Wikipedia dataset for tr, parsed from 20200301 dump.

  • Download size : 534.01 MiB

  • Dataset size : 662.27 MiB

  • Tự động lưu trữ ( tài liệu ): Không

  • tách:

Tách ra Các ví dụ
'train' 575,697

wikipedia/20200301.ts

  • Config description : Wikipedia dataset for ts, parsed from 20200301 dump.

  • Download size : 1.43 MiB

  • Dataset size : 701.00 KiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 697

wikipedia/20200301.tt

  • Config description : Wikipedia dataset for tt, parsed from 20200301 dump.

  • Download size : 58.06 MiB

  • Dataset size : 134.13 MiB

  • Tự động lưu trữ ( tài liệu ): Chỉ khi shuffle_files=False (tàu)

  • tách:

Tách ra Các ví dụ
'train' 130,169

wikipedia/20200301.tum

  • Config description : Wikipedia dataset for tum, parsed from 20200301 dump.

  • Download size : 333.38 KiB

  • Dataset size : 212.55 KiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 708

wikipedia/20200301.tw

  • Config description : Wikipedia dataset for tw, parsed from 20200301 dump.

  • Download size : 413.61 KiB

  • Dataset size : 290.86 KiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 766

wikipedia/20200301.ty

  • Config description : Wikipedia dataset for ty, parsed from 20200301 dump.

  • Download size : 502.60 KiB

  • Dataset size : 249.88 KiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 1,285

wikipedia/20200301.tyv

  • Config description : Wikipedia dataset for tyv, parsed from 20200301 dump.

  • Download size : 3.22 MiB

  • Dataset size : 7.45 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 2,879

wikipedia/20200301.udm

  • Config description : Wikipedia dataset for udm, parsed from 20200301 dump.

  • Download size : 3.21 MiB

  • Dataset size : 5.94 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 6,067

wikipedia/20200301.ug

  • Config description : Wikipedia dataset for ug, parsed from 20200301 dump.

  • Download size : 5.94 MiB

  • Dataset size : 27.87 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 6,247

wikipedia/20200301.uk

  • Config description : Wikipedia dataset for uk, parsed from 20200301 dump.

  • Download size : 1.45 GiB

  • Dataset size : 3.35 GiB

  • Tự động lưu trữ ( tài liệu ): Không

  • tách:

Tách ra Các ví dụ
'train' 1,347,474

wikipedia/20200301.ur

  • Config description : Wikipedia dataset for ur, parsed from 20200301 dump.

  • Download size : 143.42 MiB

  • Dataset size : 222.05 MiB

  • Tự động lưu trữ ( tài liệu ): Chỉ khi shuffle_files=False (tàu)

  • tách:

Tách ra Các ví dụ
'train' 342,368

wikipedia/20200301.uz

  • Config description : Wikipedia dataset for uz, parsed from 20200301 dump.

  • Download size : 62.85 MiB

  • Dataset size : 94.39 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 154,674

wikipedia/20200301.ve

  • Config description : Wikipedia dataset for ve, parsed from 20200301 dump.

  • Download size : 278.29 KiB

  • Dataset size : 210.46 KiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 450

wikipedia/20200301.vec

  • Config description : Wikipedia dataset for vec, parsed from 20200301 dump.

  • Download size : 11.77 MiB

  • Dataset size : 14.25 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 22,587

wikipedia/20200301.vep

  • Config description : Wikipedia dataset for vep, parsed from 20200301 dump.

  • Download size : 5.58 MiB

  • Dataset size : 8.34 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 7,767

wikipedia/20200301.vi

  • Config description : Wikipedia dataset for vi, parsed from 20200301 dump.

  • Download size : 708.12 MiB

  • Dataset size : 1.22 GiB

  • Tự động lưu trữ ( tài liệu ): Không

  • tách:

Tách ra Các ví dụ
'train' 1,435,673

wikipedia/20200301.vls

  • Config description : Wikipedia dataset for vls, parsed from 20200301 dump.

  • Download size : 6.85 MiB

  • Dataset size : 10.12 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 7,564

wikipedia/20200301.vo

  • Config description : Wikipedia dataset for vo, parsed from 20200301 dump.

  • Download size : 24.16 MiB

  • Dataset size : 80.36 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 124,186

wikipedia/20200301.wa

  • Config description : Wikipedia dataset for wa, parsed from 20200301 dump.

  • Download size : 9.23 MiB

  • Dataset size : 14.37 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 16,047

wikipedia/20200301.war

  • Config description : Wikipedia dataset for war, parsed from 20200301 dump.

  • Download size : 257.48 MiB

  • Dataset size : 412.35 MiB

  • Tự động lưu trữ ( tài liệu ): Không

  • tách:

Tách ra Các ví dụ
'train' 1,264,120

wikipedia/20200301.wo

  • Config description : Wikipedia dataset for wo, parsed from 20200301 dump.

  • Download size : 1.84 MiB

  • Dataset size : 3.06 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 1,604

wikipedia/20200301.wuu

  • Config description : Wikipedia dataset for wuu, parsed from 20200301 dump.

  • Download size : 12.24 MiB

  • Dataset size : 16.20 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 30,773

wikipedia/20200301.xal

  • Config description : Wikipedia dataset for xal, parsed from 20200301 dump.

  • Download size : 1.66 MiB

  • Dataset size : 1.17 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 2,797

wikipedia/20200301.xh

  • Config description : Wikipedia dataset for xh, parsed from 20200301 dump.

  • Download size : 1.38 MiB

  • Dataset size : 1.65 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 1,342

wikipedia/20200301.xmf

  • Config description : Wikipedia dataset for xmf, parsed from 20200301 dump.

  • Download size : 10.50 MiB

  • Dataset size : 25.57 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 15,349

wikipedia/20200301.yi

  • Config description : Wikipedia dataset for yi, parsed from 20200301 dump.

  • Download size : 12.02 MiB

  • Dataset size : 32.21 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 24,376

wikipedia/20200301.yo

  • Config description : Wikipedia dataset for yo, parsed from 20200301 dump.

  • Download size : 12.32 MiB

  • Dataset size : 10.02 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 32,530

wikipedia/20200301.za

  • Config description : Wikipedia dataset for za, parsed from 20200301 dump.

  • Download size : 772.04 KiB

  • Dataset size : 708.21 KiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 2,491

wikipedia/20200301.zea

  • Config description : Wikipedia dataset for zea, parsed from 20200301 dump.

  • Download size : 2.52 MiB

  • Dataset size : 4.45 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 5,575

wikipedia/20200301.zh

  • Config description : Wikipedia dataset for zh, parsed from 20200301 dump.

  • Download size : 1.87 GiB

  • Dataset size : 1.94 GiB

  • Tự động lưu trữ ( tài liệu ): Không

  • tách:

Tách ra Các ví dụ
'train' 1,577,556

wikipedia/20200301.zh-classical

  • Config description : Wikipedia dataset for zh-classical, parsed from 20200301 dump.

  • Download size : 14.44 MiB

  • Dataset size : 9.97 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 11,897

wikipedia/20200301.zh-min-nan

  • Config description : Wikipedia dataset for zh-min-nan, parsed from 20200301 dump.

  • Download size : 55.69 MiB

  • Dataset size : 79.40 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 280,886

wikipedia/20200301.zh-yue

  • Config description : Wikipedia dataset for zh-yue, parsed from 20200301 dump.

  • Download size : 57.83 MiB

  • Dataset size : 61.20 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 77,025

wikipedia/20200301.zu

  • Config description : Wikipedia dataset for zu, parsed from 20200301 dump.

  • Download size : 1.81 MiB

  • Dataset size : 1.28 MiB

  • Tự động lưu trữ ( tài liệu ): Có

  • tách:

Tách ra Các ví dụ
'train' 1,562

wikipedia/20190301.aa

  • Config description : Wikipedia dataset for aa, parsed from 20190301 dump.

  • Download size : 44.09 KiB

  • Kích thước tập dữ liệu: Unknown size

  • Tự động lưu trữ ( tài liệu ): Unknown

  • tách:

Tách ra Các ví dụ
'train' 1

wikipedia/20190301.ab

  • Config description : Wikipedia dataset for ab, parsed from 20190301 dump.

  • Download size : 1.31 MiB

  • Kích thước tập dữ liệu: Unknown size

  • Tự động lưu trữ ( tài liệu ): Unknown

  • tách:

Tách ra Các ví dụ
'train' 4,053

wikipedia/20190301.ace

  • Config description : Wikipedia dataset for ace, parsed from 20190301 dump.

  • Download size : 2.66 MiB

  • Kích thước tập dữ liệu: Unknown size

  • Tự động lưu trữ ( tài liệu ): Unknown

  • tách:

Tách ra Các ví dụ
'train' 9,264

wikipedia/20190301.ady

  • Config description : Wikipedia dataset for ady, parsed from 20190301 dump.

  • Download size : 349.43 KiB

  • Kích thước tập dữ liệu: Unknown size

  • Tự động lưu trữ ( tài liệu ): Unknown

  • tách:

Tách ra Các ví dụ
'train' 547

wikipedia/20190301.af

  • Config description : Wikipedia dataset for af, parsed from 20190301 dump.

  • Download size : 84.13 MiB

  • Kích thước tập dữ liệu: Unknown size

  • Tự động lưu trữ ( tài liệu ): Unknown

  • tách:

Tách ra Các ví dụ
'train' 92,366

wikipedia/20190301.ak

  • Config description : Wikipedia dataset for ak, parsed from 20190301 dump.

  • Download size : 377.84 KiB

  • Kích thước tập dữ liệu: Unknown size

  • Tự động lưu trữ ( tài liệu ): Unknown

  • tách:

Tách ra Các ví dụ
'train' 628

wikipedia/20190301.als

  • Config description : Wikipedia dataset for als, parsed from 20190301 dump.

  • Download size : 46.90 MiB

  • Kích thước tập dữ liệu: Unknown size

  • Tự động lưu trữ ( tài liệu ): Unknown

  • tách:

Tách ra Các ví dụ
'train' 27,705

wikipedia/20190301.am

  • Config description : Wikipedia dataset for am, parsed from 20190301 dump.

  • Download size : 6.54 MiB

  • Kích thước tập dữ liệu: Unknown size

  • Tự động lưu trữ ( tài liệu ): Unknown

  • tách:

Tách ra Các ví dụ
'train' 13,231

wikipedia/20190301.an

  • Config description : Wikipedia dataset for an, parsed from 20190301 dump.

  • Download size : 31.39 MiB

  • Kích thước tập dữ liệu: Unknown size

  • Tự động lưu trữ ( tài liệu ): Unknown

  • tách:

Tách ra Các ví dụ
'train' 47,536

wikipedia/20190301.ang

  • Config description : Wikipedia dataset for ang, parsed from 20190301 dump.

  • Download size : 3.77 MiB

  • Kích thước tập dữ liệu: Unknown size

  • Tự động lưu trữ ( tài liệu ): Unknown

  • tách:

Tách ra Các ví dụ
'train' 3,135

wikipedia/20190301.ar

  • Config description : Wikipedia dataset for ar, parsed from 20190301 dump.

  • Download size : 805.82 MiB

  • Kích thước tập dữ liệu: Unknown size

  • Tự động lưu trữ ( tài liệu ): Unknown

  • tách:

Tách ra Các ví dụ
'train' 1,272,226

wikipedia/20190301.arc

  • Config description : Wikipedia dataset for arc, parsed from 20190301 dump.

  • Download size : 952.49 KiB

  • Kích thước tập dữ liệu: Unknown size

  • Tự động lưu trữ ( tài liệu ): Unknown

  • tách:

Tách ra Các ví dụ
'train' 3,272

wikipedia/20190301.arz

  • Config description : Wikipedia dataset for arz, parsed from 20190301 dump.

  • Download size : 20.32 MiB

  • Kích thước tập dữ liệu: Unknown size

  • Tự động lưu trữ ( tài liệu ): Unknown

  • tách:

Tách ra Các ví dụ
'train' 28,136

wikipedia/20190301.as

  • Config description : Wikipedia dataset for as, parsed from 20190301 dump.

  • Download size : 19.06 MiB

  • Kích thước tập dữ liệu: Unknown size

  • Tự động lưu trữ ( tài liệu ): Unknown

  • tách:

Tách ra Các ví dụ
'train' 5,435

wikipedia/20190301.ast

  • Config description : Wikipedia dataset for ast, parsed from 20190301 dump.

  • Download size : 216.68 MiB

  • Kích thước tập dữ liệu: Unknown size

  • Tự động lưu trữ ( tài liệu ): Unknown

  • tách:

Tách ra Các ví dụ
'train' 106,275

wikipedia/20190301.atj

  • Config description : Wikipedia dataset for atj, parsed from 20190301 dump.

  • Download size : 467.05 KiB

  • Kích thước tập dữ liệu: Unknown size

  • Tự động lưu trữ ( tài liệu ): Unknown

  • tách:

Tách ra Các ví dụ
'train' 1,005

wikipedia/20190301.av

  • Config description : Wikipedia dataset for av, parsed from 20190301 dump.

  • Download size : 3.61 MiB

  • Kích thước tập dữ liệu: Unknown size

  • Tự động lưu trữ ( tài liệu ): Unknown

  • tách:

Tách ra Các ví dụ
'train' 2,918

wikipedia/20190301.ay

  • Config description : Wikipedia dataset for ay, parsed from 20190301 dump.

  • Download size : 2.06 MiB

  • Kích thước tập dữ liệu: Unknown size

  • Tự động lưu trữ ( tài liệu ): Unknown

  • tách:

Tách ra Các ví dụ
'train' 4,773

wikipedia/20190301.az

  • Config description : Wikipedia dataset for az, parsed from 20190301 dump.

  • Download size : 163.04 MiB

  • Kích thước tập dữ liệu: Unknown size

  • Tự động lưu trữ ( tài liệu ): Unknown

  • tách:

Tách ra Các ví dụ
'train' 161,901

wikipedia/20190301.azb

  • Config description : Wikipedia dataset for azb, parsed from 20190301 dump.

  • Download size : 50.59 MiB

  • Kích thước tập dữ liệu: Unknown size

  • Tự động lưu trữ ( tài liệu ): Unknown

  • tách:

Tách ra Các ví dụ
'train' 159,459

wikipedia/20190301.ba

  • Config description : Wikipedia dataset for ba, parsed from 20190301 dump.

  • Download size : 55.04 MiB

  • Kích thước tập dữ liệu: Unknown size

  • Tự động lưu trữ ( tài liệu ): Unknown

  • tách:

Tách ra Các ví dụ
'train' 51,934

wikipedia/20190301.bar

  • Config description : Wikipedia dataset for bar, parsed from 20190301 dump.

  • Download size : 30.14 MiB

  • Kích thước tập dữ liệu: Unknown size

  • Tự động lưu trữ ( tài liệu ): Unknown

  • tách:

Tách ra Các ví dụ
'train' 42,237

wikipedia/20190301.bat-smg

  • Config description : Wikipedia dataset for bat-smg, parsed from 20190301 dump.

  • Download size : 4.61 MiB

  • Kích thước tập dữ liệu: Unknown size

  • Tự động lưu trữ ( tài liệu ): Unknown

  • tách:

Tách ra Các ví dụ
'train' 19,344

wikipedia/20190301.bcl

  • Config description : Wikipedia dataset for bcl, parsed from 20190301 dump.

  • Download size : 6.18 MiB

  • Kích thước tập dữ liệu: Unknown size

  • Tự động lưu trữ ( tài liệu ): Unknown

  • tách:

Tách ra Các ví dụ
'train' 9,025

wikipedia/20190301.be

  • Config description : Wikipedia dataset for be, parsed from 20190301 dump.

  • Download size : 192.23 MiB

  • Kích thước tập dữ liệu: Unknown size

  • Tự động lưu trữ ( tài liệu ): Unknown

  • tách:

Tách ra Các ví dụ
'train' 164,589

wikipedia/20190301.be-x-old

  • Config description : Wikipedia dataset for be-x-old, parsed from 20190301 dump.

  • Download size : 74.77 MiB

  • Kích thước tập dữ liệu: Unknown size

  • Tự động lưu trữ ( tài liệu ): Unknown

  • tách:

Tách ra Các ví dụ
'train' 93,527

wikipedia/20190301.bg

  • Config description : Wikipedia dataset for bg, parsed from 20190301 dump.

  • Download size : 326.20 MiB

  • Kích thước tập dữ liệu: Unknown size

  • Tự động lưu trữ ( tài liệu ): Unknown

  • tách:

Tách ra Các ví dụ
'train' 362,723

wikipedia/20190301.bh

  • Config description : Wikipedia dataset for bh, parsed from 20190301 dump.

  • Download size : 13.28 MiB

  • Kích thước tập dữ liệu: Unknown size

  • Tự động lưu trữ ( tài liệu ): Unknown

  • tách:

Tách ra Các ví dụ
'train' 6,725

wikipedia/20190301.bi

  • Config description : Wikipedia dataset for bi, parsed from 20190301 dump.

  • Download size : 424.88 KiB

  • Kích thước tập dữ liệu: Unknown size

  • Tự động lưu trữ ( tài liệu ): Unknown

  • tách:

Tách ra Các ví dụ
'train' 1,352

wikipedia/20190301.bjn

  • Config description : Wikipedia dataset for bjn, parsed from 20190301 dump.

  • Download size : 2.09 MiB

  • Kích thước tập dữ liệu: Unknown size

  • Tự động lưu trữ ( tài liệu ): Unknown

  • tách:

Tách ra Các ví dụ
'train' 2,476

wikipedia/20190301.bm

  • Config description : Wikipedia dataset for bm, parsed from 20190301 dump.

  • Download size : 447.98 KiB

  • Kích thước tập dữ liệu: Unknown size

  • Tự động lưu trữ ( tài liệu ): Unknown

  • tách:

Tách ra Các ví dụ
'train' 729

wikipedia/20190301.bn

  • Config description : Wikipedia dataset for bn, parsed from 20190301 dump.

  • Download size : 145.04 MiB

  • Kích thước tập dữ liệu: Unknown size

  • Tự động lưu trữ ( tài liệu ): Unknown

  • tách:

Tách ra Các ví dụ
'train' 87,566

wikipedia/20190301.bo

  • Config description : Wikipedia dataset for bo, parsed from 20190301 dump.

  • Download size : 12.41 MiB

  • Kích thước tập dữ liệu: Unknown size

  • Tự động lưu trữ ( tài liệu ): Unknown

  • tách:

Tách ra Các ví dụ
'train' 11,301

wikipedia/20190301.bpy

  • Config description : Wikipedia dataset for bpy, parsed from 20190301 dump.

  • Download size : 5.05 MiB

  • Kích thước tập dữ liệu: Unknown size

  • Tự động lưu trữ ( tài liệu ): Unknown

  • tách:

Tách ra Các ví dụ
'train' 25,360

wikipedia/20190301.br

  • Config description : Wikipedia dataset for br, parsed from 20190301 dump.

  • Download size : 49.14 MiB

  • Kích thước tập dữ liệu: Unknown size

  • Tự động lưu trữ ( tài liệu ): Unknown

  • tách:

Tách ra Các ví dụ
'train' 76,055

wikipedia/20190301.bs

  • Config description : Wikipedia dataset for bs, parsed from 20190301 dump.

  • Download size : 103.26 MiB

  • Kích thước tập dữ liệu: Unknown size

  • Tự động lưu trữ ( tài liệu ): Unknown

  • tách:

Tách ra Các ví dụ
'train' 181,802

wikipedia/20190301.bug

  • Config description : Wikipedia dataset for bug, parsed from 20190301 dump.

  • Download size : 1.76 MiB

  • Kích thước tập dữ liệu: Unknown size

  • Tự động lưu trữ ( tài liệu ): Unknown

  • tách:

Tách ra Các ví dụ
'train' 14,378

wikipedia/20190301.bxr

  • Config description : Wikipedia dataset for bxr, parsed from 20190301 dump.

  • Download size : 3.21 MiB

  • Kích thước tập dữ liệu: Unknown size

  • Tự động lưu trữ ( tài liệu ): Unknown

  • tách:

Tách ra Các ví dụ
'train' 2,594

wikipedia/20190301.ca

  • Config description : Wikipedia dataset for ca, parsed from 20190301 dump.

  • Download size : 849.65 MiB

  • Kích thước tập dữ liệu: Unknown size

  • Tự động lưu trữ ( tài liệu ): Unknown

  • tách:

Tách ra Các ví dụ
'train' 650,189

wikipedia/20190301.cbk-zam

  • Config description : Wikipedia dataset for cbk-zam, parsed from 20190301 dump.

  • Download size : 1.84 MiB

  • Kích thước tập dữ liệu: Unknown size

  • Tự động lưu trữ ( tài liệu ): Unknown

  • tách:

Tách ra Các ví dụ
'train' 3,289

wikipedia/20190301.cdo

  • Config description : Wikipedia dataset for cdo, parsed from 20190301 dump.

  • Download size : 3.22 MiB

  • Kích thước tập dữ liệu: Unknown size

  • Tự động lưu trữ ( tài liệu ): Unknown

  • tách:

Tách ra Các ví dụ
'train' 15,422

wikipedia/20190301.ce

  • Config description : Wikipedia dataset for ce, parsed from 20190301 dump.

  • Download size : 43.89 MiB

  • Kích thước tập dữ liệu: Unknown size

  • Tự động lưu trữ ( tài liệu ): Unknown

  • tách:

Tách ra Các ví dụ
'train' 213,978

wikipedia/20190301.ceb

  • Config description : Wikipedia dataset for ceb, parsed from 20190301 dump.

  • Download size : 1.79 GiB

  • Kích thước tập dữ liệu: Unknown size

  • Tự động lưu trữ ( tài liệu ): Unknown

  • tách:

Tách ra Các ví dụ
'train' 5,379,484

wikipedia/20190301.ch

  • Config description : Wikipedia dataset for ch, parsed from 20190301 dump.

  • Download size : 684.97 KiB

  • Kích thước tập dữ liệu: Unknown size

  • Tự động lưu trữ ( tài liệu ): Unknown

  • tách:

Tách ra Các ví dụ
'train' 496

wikipedia/20190301.cho

  • Config description : Wikipedia dataset for cho, parsed from 20190301 dump.

  • Download size : 25.99 KiB

  • Kích thước tập dữ liệu: Unknown size

  • Tự động lưu trữ ( tài liệu ): Unknown

  • tách:

Tách ra Các ví dụ
'train' 14

wikipedia/20190301.chr

  • Config description : Wikipedia dataset for chr, parsed from 20190301 dump.

  • Download size : 651.25 KiB

  • Kích thước tập dữ liệu: Unknown size

  • Tự động lưu trữ ( tài liệu ): Unknown

  • tách:

Tách ra Các ví dụ
'train' 947

wikipedia/20190301.chy

  • Config description : Wikipedia dataset for chy, parsed from 20190301 dump.

  • Download size : 325.90 KiB

  • Kích thước tập dữ liệu: Unknown size

  • Tự động lưu trữ ( tài liệu ): Unknown

  • tách:

Tách ra Các ví dụ
'train' 773

wikipedia/20190301.ckb

  • Config description : Wikipedia dataset for ckb, parsed from 20190301 dump.

  • Download size : 22.16 MiB

  • Kích thước tập dữ liệu: Unknown size

  • Tự động lưu trữ ( tài liệu ): Unknown

  • tách:

Tách ra Các ví dụ
'train' 23,099

wikipedia/20190301.co

  • Config description : Wikipedia dataset for co, parsed from 20190301 dump.

  • Download size : 3.38 MiB

  • Kích thước tập dữ liệu: Unknown size

  • Tự động lưu trữ ( tài liệu ): Unknown

  • tách:

Tách ra Các ví dụ
'train' 6,232

wikipedia/20190301.cr

  • Config description : Wikipedia dataset for cr, parsed from 20190301 dump.

  • Download size : 259.71 KiB

  • Kích thước tập dữ liệu: Unknown size

  • Tự động lưu trữ ( tài liệu ): Unknown

  • tách:

Tách ra Các ví dụ
'train' 118

wikipedia/20190301.crh

  • Config description : Wikipedia dataset for crh, parsed from 20190301 dump.

  • Download size : 4.01 MiB

  • Kích thước tập dữ liệu: Unknown size

  • Tự động lưu trữ ( tài liệu ): Unknown

  • tách:

Tách ra Các ví dụ
'train' 6,341

wikipedia/20190301.cs

  • Config description : Wikipedia dataset for cs, parsed from 20190301 dump.

  • Download size : 759.21 MiB

  • Kích thước tập dữ liệu: Unknown size

  • Tự động lưu trữ ( tài liệu ): Unknown

  • tách:

Tách ra Các ví dụ
'train' 539,754

wikipedia/20190301.csb

  • Config description : Wikipedia dataset for csb, parsed from 20190301 dump.

  • Download size : 2.03 MiB

  • Kích thước tập dữ liệu: Unknown size

  • Tự động lưu trữ ( tài liệu ): Unknown

  • tách:

Tách ra Các ví dụ
'train' 5,620

wikipedia/20190301.cu

  • Config description : Wikipedia dataset for cu, parsed from 20190301 dump.

  • Download size : 631.49 KiB

  • Kích thước tập dữ liệu: Unknown size

  • Tự động lưu trữ ( tài liệu ): Unknown

  • tách:

Tách ra Các ví dụ
'train' 1,463

wikipedia/20190301.cv

  • Config description : Wikipedia dataset for cv, parsed from 20190301 dump.

  • Download size : 22.23 MiB

  • Kích thước tập dữ liệu: Unknown size

  • Tự động lưu trữ ( tài liệu ): Unknown

  • tách:

Tách ra Các ví dụ
'train' 44,865

wikipedia/20190301.cy

  • Config description : Wikipedia dataset for cy, parsed from 20190301 dump.

  • Download size : 64.37 MiB

  • Kích thước tập dữ liệu: Unknown size

  • Tự động lưu trữ ( tài liệu ): Unknown

  • tách:

Tách ra Các ví dụ
'train' 142,397

wikipedia/20190301.da

  • Config description : Wikipedia dataset for da, parsed from 20190301 dump.

  • Download size : 323.53 MiB

  • Kích thước tập dữ liệu: Unknown size

  • Tự động lưu trữ ( tài liệu ): Unknown

  • tách:

Tách ra Các ví dụ
'train' 244,767

wikipedia/20190301.de

  • Config description : Wikipedia dataset for de, parsed from 20190301 dump.

  • Download size : 4.97 GiB

  • Kích thước tập dữ liệu: Unknown size

  • Tự động lưu trữ ( tài liệu ): Unknown

  • tách:

Tách ra Các ví dụ
'train' 2,925,588

wikipedia/20190301.din

  • Config description : Wikipedia dataset for din, parsed from 20190301 dump.

  • Download size : 457.06 KiB

  • Kích thước tập dữ liệu: Unknown size

  • Tự động lưu trữ ( tài liệu ): Unknown

  • tách:

Tách ra Các ví dụ
'train' 228

wikipedia/20190301.diq

  • Config description : Wikipedia dataset for diq, parsed from 20190301 dump.

  • Download size : 7.24 MiB

  • Kích thước tập dữ liệu: Unknown size

  • Tự động lưu trữ ( tài liệu ): Unknown

  • tách:

Tách ra Các ví dụ
'train' 11,948

wikipedia/20190301.dsb

  • Config description : Wikipedia dataset for dsb, parsed from 20190301 dump.

  • Download size : 3.54 MiB

  • Kích thước tập dữ liệu: Unknown size

  • Tự động lưu trữ ( tài liệu ): Unknown

  • tách:

Tách ra Các ví dụ
'train' 3,438

wikipedia/20190301.dty

  • Config description : Wikipedia dataset for dty, parsed from 20190301 dump.

  • Download size : 4.95 MiB

  • Kích thước tập dữ liệu: Unknown size

  • Tự động lưu trữ ( tài liệu ): Unknown

  • tách:

Tách ra Các ví dụ
'train' 3,323

wikipedia/20190301.dv

  • Config description : Wikipedia dataset for dv, parsed from 20190301 dump.

  • Download size : 4.24 MiB

  • Kích thước tập dữ liệu: Unknown size

  • Tự động lưu trữ ( tài liệu ): Unknown

  • tách:

Tách ra Các ví dụ
'train' 4,156

wikipedia/20190301.dz

  • Config description : Wikipedia dataset for dz, parsed from 20190301 dump.

  • Download size : 360.01 KiB

  • Kích thước tập dữ liệu: Unknown size

  • Tự động lưu trữ ( tài liệu ): Unknown

  • tách:

Tách ra Các ví dụ
'train' 286

wikipedia/20190301.ee

  • Config description : Wikipedia dataset for ee, parsed from 20190301 dump.

  • Download size : 434.14 KiB

  • Kích thước tập dữ liệu: Unknown size

  • Tự động lưu trữ ( tài liệu ): Unknown

  • tách:

Tách ra Các ví dụ
'train' 368

wikipedia/20190301.el

  • Config description : Wikipedia dataset for el, parsed from 20190301 dump.

  • Download size : 324.40 MiB

  • Kích thước tập dữ liệu: Unknown size

  • Tự động lưu trữ ( tài liệu ): Unknown

  • tách:

Tách ra Các ví dụ
'train' 224,159

wikipedia/20190301.eml

  • Config description : Wikipedia dataset for eml, parsed from 20190301 dump.

  • Download size : 7.72 MiB

  • Kích thước tập dữ liệu: Unknown size

  • Tự động lưu trữ ( tài liệu ): Unknown

  • tách:

Tách ra Các ví dụ
'train' 13,957

wikipedia/20190301.en

  • Config description : Wikipedia dataset for en, parsed from 20190301 dump.

  • Download size : 15.72 GiB

  • Kích thước tập dữ liệu: Unknown size

  • Tự động lưu trữ ( tài liệu ): Unknown

  • tách:

Tách ra Các ví dụ
'train' 5,824,596

wikipedia/20190301.eo

  • Config description : Wikipedia dataset for eo, parsed from 20190301 dump.

  • Download size : 245.73 MiB

  • Kích thước tập dữ liệu: Unknown size

  • Tự động lưu trữ ( tài liệu ): Unknown

  • tách:

Tách ra Các ví dụ
'train' 353,663

wikipedia/20190301.es

  • Config description : Wikipedia dataset for es, parsed from 20190301 dump.

  • Download size : 2.93 GiB

  • Kích thước tập dữ liệu: Unknown size

  • Tự động lưu trữ ( tài liệu ): Unknown

  • tách:

Tách ra Các ví dụ
'train' 2,728,167

wikipedia/20190301.et

  • Config description : Wikipedia dataset for et, parsed from 20190301 dump.

  • Download size : 196.03 MiB

  • Kích thước tập dữ liệu: Unknown size

  • Tự động lưu trữ ( tài liệu ): Unknown

  • tách:

Tách ra Các ví dụ
'train' 288,641

wikipedia/20190301.eu

  • Config description : Wikipedia dataset for eu, parsed from 20190301 dump.

  • Download size : 180.35 MiB

  • Kích thước tập dữ liệu: Unknown size

  • Tự động lưu trữ ( tài liệu ): Unknown

  • tách:

Tách ra Các ví dụ
'train' 400,162

wikipedia/20190301.ext

  • Config description : Wikipedia dataset for ext, parsed from 20190301 dump.

  • Download size : 2.40 MiB

  • Kích thước tập dữ liệu: Unknown size

  • Tự động lưu trữ ( tài liệu ): Unknown

  • tách:

Tách ra Các ví dụ
'train' 3,278

wikipedia/20190301.fa

  • Config description : Wikipedia dataset for fa, parsed from 20190301 dump.

  • Download size : 693.84 MiB

  • Kích thước tập dữ liệu: Unknown size

  • Tự động lưu trữ ( tài liệu ): Unknown

  • tách:

Tách ra Các ví dụ
'train' 2,201,990

wikipedia/20190301.ff

  • Config description : Wikipedia dataset for ff, parsed from 20190301 dump.

  • Download size : 387.75 KiB

  • Kích thước tập dữ liệu: Unknown size

  • Tự động lưu trữ ( tài liệu ): Unknown

  • tách:

Tách ra Các ví dụ
'train' 298

wikipedia/20190301.fi

  • Config description : Wikipedia dataset for fi, parsed from 20190301 dump.

  • Download size : 656.44 MiB

  • Kích thước tập dữ liệu: Unknown size

  • Tự động lưu trữ ( tài liệu ): Unknown

  • tách:

Tách ra Các ví dụ
'train' 619,207

wikipedia/20190301.fiu-vro

  • Config description : Wikipedia dataset for fiu-vro, parsed from 20190301 dump.

  • Download size : 2.00 MiB

  • Kích thước tập dữ liệu: Unknown size

  • Tự động lưu trữ ( tài liệu ): Unknown

  • tách:

Tách ra Các ví dụ
'train' 6,050

wikipedia/20190301.fj

  • Config description : Wikipedia dataset for fj, parsed from 20190301 dump.

  • Download size : 262.98 KiB

  • Kích thước tập dữ liệu: Unknown size

  • Tự động lưu trữ ( tài liệu ): Unknown

  • tách:

Tách ra Các ví dụ
'train' 507

wikipedia/20190301.fo

  • Config description : Wikipedia dataset for fo, parsed from 20190301 dump.

  • Download size : 13.67 MiB

  • Kích thước tập dữ liệu: Unknown size

  • Tự động lưu trữ ( tài liệu ): Unknown

  • tách:

Tách ra Các ví dụ
'train' 12,935

wikipedia/20190301.fr

  • Config description : Wikipedia dataset for fr, parsed from 20190301 dump.

  • Download size : 4.14 GiB

  • Kích thước tập dữ liệu: Unknown size

  • Tự động lưu trữ ( tài liệu ): Unknown

  • tách:

Tách ra Các ví dụ
'train' 2,087,215

wikipedia/20190301.frp

  • Config description : Wikipedia dataset for frp, parsed from 20190301 dump.

  • Download size : 2.03 MiB

  • Kích thước tập dữ liệu: Unknown size

  • Tự động lưu trữ ( tài liệu ): Unknown

  • tách:

Tách ra Các ví dụ
'train' 4,262

wikipedia/20190301.frr

  • Config description : Wikipedia dataset for frr, parsed from 20190301 dump.

  • Download size : 7.88 MiB

  • Kích thước tập dữ liệu: Unknown size

  • Tự động lưu trữ ( tài liệu ): Unknown

  • tách:

Tách ra Các ví dụ
'train' 9,706

wikipedia/20190301.fur

  • Config description : Wikipedia dataset for fur, parsed from 20190301 dump.

  • Download size : 2.29 MiB

  • Kích thước tập dữ liệu: Unknown size

  • Tự động lưu trữ ( tài liệu ): Unknown

  • tách:

Tách ra Các ví dụ
'train' 3,508

wikipedia/20190301.fy

  • Config description : Wikipedia dataset for fy, parsed from 20190301 dump.

  • Download size : 45.52 MiB

  • Kích thước tập dữ liệu: Unknown size

  • Tự động lưu trữ ( tài liệu ): Unknown

  • tách:

Tách ra Các ví dụ
'train' 41,573

wikipedia/20190301.ga

  • Config description : Wikipedia dataset for ga, parsed from 20190301 dump.

  • Download size : 24.78 MiB

  • Kích thước tập dữ liệu: Unknown size

  • Tự động lưu trữ ( tài liệu ): Unknown

  • tách:

Tách ra Các ví dụ
'train' 56,252

wikipedia/20190301.gag

  • Config description : Wikipedia dataset for gag, parsed from 20190301 dump.

  • Download size : 2.04 MiB

  • Kích thước tập dữ liệu: Unknown size

  • Tự động lưu trữ ( tài liệu ): Unknown

  • tách:

Tách ra Các ví dụ
'train' 3.034

wikipedia/20190301.gan

  • Config description : Wikipedia dataset for gan, parsed from 20190301 dump.

  • Download size : 3.82 MiB

  • Kích thước tập dữ liệu: Unknown size

  • Tự động lưu trữ ( tài liệu ): Unknown

  • tách:

Tách ra Các ví dụ
'train' 6,503

wikipedia/20190301.gd

  • Config description : Wikipedia dataset for gd, parsed from 20190301 dump.

  • Download size : 8.51 MiB

  • Kích thước tập dữ liệu: Unknown size

  • Tự động lưu trữ ( tài liệu ): Unknown

  • tách:

Tách ra Các ví dụ
'train' 14,891

wikipedia/20190301.gl

  • Config description : Wikipedia dataset for gl, parsed from 20190301 dump.

  • Download size : 235.07 MiB

  • Kích thước tập dữ liệu: Unknown size

  • Tự động lưu trữ ( tài liệu ): Unknown

  • tách:

Tách ra Các ví dụ
'train' 203,961

wikipedia/20190301.glk

  • Config description : Wikipedia dataset for glk, parsed from 20190301 dump.

  • Download size : 1.91 MiB

  • Kích thước tập dữ liệu: Unknown size

  • Tự động lưu trữ ( tài liệu ): Unknown

  • tách:

Tách ra Các ví dụ
'train' 6,432

wikipedia/20190301.gn

  • Config description : Wikipedia dataset for gn, parsed from 20190301 dump.

  • Download size : 3.37 MiB

  • Kích thước tập dữ liệu: Unknown size

  • Tự động lưu trữ ( tài liệu ): Unknown

  • tách:

Tách ra Các ví dụ
'train' 4,337

wikipedia/20190301.gom

  • Config description : Wikipedia dataset for gom, parsed from 20190301 dump.

  • Download size : 6.07 MiB

  • Kích thước tập dữ liệu: Unknown size

  • Tự động lưu trữ ( tài liệu ): Unknown

  • tách:

Tách ra Các ví dụ
'train' 4,259

wikipedia/20190301.gor

  • Config description : Wikipedia dataset for gor, parsed from 20190301 dump.

  • Download size : 1.28 MiB

  • Kích thước tập dữ liệu: Unknown size

  • Tự động lưu trữ ( tài liệu ): Unknown

  • tách:

Tách ra Các ví dụ
'train' 3,467

wikipedia/20190301.got

  • Config description : Wikipedia dataset for got, parsed from 20190301 dump.

  • Download size : 604.10 KiB

  • Kích thước tập dữ liệu: Unknown size

  • Tự động lưu trữ ( tài liệu ): Unknown

  • tách:

Tách ra Các ví dụ
'train' 715

wikipedia/20190301.gu

  • Config description : Wikipedia dataset for gu, parsed from 20190301 dump.

  • Download size : 27.23 MiB

  • Kích thước tập dữ liệu: Unknown size

  • Tự động lưu trữ ( tài liệu ): Unknown

  • tách:

Tách ra Các ví dụ
'train' 28,607

wikipedia/20190301.gv

  • Config description : Wikipedia dataset for gv, parsed from 20190301 dump.

  • Download size : 5.32 MiB

  • Kích thước tập dữ liệu: Unknown size

  • Tự động lưu trữ ( tài liệu ): Unknown

  • tách:

Tách ra Các ví dụ
'train' 4,996

wikipedia/20190301.ha

  • Config description : Wikipedia dataset for ha, parsed from 20190301 dump.

  • Download size : 1.62 MiB

  • Kích thước tập dữ liệu: Unknown size

  • Tự động lưu trữ ( tài liệu ): Unknown

  • tách:

Tách ra Các ví dụ
'train' 3,795

wikipedia/20190301.hak

  • Config description : Wikipedia dataset for hak, parsed from 20190301 dump.

  • Download size : 3.28 MiB

  • Kích thước tập dữ liệu: Unknown size

  • Tự động lưu trữ ( tài liệu ): Unknown

  • tách:

Tách ra Các ví dụ
'train' 11,445

wikipedia/20190301.haw

  • Config description : Wikipedia dataset for haw, parsed from 20190301 dump.

  • Download size : 1017.76 KiB

  • Kích thước tập dữ liệu: Unknown size

  • Tự động lưu trữ ( tài liệu ): Unknown

  • tách:

Tách ra Các ví dụ
'train' 3,935

wikipedia/20190301.he

  • Config description : Wikipedia dataset for he, parsed from 20190301 dump.

  • Download size : 572.30 MiB

  • Kích thước tập dữ liệu: Unknown size

  • Tự động lưu trữ ( tài liệu ): Unknown

  • tách:

Tách ra Các ví dụ
'train' 393,436

wikipedia/20190301.hi

  • Config description : Wikipedia dataset for hi, parsed from 20190301 dump.

  • Download size : 137.86 MiB

  • Kích thước tập dữ liệu: Unknown size

  • Tự động lưu trữ ( tài liệu ): Unknown

  • tách:

Tách ra Các ví dụ
'train' 156,142

wikipedia/20190301.hif

  • Config description : Wikipedia dataset for hif, parsed from 20190301 dump.

  • Download size : 4.57 MiB

  • Kích thước tập dữ liệu: Unknown size

  • Tự động lưu trữ ( tài liệu ): Unknown

  • tách:

Tách ra Các ví dụ
'train' 10,036

wikipedia/20190301.ho

  • Config description : Wikipedia dataset for ho, parsed from 20190301 dump.

  • Download size : 18.37 KiB

  • Kích thước tập dữ liệu: Unknown size

  • Tự động lưu trữ ( tài liệu ): Unknown

  • tách:

Tách ra Các ví dụ
'train' 3

wikipedia/20190301.hr

  • Config description : Wikipedia dataset for hr, parsed from 20190301 dump.

  • Download size : 246.05 MiB

  • Kích thước tập dữ liệu: Unknown size

  • Tự động lưu trữ ( tài liệu ): Unknown

  • tách:

Tách ra Các ví dụ
'train' 228,044

wikipedia/20190301.hsb

  • Config description : Wikipedia dataset for hsb, parsed from 20190301 dump.

  • Download size : 10.38 MiB

  • Kích thước tập dữ liệu: Unknown size

  • Tự động lưu trữ ( tài liệu ): Unknown

  • tách:

Tách ra Các ví dụ
'train' 14,693

wikipedia/20190301.ht

  • Config description : Wikipedia dataset for ht, parsed from 20190301 dump.

  • Download size : 10.23 MiB

  • Kích thước tập dữ liệu: Unknown size

  • Tự động lưu trữ ( tài liệu ): Unknown

  • tách:

Tách ra Các ví dụ
'train' 56,093

wikipedia/20190301.hu

  • Config description : Wikipedia dataset for hu, parsed from 20190301 dump.

  • Download size : 810.17 MiB

  • Kích thước tập dữ liệu: Unknown size

  • Tự động lưu trữ ( tài liệu ): Unknown

  • tách:

Tách ra Các ví dụ
'train' 625,614

wikipedia/20190301.hy

  • Config description : Wikipedia dataset for hy, parsed from 20190301 dump.

  • Download size : 277.53 MiB

  • Kích thước tập dữ liệu: Unknown size

  • Tự động lưu trữ ( tài liệu ): Unknown

  • tách:

Tách ra Các ví dụ
'train' 575,357

wikipedia/20190301.ia

  • Config description : Wikipedia dataset for ia, parsed from 20190301 dump.

  • Download size : 7.85 MiB

  • Kích thước tập dữ liệu: Unknown size

  • Tự động lưu trữ ( tài liệu ): Unknown

  • tách:

Tách ra Các ví dụ
'train' 18,780

wikipedia/20190301.id

  • Config description : Wikipedia dataset for id, parsed from 20190301 dump.

  • Download size : 523.94 MiB

  • Kích thước tập dữ liệu: Unknown size

  • Tự động lưu trữ ( tài liệu ): Unknown

  • tách:

Tách ra Các ví dụ
'train' 947,627

wikipedia/20190301.ie

  • Config description : Wikipedia dataset for ie, parsed from 20190301 dump.

  • Download size : 1.70 MiB

  • Kích thước tập dữ liệu: Unknown size

  • Tự động lưu trữ ( tài liệu ): Unknown

  • tách:

Tách ra Các ví dụ
'train' 4,403

wikipedia/20190301.ig

  • Config description : Wikipedia dataset for ig, parsed from 20190301 dump.

  • Download size : 1.00 MiB

  • Kích thước tập dữ liệu: Unknown size

  • Tự động lưu trữ ( tài liệu ): Unknown

  • tách:

Tách ra Các ví dụ
'train' 2,710

wikipedia/20190301.ii

  • Config description : Wikipedia dataset for ii, parsed from 20190301 dump.

  • Download size : 30.88 KiB

  • Kích thước tập dữ liệu: Unknown size

  • Tự động lưu trữ ( tài liệu ): Unknown

  • tách:

Tách ra Các ví dụ
'train' 14

wikipedia/20190301.ik

  • Config description : Wikipedia dataset for ik, parsed from 20190301 dump.

  • Download size : 238.12 KiB

  • Kích thước tập dữ liệu: Unknown size

  • Tự động lưu trữ ( tài liệu ): Unknown

  • tách:

Tách ra Các ví dụ
'train' 647

wikipedia/20190301.ilo

  • Config description : Wikipedia dataset for ilo, parsed from 20190301 dump.

  • Download size : 15.22 MiB

  • Kích thước tập dữ liệu: Unknown size

  • Tự động lưu trữ ( tài liệu ): Unknown

  • tách:

Tách ra Các ví dụ
'train' 11,808

wikipedia/20190301.inh

  • Config description : Wikipedia dataset for inh, parsed from 20190301 dump.

  • Download size : 1.26 MiB

  • Kích thước tập dữ liệu: Unknown size

  • Tự động lưu trữ ( tài liệu ): Unknown

  • tách:

Tách ra Các ví dụ
'train' 932

wikipedia/20190301.io

  • Config description : Wikipedia dataset for io, parsed from 20190301 dump.

  • Download size : 12.56 MiB

  • Kích thước tập dữ liệu: Unknown size

  • Tự động lưu trữ ( tài liệu ): Unknown

  • tách:

Tách ra Các ví dụ
'train' 29,629

wikipedia/20190301.is

  • Config description : Wikipedia dataset for is, parsed from 20190301 dump.

  • Download size : 41.86 MiB

  • Kích thước tập dữ liệu: Unknown size

  • Tự động lưu trữ ( tài liệu ): Unknown

  • tách:

Tách ra Các ví dụ
'train' 66,219

wikipedia/20190301.it

  • Config description : Wikipedia dataset for it, parsed from 20190301 dump.

  • Download size : 2.66 GiB

  • Kích thước tập dữ liệu: Unknown size

  • Tự động lưu trữ ( tài liệu ): Unknown

  • tách:

Tách ra Các ví dụ
'train' 1,800,218

wikipedia/20190301.iu

  • Config description : Wikipedia dataset for iu, parsed from 20190301 dump.

  • Download size : 284.06 KiB

  • Kích thước tập dữ liệu: Unknown size

  • Tự động lưu trữ ( tài liệu ): Unknown

  • tách:

Tách ra Các ví dụ
'train' 510

wikipedia/20190301.ja

  • Config description : Wikipedia dataset for ja, parsed from 20190301 dump.

  • Download size : 2.74 GiB

  • Kích thước tập dữ liệu: Unknown size

  • Tự động lưu trữ ( tài liệu ): Unknown

  • tách:

Tách ra Các ví dụ
'train' 1,382,683

wikipedia/20190301.jam

  • Config description : Wikipedia dataset for jam, parsed from 20190301 dump.

  • Download size : 895.29 KiB

  • Kích thước tập dữ liệu: Unknown size

  • Tự động lưu trữ ( tài liệu ): Unknown

  • tách:

Tách ra Các ví dụ
'train' 1,692

wikipedia/20190301.jbo

  • Config description : Wikipedia dataset for jbo, parsed from 20190301 dump.

  • Download size : 1.06 MiB

  • Kích thước tập dữ liệu: Unknown size

  • Tự động lưu trữ ( tài liệu ): Unknown

  • tách:

Tách ra Các ví dụ
'train' 1,301

wikipedia/20190301.jv

  • Config description : Wikipedia dataset for jv, parsed from 20190301 dump.

  • Download size : 39.32 MiB

  • Kích thước tập dữ liệu: Unknown size

  • Tự động lưu trữ ( tài liệu ): Unknown

  • tách:

Tách ra Các ví dụ
'train' 72,893

wikipedia/20190301.ka

  • Config description : Wikipedia dataset for ka, parsed from 20190301 dump.

  • Download size : 131.78 MiB

  • Kích thước tập dữ liệu: Unknown size

  • Tự động lưu trữ ( tài liệu ): Unknown

  • tách:

Tách ra Các ví dụ
'train' 161,290

wikipedia/20190301.kaa

  • Config description : Wikipedia dataset for kaa, parsed from 20190301 dump.

  • Download size : 1.35 MiB

  • Kích thước tập dữ liệu: Unknown size

  • Tự động lưu trữ ( tài liệu ): Unknown

  • tách:

Tách ra Các ví dụ
'train' 2,192

wikipedia/20190301.kab

  • Config description : Wikipedia dataset for kab, parsed from 20190301 dump.

  • Download size : 3.62 MiB

  • Kích thước tập dữ liệu: Unknown size

  • Tự động lưu trữ ( tài liệu ): Unknown

  • tách:

Tách ra Các ví dụ
'train' 3,415

wikipedia/20190301.kbd

  • Config description : Wikipedia dataset for kbd, parsed from 20190301 dump.

  • Download size : 1.65 MiB

  • Kích thước tập dữ liệu: Unknown size

  • Tự động lưu trữ ( tài liệu ): Unknown

  • tách:

Tách ra Các ví dụ
'train' 1,608

wikipedia/20190301.kbp

  • Config description : Wikipedia dataset for kbp, parsed from 20190301 dump.

  • Download size : 1.24 MiB

  • Kích thước tập dữ liệu: Unknown size

  • Tự động lưu trữ ( tài liệu ): Unknown

  • tách:

Tách ra Các ví dụ
'train' 1,706

wikipedia/20190301.kg

  • Config description : Wikipedia dataset for kg, parsed from 20190301 dump.

  • Download size : 439.26 KiB

  • Kích thước tập dữ liệu: Unknown size

  • Tự động lưu trữ ( tài liệu ): Unknown

  • tách:

Tách ra Các ví dụ
'train' 1,240

wikipedia/20190301.ki

  • Config description : Wikipedia dataset for ki, parsed from 20190301 dump.

  • Download size : 370.78 KiB

  • Kích thước tập dữ liệu: Unknown size

  • Tự động lưu trữ ( tài liệu ): Unknown

  • tách:

Tách ra Các ví dụ
'train' 1,482

wikipedia/20190301.kj

  • Config description : Wikipedia dataset for kj, parsed from 20190301 dump.

  • Download size : 16.58 KiB

  • Kích thước tập dữ liệu: Unknown size

  • Tự động lưu trữ ( tài liệu ): Unknown

  • tách:

Tách ra Các ví dụ
'train' 5

wikipedia/20190301.kk

  • Config description : Wikipedia dataset for kk, parsed from 20190301 dump.

  • Download size : 113.46 MiB

  • Kích thước tập dữ liệu: Unknown size

  • Tự động lưu trữ ( tài liệu ): Unknown

  • tách:

Tách ra Các ví dụ
'train' 266,609

wikipedia/20190301.kl

  • Config description : Wikipedia dataset for kl, parsed from 20190301 dump.

  • Download size : 862.51 KiB

  • Kích thước tập dữ liệu: Unknown size

  • Tự động lưu trữ ( tài liệu ): Unknown

  • tách:

Tách ra Các ví dụ
'train' 1,713

wikipedia/20190301.km

  • Config description : Wikipedia dataset for km, parsed from 20190301 dump.

  • Download size : 21.92 MiB

  • Kích thước tập dữ liệu: Unknown size

  • Tự động lưu trữ ( tài liệu ): Unknown

  • tách:

Tách ra Các ví dụ
'train' 10,889

wikipedia/20190301.kn

  • Config description : Wikipedia dataset for kn, parsed from 20190301 dump.

  • Download size : 69.62 MiB

  • Kích thước tập dữ liệu: Unknown size

  • Tự động lưu trữ ( tài liệu ): Unknown

  • tách:

Tách ra Các ví dụ
'train' 24,679

wikipedia/20190301.ko

  • Config description : Wikipedia dataset for ko, parsed from 20190301 dump.

  • Download size : 625.16 MiB

  • Kích thước tập dữ liệu: Unknown size

  • Tự động lưu trữ ( tài liệu ): Unknown

  • tách:

Tách ra Các ví dụ
'train' 980,493

wikipedia/20190301.koi

  • Config description : Wikipedia dataset for koi, parsed from 20190301 dump.

  • Download size : 2.12 MiB

  • Kích thước tập dữ liệu: Unknown size

  • Tự động lưu trữ ( tài liệu ): Unknown

  • tách:

Tách ra Các ví dụ
'train' 3,964

wikipedia/20190301.krc

  • Config description : Wikipedia dataset for krc, parsed from 20190301 dump.

  • Download size : 3.16 MiB

  • Kích thước tập dữ liệu: Unknown size

  • Tự động lưu trữ ( tài liệu ): Unknown

  • tách:

Tách ra Các ví dụ
'train' 2,317

wikipedia/20190301.ks

  • Config description : Wikipedia dataset for ks, parsed from 20190301 dump.

  • Download size : 309.15 KiB

  • Kích thước tập dữ liệu: Unknown size

  • Tự động lưu trữ ( tài liệu ): Unknown

  • tách:

Tách ra Các ví dụ
'train' 399

wikipedia/20190301.ksh

  • Config description : Wikipedia dataset for ksh, parsed from 20190301 dump.

  • Download size : 3.07 MiB

  • Kích thước tập dữ liệu: Unknown size

  • Tự động lưu trữ ( tài liệu ): Unknown

  • tách:

Tách ra Các ví dụ
'train' 3,356

wikipedia/20190301.ku

  • Config description : Wikipedia dataset for ku, parsed from 20190301 dump.

  • Download size : 17.09 MiB

  • Kích thước tập dữ liệu: Unknown size

  • Tự động lưu trữ ( tài liệu ): Unknown

  • tách:

Tách ra Các ví dụ
'train' 30,811

wikipedia/20190301.kv

  • Config description : Wikipedia dataset for kv, parsed from 20190301 dump.

  • Download size : 3.36 MiB

  • Kích thước tập dữ liệu: Unknown size

  • Tự động lưu trữ ( tài liệu ): Unknown

  • tách:

Tách ra Các ví dụ
'train' 6,733

wikipedia/20190301.kw

  • Config description : Wikipedia dataset for kw, parsed from 20190301 dump.

  • Download size : 1.71 MiB

  • Kích thước tập dữ liệu: Unknown size

  • Tự động lưu trữ ( tài liệu ): Unknown

  • tách:

Tách ra Các ví dụ
'train' 3,913

wikipedia/20190301.ky

  • Config description : Wikipedia dataset for ky, parsed from 20190301 dump.

  • Download size : 33.13 MiB

  • Kích thước tập dữ liệu: Unknown size

  • Tự động lưu trữ ( tài liệu ): Unknown

  • tách:

Tách ra Các ví dụ
'train' 79,311

wikipedia/20190301.la

  • Config description : Wikipedia dataset for la, parsed from 20190301 dump.

  • Download size : 82.72 MiB

  • Kích thước tập dữ liệu: Unknown size

  • Tự động lưu trữ ( tài liệu ): Unknown

  • tách:

Tách ra Các ví dụ
'train' 130,161

wikipedia/20190301.lad

  • Config description : Wikipedia dataset for lad, parsed from 20190301 dump.

  • Download size : 3.39 MiB

  • Kích thước tập dữ liệu: Unknown size

  • Tự động lưu trữ ( tài liệu ): Unknown

  • tách:

Tách ra Các ví dụ
'train' 5,261

wikipedia/20190301.lb

  • Config description : Wikipedia dataset for lb, parsed from 20190301 dump.

  • Download size : 45.70 MiB

  • Kích thước tập dữ liệu: Unknown size

  • Tự động lưu trữ ( tài liệu ): Unknown

  • tách:

Tách ra Các ví dụ
'train' 61,607

wikipedia/20190301.lbe

  • Config description : Wikipedia dataset for lbe, parsed from 20190301 dump.

  • Download size : 1.22 MiB

  • Kích thước tập dữ liệu: Unknown size

  • Tự động lưu trữ ( tài liệu ): Unknown

  • tách:

Tách ra Các ví dụ
'train' 1,545

wikipedia/20190301.lez

  • Config description : Wikipedia dataset for lez, parsed from 20190301 dump.

  • Download size : 4.16 MiB

  • Kích thước tập dữ liệu: Unknown size

  • Tự động lưu trữ ( tài liệu ): Unknown

  • tách:

Tách ra Các ví dụ
'train' 4,348

wikipedia/20190301.lfn

  • Config description : Wikipedia dataset for lfn, parsed from 20190301 dump.

  • Download size : 2.81 MiB

  • Kích thước tập dữ liệu: Unknown size

  • Tự động lưu trữ ( tài liệu ): Unknown

  • tách:

Tách ra Các ví dụ
'train' 3,741

wikipedia/20190301.lg

  • Config description : Wikipedia dataset for lg, parsed from 20190301 dump.

  • Download size : 1.58 MiB

  • Kích thước tập dữ liệu: Unknown size

  • Tự động lưu trữ ( tài liệu ): Unknown

  • tách:

Tách ra Các ví dụ
'train' 2,359

wikipedia/20190301.li

  • Config description : Wikipedia dataset for li, parsed from 20190301 dump.

  • Download size : 13.86 MiB

  • Kích thước tập dữ liệu: Unknown size

  • Tự động lưu trữ ( tài liệu ): Unknown

  • tách:

Tách ra Các ví dụ
'train' 14,155

wikipedia/20190301.lij

  • Config description : Wikipedia dataset for lij, parsed from 20190301 dump.

  • Download size : 2.73 MiB

  • Kích thước tập dữ liệu: Unknown size

  • Tự động lưu trữ ( tài liệu ): Unknown

  • tách:

Tách ra Các ví dụ
'train' 4,281

wikipedia/20190301.lmo

  • Config description : Wikipedia dataset for lmo, parsed from 20190301 dump.

  • Download size : 21.34 MiB

  • Kích thước tập dữ liệu: Unknown size

  • Tự động lưu trữ ( tài liệu ): Unknown

  • tách:

Tách ra Các ví dụ
'train' 43,911

wikipedia/20190301.ln

  • Config description : Wikipedia dataset for ln, parsed from 20190301 dump.

  • Download size : 1.83 MiB

  • Kích thước tập dữ liệu: Unknown size

  • Tự động lưu trữ ( tài liệu ): Unknown

  • tách:

Tách ra Các ví dụ
'train' 3,192

wikipedia/20190301.lo

  • Config description : Wikipedia dataset for lo, parsed from 20190301 dump.

  • Download size : 3.44 MiB

  • Kích thước tập dữ liệu: Unknown size

  • Tự động lưu trữ ( tài liệu ): Unknown

  • tách:

Tách ra Các ví dụ
'train' 4,074

wikipedia/20190301.lrc

  • Config description : Wikipedia dataset for lrc, parsed from 20190301 dump.

  • Download size : 4.71 MiB

  • Kích thước tập dữ liệu: Unknown size

  • Tự động lưu trữ ( tài liệu ): Unknown

  • tách:

Tách ra Các ví dụ
'train' 5,774

wikipedia/20190301.lt

  • Config description : Wikipedia dataset for lt, parsed from 20190301 dump.

  • Download size : 174.73 MiB

  • Kích thước tập dữ liệu: Unknown size

  • Tự động lưu trữ ( tài liệu ): Unknown

  • tách:

Tách ra Các ví dụ
'train' 217,121

wikipedia/20190301.ltg

  • Config description : Wikipedia dataset for ltg, parsed from 20190301 dump.

  • Download size : 798.18 KiB

  • Kích thước tập dữ liệu: Unknown size

  • Tự động lưu trữ ( tài liệu ): Unknown

  • tách:

Tách ra Các ví dụ
'train' 920

wikipedia/20190301.lv

  • Config description : Wikipedia dataset for lv, parsed from 20190301 dump.

  • Download size : 127.47 MiB

  • Kích thước tập dữ liệu: Unknown size

  • Tự động lưu trữ ( tài liệu ): Unknown

  • tách:

Tách ra Các ví dụ
'train' 91,567

wikipedia/20190301.mai

  • Config description : Wikipedia dataset for mai, parsed from 20190301 dump.

  • Download size : 10.80 MiB

  • Kích thước tập dữ liệu: Unknown size

  • Tự động lưu trữ ( tài liệu ): Unknown

  • tách:

Tách ra Các ví dụ
'train' 14,523

wikipedia/20190301.map-bms

  • Config description : Wikipedia dataset for map-bms, parsed from 20190301 dump.

  • Download size : 4.49 MiB

  • Kích thước tập dữ liệu: Unknown size

  • Tự động lưu trữ ( tài liệu ): Unknown

  • tách:

Tách ra Các ví dụ
'train' 13,710

wikipedia/20190301.mdf

  • Config description : Wikipedia dataset for mdf, parsed from 20190301 dump.

  • Download size : 1.04 MiB

  • Kích thước tập dữ liệu: Unknown size

  • Tự động lưu trữ ( tài liệu ): Unknown

  • tách:

Tách ra Các ví dụ
'train' 1,344

wikipedia/20190301.mg

  • Config description : Wikipedia dataset for mg, parsed from 20190301 dump.

  • Download size : 25.64 MiB

  • Kích thước tập dữ liệu: Unknown size

  • Tự động lưu trữ ( tài liệu ): Unknown

  • tách:

Tách ra Các ví dụ
'train' 126,066

wikipedia/20190301.mh

  • Config description : Wikipedia dataset for mh, parsed from 20190301 dump.

  • Download size : 27.71 KiB

  • Kích thước tập dữ liệu: Unknown size

  • Tự động lưu trữ ( tài liệu ): Unknown

  • tách:

Tách ra Các ví dụ
'train' 8

wikipedia/20190301.mhr

  • Config description : Wikipedia dataset for mhr, parsed from 20190301 dump.

  • Download size : 5.69 MiB

  • Kích thước tập dữ liệu: Unknown size

  • Tự động lưu trữ ( tài liệu ): Unknown

  • tách:

Tách ra Các ví dụ
'train' 12,204

wikipedia/20190301.mi

  • Config description : Wikipedia dataset for mi, parsed from 20190301 dump.

  • Download size : 1.96 MiB

  • Kích thước tập dữ liệu: Unknown size

  • Tự động lưu trữ ( tài liệu ): Unknown

  • tách:

Tách ra Các ví dụ
'train' 7,174

wikipedia/20190301.min

  • Config description : Wikipedia dataset for min, parsed from 20190301 dump.

  • Download size : 25.05 MiB

  • Kích thước tập dữ liệu: Unknown size

  • Tự động lưu trữ ( tài liệu ): Unknown

  • tách:

Tách ra Các ví dụ
'train' 226,002

wikipedia/20190301.mk

  • Config description : Wikipedia dataset for mk, parsed from 20190301 dump.

  • Download size : 140.69 MiB

  • Kích thước tập dữ liệu: Unknown size

  • Tự động lưu trữ ( tài liệu ): Unknown

  • tách:

Tách ra Các ví dụ
'train' 138,779

wikipedia/20190301.ml

  • Config description : Wikipedia dataset for ml, parsed from 20190301 dump.

  • Download size : 117.24 MiB

  • Kích thước tập dữ liệu: Unknown size

  • Tự động lưu trữ ( tài liệu ): Unknown

  • tách:

Tách ra Các ví dụ
'train' 112,979

wikipedia/20190301.mn

  • Config description : Wikipedia dataset for mn, parsed from 20190301 dump.

  • Download size : 28.23 MiB

  • Kích thước tập dữ liệu: Unknown size

  • Tự động lưu trữ ( tài liệu ): Unknown

  • tách:

Tách ra Các ví dụ
'train' 23,195

wikipedia/20190301.mr

  • Config description : Wikipedia dataset for mr, parsed from 20190301 dump.

  • Download size : 49.58 MiB

  • Kích thước tập dữ liệu: Unknown size

  • Tự động lưu trữ ( tài liệu ): Unknown

  • tách:

Tách ra Các ví dụ
'train' 95,825

wikipedia/20190301.mrj

  • Config description : Wikipedia dataset for mrj, parsed from 20190301 dump.

  • Download size : 3.01 MiB

  • Kích thước tập dữ liệu: Unknown size

  • Tự động lưu trữ ( tài liệu ): Unknown

  • tách:

Tách ra Các ví dụ
'train' 10,826

wikipedia/20190301.ms

  • Config description : Wikipedia dataset for ms, parsed from 20190301 dump.

  • Download size : 205.79 MiB

  • Kích thước tập dữ liệu: Unknown size

  • Tự động lưu trữ ( tài liệu ): Unknown

  • tách:

Tách ra Các ví dụ
'train' 357,957

wikipedia/20190301.mt

  • Config description : Wikipedia dataset for mt, parsed from 20190301 dump.

  • Download size : 8.21 MiB

  • Kích thước tập dữ liệu: Unknown size

  • Tự động lưu trữ ( tài liệu ): Unknown

  • tách:

Tách ra Các ví dụ
'train' 4,610

wikipedia/20190301.mus

  • Config description : Wikipedia dataset for mus, parsed from 20190301 dump.

  • Download size : 14.20 KiB

  • Kích thước tập dữ liệu: Unknown size

  • Tự động lưu trữ ( tài liệu ): Unknown

  • tách:

Tách ra Các ví dụ
'train' 2

wikipedia/20190301.mwl

  • Config description : Wikipedia dataset for mwl, parsed from 20190301 dump.

  • Download size : 8.95 MiB

  • Kích thước tập dữ liệu: Unknown size

  • Tự động lưu trữ ( tài liệu ): Unknown

  • tách: