위키앤

  • 설명 :

WikiANN(PAN-X라고도 함)은 IOB2 형식의 LOC(위치), PER(사람) 및 ORG(조직) 태그로 주석이 달린 Wikipedia 기사로 구성된 다국어 명명된 엔터티 인식 데이터 세트입니다. 이 버전은 Rahimi et al.의 균형 잡힌 열차, 개발 및 테스트 분할에 해당합니다. (2019), 원본 WikiANN 코퍼스의 282개 언어 중 176개 언어를 지원합니다.

FeaturesDict({
    'langs': Sequence(Text(shape=(), dtype=string)),
    'spans': Sequence(Text(shape=(), dtype=string)),
    'tags': Sequence(ClassLabel(shape=(), dtype=int64, num_classes=7)),
    'tokens': Sequence(Text(shape=(), dtype=string)),
})
  • 기능 문서 :
특징 수업 모양 D타입 설명
풍모Dict
언어 시퀀스(텍스트) (없음,)
경간 시퀀스(텍스트) (없음,)
태그 시퀀스(클래스 레이블) (없음,) int64
토큰 시퀀스(텍스트) (없음,)
@inproceedings{rahimi-etal-2019-massively,
    title = "Massively Multilingual Transfer for {NER}",
    author = "Rahimi, Afshin  and
      Li, Yuan  and
      Cohn, Trevor",
    booktitle = "Proceedings of the 57th Annual Meeting of the Association     for Computational Linguistics",
    month = jul,
    year = "2019",
    address = "Florence, Italy",
    publisher = "Association for Computational Linguistics",
    url = "https://www.aclweb.org/anthology/P19-1015",
    pages = "151--164",
}

wikiann/ace(기본 구성)

  • 구성 설명 : Wikiann ace 기차/개발/테스트 분할

  • 데이터 세트 크기 : 54.10 KiB

  • 분할 :

나뉘다
'test' 100
'train' 100
'validation' 100

위키/af

  • 구성 설명 : Wikiann af train/dev/test splits

  • 데이터 세트 크기 : 1.46 MiB

  • 분할 :

나뉘다
'test' 1,000
'train' 5,000
'validation' 1,000

위키/알

  • 구성 설명 : Wikiann als 훈련/개발/테스트 분할

  • 데이터 세트 크기 : 72.71 KiB

  • 분할 :

나뉘다
'test' 100
'train' 100
'validation' 100

위키아/오전

  • 구성 설명 : Wikiann am train/dev/test splits

  • 데이터 세트 크기 : 57.45 KiB

  • 분할 :

나뉘다
'test' 100
'train' 100
'validation' 100

위키/앙

  • 구성 설명 : Wikiann ang train/dev/test splits

  • 데이터 세트 크기 : 54.09 KiB

  • 분할 :

나뉘다
'test' 100
'train' 100
'validation' 100

wikiann/an

  • 구성 설명 : 기차/개발/테스트 분할 Wikiann

  • 데이터 세트 크기 : 453.48 KiB

  • 분할 :

나뉘다
'test' 1,000
'train' 1,000
'validation' 1,000

위키/아크

  • 구성 설명 : Wikiann 아크 트레인/개발/테스트 분할

  • 데이터 세트 크기 : 46.72 KiB

  • 분할 :

나뉘다
'test' 100
'train' 100
'validation' 100

위키/아칸소

  • 구성 설명 : Wikiann ar train/dev/test splits

  • 데이터 세트 크기 : 7.68 MiB

  • 분할 :

나뉘다
'test' 10,000
'train' 20,000
'validation' 10,000

위키앤/arz

  • 구성 설명 : Wikiann arz 기차/개발/테스트 분할

  • 데이터 세트 크기 : 63.88 KiB

  • 분할 :

나뉘다
'test' 100
'train' 100
'validation' 100

위키아나

  • 구성 설명 : 기차/개발/테스트 분할로서의 Wikiann

  • 데이터 세트 크기 : 67.52 KiB

  • 분할 :

나뉘다
'test' 100
'train' 100
'validation' 100

위키앤/아스트

  • 구성 설명 : Wikiann ast train/dev/test splits

  • 데이터 세트 크기 : 530.44 KiB

  • 분할 :

나뉘다
'test' 1,000
'train' 1,000
'validation' 1,000

위키앤/에이

  • 구성 설명 : Wikiann ay 기차/개발/테스트 분할

  • 데이터 세트 크기 : 35.33 KiB

  • 분할 :

나뉘다
'test' 100
'train' 100
'validation' 100

wikiann/az

  • 구성 설명 : Wikiann az train/dev/test splits

  • 데이터 세트 크기 : 2.39 MiB

  • 분할 :

나뉘다
'test' 1,000
'train' 10,000
'validation' 1,000

위키/바

  • 구성 설명 : Wikiann bar train/dev/test splits

  • 데이터 세트 크기 : 43.94 KiB

  • 분할 :

나뉘다
'test' 100
'train' 100
'validation' 100

위키아/바

  • 구성 설명 : Wikiann ba 훈련/개발/테스트 분할

  • 데이터 세트 크기 : 72.95 KiB

  • 분할 :

나뉘다
'test' 100
'train' 100
'validation' 100

wikiann/bat-smg

  • 구성 설명 : Wikiann bat-smg 기차/개발/테스트 분할

  • 데이터 세트 크기 : 63.67 KiB

  • 분할 :

나뉘다
'test' 100
'train' 100
'validation' 100

위키앤/비

  • 구성 설명 : Wikiann은 훈련/개발/테스트 분할입니다.

  • 데이터 세트 크기 : 3.63 MiB

  • 분할 :

나뉘다
'test' 1,000
'train' 15,000
'validation' 1,000

wikiann/be-x-old

  • 구성 설명 : Wikiann be-x-old 기차/개발/테스트 분할

  • 데이터 세트 크기 : 1.95 MiB

  • 분할 :

나뉘다
'test' 1,000
'train' 5,000
'validation' 1,000

위키앤/bg

  • 구성 설명 : Wikiann bg 기차/개발/테스트 분할

  • 데이터 세트 크기 : 8.79 MiB

  • 분할 :

나뉘다
'test' 10,000
'train' 20,000
'validation' 10,000

위키앤/bh

  • 구성 설명 : Wikiann bh 훈련/개발/테스트 분할

  • 데이터 세트 크기 : 80.45 KiB

  • 분할 :

나뉘다
'test' 100
'train' 100
'validation' 100

위키앤/비앤

  • 구성 설명 : Wikiann bn 기차/개발/테스트 분할

  • 데이터 세트 크기 : 2.60 MiB

  • 분할 :

나뉘다
'test' 1,000
'train' 10,000
'validation' 1,000

위키앤보

  • 구성 설명 : Wikiann bo train/dev/test splits

  • 데이터 세트 크기 : 55.98 KiB

  • 분할 :

나뉘다
'test' 100
'train' 100
'validation' 100

위키/br

  • 구성 설명 : Wikiann br 훈련/개발/테스트 분할

  • 데이터 세트 크기 : 504.28 KiB

  • 분할 :

나뉘다
'test' 1,000
'train' 1,000
'validation' 1,000

위키앤/BS

  • 구성 설명 : Wikiann bs 기차/개발/테스트 분할

  • 데이터 세트 크기 : 3.05 MiB

  • 분할 :

나뉘다
'test' 1,000
'train' 15,000
'validation' 1,000

위키앤캐나다

  • 구성 설명 : Wikiann ca 훈련/개발/테스트 분할

  • 데이터 세트 크기 : 5.95 MiB

  • 분할 :

나뉘다
'test' 10,000
'train' 20,000
'validation' 10,000

wikiann/cbk-zam

  • 구성 설명 : Wikiann cbk-zam 기차/개발/테스트 분할

  • 데이터 세트 크기 : 102.73 KiB

  • 분할 :

나뉘다
'test' 100
'train' 100
'validation' 100

wikiann/cdo

  • 구성 설명 : Wikiann cdo 훈련/개발/테스트 분할

  • 데이터 세트 크기 : 76.46 KiB

  • 분할 :

나뉘다
'test' 100
'train' 100
'validation' 100

위키앤/ceb

  • 구성 설명 : Wikiann ceb 기차/개발/테스트 분할

  • 데이터 세트 크기 : 54.40 KiB

  • 분할 :

나뉘다
'test' 100
'train' 100
'validation' 100

wikiann/ce

  • 구성 설명 : Wikiann ce 훈련/개발/테스트 분할

  • 데이터 세트 크기 : 90.21 KiB

  • 분할 :

나뉘다
'test' 100
'train' 100
'validation' 100

위키앤/ckb

  • 구성 설명 : Wikiann ckb 기차/개발/테스트 분할

  • 데이터 세트 크기 : 579.97 KiB

  • 분할 :

나뉘다
'test' 1,000
'train' 1,000
'validation' 1,000

wikiann/co

  • 구성 설명 : Wikiann 공동 학습/개발/테스트 분할

  • 데이터 세트 크기 : 41.70 KiB

  • 분할 :

나뉘다
'test' 100
'train' 100
'validation' 100

위키/crh

  • 구성 설명 : Wikiann crh 훈련/개발/테스트 분할

  • 데이터 세트 크기 : 53.30 KiB

  • 분할 :

나뉘다
'test' 100
'train' 100
'validation' 100

위키앤/csb

  • 구성 설명 : Wikiann csb 기차/개발/테스트 분할

  • 데이터 세트 크기 : 64.54 KiB

  • 분할 :

나뉘다
'test' 100
'train' 100
'validation' 100

wikiann/cs

  • 구성 설명 : Wikiann cs 학습/개발/테스트 분할

  • 데이터 세트 크기 : 7.22 MiB

  • 분할 :

나뉘다
'test' 10,000
'train' 20,000
'validation' 10,000

wikiann/cv

  • 구성 설명 : Wikiann cv 훈련/개발/테스트 분할

  • 데이터 세트 크기 : 66.00 KiB

  • 분할 :

나뉘다
'test' 100
'train' 100
'validation' 100

위키/사이

  • 구성 설명 : Wikiann cy 훈련/개발/테스트 분할

  • 데이터 세트 크기 : 2.08 MiB

  • 분할 :

나뉘다
'test' 1,000
'train' 10,000
'validation' 1,000

위키아/다

  • 구성 설명 : Wikiann da train/dev/test splits

  • 데이터 세트 크기 : 7.14 MiB

  • 분할 :

나뉘다
'test' 10,000
'train' 20,000
'validation' 10,000

wikiann/de

  • 구성 설명 : Wikiann de train/dev/test splits

  • 데이터 세트 크기 : 7.88 MiB

  • 분할 :

나뉘다
'test' 10,000
'train' 20,000
'validation' 10,000

위키앤/디크

  • 구성 설명 : Wikiann diq 기차/개발/테스트 분할

  • 데이터 세트 크기 : 53.87 KiB

  • 분할 :

나뉘다
'test' 100
'train' 100
'validation' 100

위키/dv

  • 구성 설명 : Wikiann dv 기차/개발/테스트 분할

  • 데이터 세트 크기 : 73.24 KiB

  • 분할 :

나뉘다
'test' 100
'train' 100
'validation' 100

위키아/엘

  • 구성 설명 : Wikiann el train/dev/test splits

  • 데이터 세트 크기 : 9.26 MiB

  • 분할 :

나뉘다
'test' 10,000
'train' 20,000
'validation' 10,000

위키앤/eml

  • 구성 설명 : Wikiann EML 훈련/개발/테스트 분할

  • 데이터 세트 크기 : 67.16 KiB

  • 분할 :

나뉘다
'test' 100
'train' 100
'validation' 100

wikiann/ko

  • 구성 설명 : Wikiann en train/dev/test splits

  • 데이터 세트 크기 : 6.97 MiB

  • 분할 :

나뉘다
'test' 10,000
'train' 20,000
'validation' 10,000

위키아/이오

  • 구성 설명 : Wikiann eo 훈련/개발/테스트 분할

  • 데이터 세트 크기 : 5.46 MiB

  • 분할 :

나뉘다
'test' 10,000
'train' 15,000
'validation' 10,000

위키/es

  • 구성 설명 : Wikiann es 훈련/개발/테스트 분할

  • 데이터 세트 크기 : 6.33 MiB

  • 분할 :

나뉘다
'test' 10,000
'train' 20,000
'validation' 10,000

wikiann/et

  • 구성 설명 : Wikiann et train/dev/test splits

  • 데이터 세트 크기 : 6.31 MiB

  • 분할 :

나뉘다
'test' 10,000
'train' 15,000
'validation' 10,000

위키/EU

  • 구성 설명 : Wikiann EU 훈련/개발/테스트 분할

  • 데이터 세트 크기 : 5.82 MiB

  • 분할 :

나뉘다
'test' 10,000
'train' 10,000
'validation' 10,000

위키/내선

  • 구성 설명 : Wikiann ext train/dev/test splits

  • 데이터 세트 크기 : 59.86 KiB

  • 분할 :

나뉘다
'test' 100
'train' 100
'validation' 100

wikiann/fa

  • 구성 설명 : Wikiann fa 훈련/개발/테스트 분할

  • 데이터 세트 크기 : 7.82 MiB

  • 분할 :

나뉘다
'test' 10,000
'train' 20,000
'validation' 10,000

위키/fi

  • 구성 설명 : Wikiann fi 훈련/개발/테스트 분할

  • 데이터 세트 크기 : 7.51 MiB

  • 분할 :

나뉘다
'test' 10,000
'train' 20,000
'validation' 10,000

wikiann/fiu-vro

  • 구성 설명 : Wikiann fiu-vro train/dev/test splits

  • 데이터 세트 크기 : 65.91 KiB

  • 분할 :

나뉘다
'test' 100
'train' 100
'validation' 100

위키/포

  • 구성 설명 : 기차/개발/테스트 분할을 위한 Wikiann

  • 데이터 세트 크기 : 55.92 KiB

  • 분할 :

나뉘다
'test' 100
'train' 100
'validation' 100

wikiann/frr

  • 구성 설명 : Wikiann frr 기차/개발/테스트 분할

  • 데이터 세트 크기 : 41.98 KiB

  • 분할 :

나뉘다
'test' 100
'train' 100
'validation' 100

위키아/fr

  • 구성 설명 : Wikiann fr train/dev/test splits

  • 데이터 세트 크기 : 6.46 MiB

  • 분할 :

나뉘다
'test' 10,000
'train' 20,000
'validation' 10,000

Wikiann/모피

  • 구성 설명 : Wikiann 모피 트레인/개발/테스트 분할

  • 데이터 세트 크기 : 62.83 KiB

  • 분할 :

나뉘다
'test' 100
'train' 100
'validation' 100

위키/fy

  • 구성 설명 : Wikiann fy 훈련/개발/테스트 분할

  • 데이터 세트 크기 : 521.68 KiB

  • 분할 :

나뉘다
'test' 1,000
'train' 1,000
'validation' 1,000

위키앤/간

  • 구성 설명 : Wikiann gan train/dev/test splits

  • 데이터세트 크기 : 45.24 KiB

  • 분할 :

나뉘다
'test' 100
'train' 100
'validation' 100

위키아/가

  • 구성 설명 : Wikiann ga 훈련/개발/테스트 분할

  • 데이터 세트 크기 : 544.53 KiB

  • 분할 :

나뉘다
'test' 1,000
'train' 1,000
'validation' 1,000

위키/gd

  • 구성 설명 : Wikiann gd train/dev/test splits

  • 데이터 세트 크기 : 50.07 KiB

  • 분할 :

나뉘다
'test' 100
'train' 100
'validation' 100

위키앤글/글

  • 구성 설명 : Wikiann gl 훈련/개발/테스트 분할

  • 데이터 세트 크기 : 5.48 MiB

  • 분할 :

나뉘다
'test' 10,000
'train' 15,000
'validation' 10,000

위키아/gn

  • 구성 설명 : Wikiann gn 훈련/개발/테스트 분할

  • 데이터 세트 크기 : 59.81 KiB

  • 분할 :

나뉘다
'test' 100
'train' 100
'validation' 100

wikiann/구

  • 구성 설명 : Wikiann gu train/dev/test splits

  • 데이터 세트 크기 : 105.52 KiB

  • 분할 :

나뉘다
'test' 100
'train' 100
'validation' 100

위키앤/학

  • 구성 설명 : Wikiann 학 훈련/개발/테스트 분할

  • 데이터 세트 크기 : 46.47 KiB

  • 분할 :

나뉘다
'test' 100
'train' 100
'validation' 100

위키앤/그

  • 구성 설명 : Wikiann 그는 학습/개발/테스트 분할

  • 데이터 세트 크기 : 8.55 MiB

  • 분할 :

나뉘다
'test' 10,000
'train' 20,000
'validation' 10,000

위키안/안녕

  • 구성 설명 : Wikiann hi train/dev/test splits

  • 데이터 세트 크기 : 1.59 MiB

  • 분할 :

나뉘다
'test' 1,000
'train' 5,000
'validation' 1,000

위키아/시간

  • 구성 설명 : Wikiann 시간 훈련/개발/테스트 분할

  • 데이터 세트 크기 : 7.12 MiB

  • 분할 :

나뉘다
'test' 10,000
'train' 20,000
'validation' 10,000

위키안/hsb

  • 구성 설명 : Wikiann hsb 기차/개발/테스트 분할

  • 데이터 세트 크기 : 57.13 KiB

  • 분할 :

나뉘다
'test' 100
'train' 100
'validation' 100

위키앤/후

  • 구성 설명 : Wikiann hu 훈련/개발/테스트 분할

  • 데이터 세트 크기 : 7.69 MiB

  • 분할 :

나뉘다
'test' 10,000
'train' 20,000
'validation' 10,000

위키앤/하이

  • 구성 설명 : Wikiann hy 훈련/개발/테스트 분할

  • 데이터 세트 크기 : 3.42 MiB

  • 분할 :

나뉘다
'test' 1,000
'train' 15,000
'validation' 1,000

위키아/ia

  • 구성 설명 : Wikiann ia 기차/개발/테스트 분할

  • 데이터 세트 크기 : 69.12 KiB

  • 분할 :

나뉘다
'test' 100
'train' 100
'validation' 100

wikiann/id

  • 구성 설명 : Wikiann id 기차/개발/테스트 분할

  • 데이터 세트 크기 : 6.14 MiB

  • 분할 :

나뉘다
'test' 10,000
'train' 20,000
'validation' 10,000

wikiann/ig

  • 구성 설명 : Wikiann ig 기차/개발/테스트 분할

  • 데이터 세트 크기 : 42.87 KiB

  • 분할 :

나뉘다
'test' 100
'train' 100
'validation' 100

위키앤/일로

  • 구성 설명 : Wikiann ilo 훈련/개발/테스트 분할

  • 데이터 세트 크기 : 44.54 KiB

  • 분할 :

나뉘다
'test' 100
'train' 100
'validation' 100

위키/io

  • 구성 설명 : Wikiann io 훈련/개발/테스트 분할

  • 데이터 세트 크기 : 46.46 KiB

  • 분할 :

나뉘다
'test' 100
'train' 100
'validation' 100

위키앤/이다

  • 구성 설명 : Wikiann은 훈련/개발/테스트 분할입니다.

  • 데이터 세트 크기 : 552.81 KiB

  • 분할 :

나뉘다
'test' 1,000
'train' 1,000
'validation' 1,000

위키/그것

  • 구성 설명 : Wikiann it 훈련/개발/테스트 분할

  • 데이터 세트 크기 : 6.86 MiB

  • 분할 :

나뉘다
'test' 10,000
'train' 20,000
'validation' 10,000

위키아/ja

  • 구성 설명 : Wikiann ja 훈련/개발/테스트 분할

  • 데이터 세트 크기 : 14.80 MiB

  • 분할 :

나뉘다
'test' 10,000
'train' 20,000
'validation' 10,000

위키앤/jbo

  • 구성 설명 : Wikiann jbo 기차/개발/테스트 분할

  • 데이터 세트 크기 : 42.70 KiB

  • 분할 :

나뉘다
'test' 100
'train' 100
'validation' 100

위키앤/jv

  • 구성 설명 : Wikiann jv 훈련/개발/테스트 분할

  • 데이터 세트 크기 : 46.62 KiB

  • 분할 :

나뉘다
'test' 100
'train' 100
'validation' 100

위키앤/카

  • 구성 설명 : Wikiann ka 훈련/개발/테스트 분할

  • 데이터 세트 크기 : 8.47 MiB

  • 분할 :

나뉘다
'test' 10,000
'train' 10,000
'validation' 10,000

wikiann/kk

  • 구성 설명 : Wikiann kk 기차/개발/테스트 분할

  • 데이터 세트 크기 : 696.23 KiB

  • 분할 :

나뉘다
'test' 1,000
'train' 1,000
'validation' 1,000

위키안/km

  • 구성 설명 : Wikiann km 기차/개발/테스트 분할

  • 데이터 세트 크기 : 90.85 KiB

  • 분할 :

나뉘다
'test' 100
'train' 100
'validation' 100

위키/kn

  • 구성 설명 : Wikiann kn 기차/개발/테스트 분할

  • 데이터 세트 크기 : 87.73 KiB

  • 분할 :

나뉘다
'test' 100
'train' 100
'validation' 100

wikiann/코

  • 구성 설명 : Wikiann ko 훈련/개발/테스트 분할

  • 데이터 세트 크기 : 7.81 MiB

  • 분할 :

나뉘다
'test' 10,000
'train' 20,000
'validation' 10,000

위키앤/ksh

  • 구성 설명 : Wikiann ksh 기차/개발/테스트 분할

  • 데이터 세트 크기 : 57.31 KiB

  • 분할 :

나뉘다
'test' 100
'train' 100
'validation' 100

wikiann/구

  • 구성 설명 : Wikiann ku 훈련/개발/테스트 분할

  • 데이터 세트 크기 : 51.26 KiB

  • 분할 :

나뉘다
'test' 100
'train' 100
'validation' 100

wikiann/ky

  • 구성 설명 : Wikiann ky train/dev/test splits

  • 데이터 세트 크기 : 75.74 KiB

  • 분할 :

나뉘다
'test' 100
'train' 100
'validation' 100

위키앤/라

  • 구성 설명 : Wikiann la train/dev/test splits

  • 데이터 세트 크기 : 1.15 MiB

  • 분할 :

나뉘다
'test' 1,000
'train' 5,000
'validation' 1,000

위키/파운드

  • 구성 설명 : Wikiann lb 기차/개발/테스트 분할

  • 데이터 세트 크기 : 1.28 MiB

  • 분할 :

나뉘다
'test' 1,000
'train' 5,000
'validation' 1,000

위키앤/리즈

  • 구성 설명 : Wikiann lij train/dev/test splits

  • 데이터 세트 크기 : 61.82 KiB

  • 분할 :

나뉘다
'test' 100
'train' 100
'validation' 100

위키앤/리

  • 구성 설명 : Wikiann li 훈련/개발/테스트 분할

  • 데이터 세트 크기 : 47.45 KiB

  • 분할 :

나뉘다
'test' 100
'train' 100
'validation' 100

wikiann/lmo

  • 구성 설명 : Wikiann lmo 기차/개발/테스트 분할

  • 데이터 세트 크기 : 60.66 KiB

  • 분할 :

나뉘다
'test' 100
'train' 100
'validation' 100

위키아/ln

  • 구성 설명 : Wikiann ln 기차/개발/테스트 분할

  • 데이터 세트 크기 : 53.14 KiB

  • 분할 :

나뉘다
'test' 100
'train' 100
'validation' 100

wikiann/lt

  • 구성 설명 : Wikiann lt 기차/개발/테스트 분할

  • 데이터 세트 크기 : 5.09 MiB

  • 분할 :

나뉘다
'test' 10,000
'train' 10,000
'validation' 10,000

wikiann/lv

  • 구성 설명 : Wikiann lv 기차/개발/테스트 분할

  • 데이터 세트 크기 : 5.07 MiB

  • 분할 :

나뉘다
'test' 10,000
'train' 10,000
'validation' 10,000

wikiann/map-bms

  • 구성 설명 : Wikiann map-bms 기차/개발/테스트 분할

  • 데이터 세트 크기 : 53.08 KiB

  • 분할 :

나뉘다
'test' 100
'train' 100
'validation' 100

위키앤/mg

  • 구성 설명 : Wikiann mg 기차/개발/테스트 분할

  • 데이터 세트 크기 : 54.92 KiB

  • 분할 :

나뉘다
'test' 100
'train' 100
'validation' 100

위키앤/mhr

  • 구성 설명 : Wikiann mhr 기차/개발/테스트 분할

  • 데이터 세트 크기 : 57.46 KiB

  • 분할 :

나뉘다
'test' 100
'train' 100
'validation' 100

위키안/분

  • 구성 설명 : Wikiann 최소 학습/개발/테스트 분할

  • 데이터 세트 크기 : 59.47 KiB

  • 분할 :

나뉘다
'test' 100
'train' 100
'validation' 100

wikiann/mi

  • 구성 설명 : Wikiann mi train/dev/test splits

  • 데이터 세트 크기 : 75.39 KiB

  • 분할 :

나뉘다
'test' 100
'train' 100
'validation' 100

위키앤/mk

  • 구성 설명 : Wikiann mk 기차/개발/테스트 분할

  • 데이터 세트 크기 : 3.03 MiB

  • 분할 :

나뉘다
'test' 1,000
'train' 10,000
'validation' 1,000

위키앤/ml

  • 구성 설명 : Wikiann ml 학습/개발/테스트 분할

  • 데이터 세트 크기 : 3.68 MiB

  • 분할 :

나뉘다
'test' 1,000
'train' 10,000
'validation' 1,000

위키아/mn

  • 구성 설명 : Wikiann mn 기차/개발/테스트 분할

  • 데이터 세트 크기 : 57.44 KiB

  • 분할 :

나뉘다
'test' 100
'train' 100
'validation' 100

위키앤/씨

  • 구성 설명 : Wikiann mr train/dev/test splits

  • 데이터 세트 크기 : 1.88 MiB

  • 분할 :

나뉘다
'test' 1,000
'train' 5,000
'validation' 1,000

wikiann/ms

  • 구성 설명 : Wikiann ms 훈련/개발/테스트 분할

  • 데이터 세트 크기 : 3.33 MiB

  • 분할 :

나뉘다
'test' 1,000
'train' 20,000
'validation' 1,000

위키앤/엠티

  • 구성 설명 : Wikiann mt 기차/개발/테스트 분할

  • 데이터 세트 크기 : 56.14 KiB

  • 분할 :

나뉘다
'test' 100
'train' 100
'validation' 100

위키앤/mwl

  • 구성 설명 : Wikiann mwl 기차/개발/테스트 분할

  • 데이터 세트 크기 : 90.71 KiB

  • 분할 :

나뉘다
'test' 100
'train' 100
'validation' 100

위키앤/내

  • 구성 설명 : Wikiann my train/dev/test splits

  • 데이터 세트 크기 : 120.06 KiB

  • 분할 :

나뉘다
'test' 100
'train' 100
'validation' 100

위키앤/mzn

  • 구성 설명 : Wikiann mzn 기차/개발/테스트 분할

  • 데이터 세트 크기 : 60.55 KiB

  • 분할 :

나뉘다
'test' 100
'train' 100
'validation' 100

위키앤/낮잠

  • 구성 설명 : Wikiann 낮잠 훈련/개발/테스트 분할

  • 데이터 세트 크기 : 54.66 KiB

  • 분할 :

나뉘다
'test' 100
'train' 100
'validation' 100

위키앤/nds

  • 구성 설명 : Wikiann nds 기차/개발/테스트 분할

  • 데이터 세트 크기 : 59.27 KiB

  • 분할 :

나뉘다
'test' 100
'train' 100
'validation' 100

위키/네

  • 구성 설명 : Wikiann ne train/dev/test splits

  • 데이터 세트 크기 : 86.38 KiB

  • 분할 :

나뉘다
'test' 100
'train' 100
'validation' 100

위키/nl

  • 구성 설명 : Wikiann nl 훈련/개발/테스트 분할

  • 데이터 세트 크기 : 7.03 MiB

  • 분할 :

나뉘다
'test' 10,000
'train' 20,000
'validation' 10,000

위키아/nn

  • 구성 설명 : Wikiann nn 훈련/개발/테스트 분할

  • 데이터 세트 크기 : 4.23 MiB

  • 분할 :

나뉘다
'test' 1,000
'train' 20,000
'validation' 1,000

위키/아니오

  • 구성 설명 : Wikiann 훈련/개발/테스트 분할 없음

  • 데이터 세트 크기 : 7.45 MiB

  • 분할 :

나뉘다
'test' 10,000
'train' 20,000
'validation' 10,000

wikiann/nov

  • 구성 설명 : Wikiann nov 기차/개발/테스트 분할

  • 데이터 세트 크기 : 41.55 KiB

  • 분할 :

나뉘다
'test' 100
'train' 100
'validation' 100

wikiann/oc

  • 구성 설명 : Wikiann oc 훈련/개발/테스트 분할

  • 데이터 세트 크기 : 47.08 KiB

  • 분할 :

나뉘다
'test' 100
'train' 100
'validation' 100

위키/또는

  • 구성 설명 : Wikiann 또는 훈련/개발/테스트 분할

  • 데이터 세트 크기 : 78.96 KiB

  • 분할 :

나뉘다
'test' 100
'train' 100
'validation' 100

위키/os

  • 구성 설명 : Wikiann os 훈련/개발/테스트 분할

  • 데이터 세트 크기 : 64.83 KiB

  • 분할 :

나뉘다
'test' 100
'train' 100
'validation' 100

위키앤/파

  • 구성 설명 : Wikiann pa 훈련/개발/테스트 분할

  • 데이터 세트 크기 : 65.44 KiB

  • 분할 :

나뉘다
'test' 100
'train' 100
'validation' 100

위키앤/pdc

  • 구성 설명 : Wikiann pdc 기차/개발/테스트 분할

  • 데이터 세트 크기 : 54.89 KiB

  • 분할 :

나뉘다
'test' 100
'train' 100
'validation' 100

위키/pl

  • 구성 설명 : Wikiann pl 기차/개발/테스트 분할

  • 데이터 세트 크기 : 7.25 MiB

  • 분할 :

나뉘다
'test' 10,000
'train' 20,000
'validation' 10,000

위키앤/pms

  • 구성 설명 : Wikiann pms 기차/개발/테스트 분할

  • 데이터 세트 크기 : 60.25 KiB

  • 분할 :

나뉘다
'test' 100
'train' 100
'validation' 100

위키앤/pnb

  • 구성 설명 : Wikiann pnb 기차/개발/테스트 분할

  • 데이터 세트 크기 : 51.34 KiB

  • 분할 :

나뉘다
'test' 100
'train' 100
'validation' 100

위키/ps

  • 구성 설명 : Wikiann ps 기차/개발/테스트 분할

  • 데이터 세트 크기 : 102.92 KiB

  • 분할 :

나뉘다
'test' 100
'train' 100
'validation' 100

위키앤/pt

  • 구성 설명 : Wikiann pt 기차/개발/테스트 분할

  • 데이터 세트 크기 : 6.24 MiB

  • 분할 :

나뉘다
'test' 10,000
'train' 20,000
'validation' 10,000

wikiann/qu

  • 구성 설명 : Wikiann qu 훈련/개발/테스트 분할

  • 데이터 세트 크기 : 44.98 KiB

  • 분할 :

나뉘다
'test' 100
'train' 100
'validation' 100

위키앤/RM

  • 구성 설명 : Wikiann rm 기차/개발/테스트 분할

  • 데이터 세트 크기 : 67.64 KiB

  • 분할 :

나뉘다
'test' 100
'train' 100
'validation' 100

위키앤로

  • 구성 설명 : Wikiann ro 훈련/개발/테스트 분할

  • 데이터 세트 크기 : 6.57 MiB

  • 분할 :

나뉘다
'test' 10,000
'train' 20,000
'validation' 10,000

wikiann/ru

  • 구성 설명 : Wikiann ru 기차/개발/테스트 분할

  • 데이터 세트 크기 : 8.39 MiB

  • 분할 :

나뉘다
'test' 10,000
'train' 20,000
'validation' 10,000

위키앤/rw

  • 구성 설명 : Wikiann rw 기차/개발/테스트 분할

  • 데이터 세트 크기 : 42.88 KiB

  • 분할 :

나뉘다
'test' 100
'train' 100
'validation' 100

위키앤/사

  • 구성 설명 : Wikiann sah 훈련/개발/테스트 분할

  • 데이터 세트 크기 : 68.91 KiB

  • 분할 :

나뉘다
'test' 100
'train' 100
'validation' 100

위키앤/사

  • 구성 설명 : Wikiann sa 훈련/개발/테스트 분할

  • 데이터 세트 크기 : 120.55 KiB

  • 분할 :

나뉘다
'test' 100
'train' 100
'validation' 100

wikiann/scn

  • 구성 설명 : Wikiann scn 기차/개발/테스트 분할

  • 데이터 세트 크기 : 47.93 KiB

  • 분할 :

나뉘다
'test' 100
'train' 100
'validation' 100

위키앤스코

  • 구성 설명 : Wikiann sco 훈련/개발/테스트 분할

  • 데이터 세트 크기 : 50.61 KiB

  • 분할 :

나뉘다
'test' 100
'train' 100
'validation' 100

위키앤/sd

  • 구성 설명 : Wikiann sd 기차/개발/테스트 분할

  • 데이터 세트 크기 : 98.67 KiB

  • 분할 :

나뉘다
'test' 100
'train' 100
'validation' 100

위키앤/쉬

  • 구성 설명 : Wikiann sh 학습/개발/테스트 분할

  • 데이터 세트 크기 : 5.86 MiB

  • 분할 :

나뉘다
'test' 10,000
'train' 20,000
'validation' 10,000

위키앤/심플

  • 구성 설명 : Wikiann 단순 학습/개발/테스트 분할

  • 데이터 세트 크기 : 4.23 MiB

  • 분할 :

나뉘다
'test' 1,000
'train' 20,000
'validation' 1,000

wikiann/si

  • 구성 설명 : Wikiann si 훈련/개발/테스트 분할

  • 데이터 세트 크기 : 80.41 KiB

  • 분할 :

나뉘다
'test' 100
'train' 100
'validation' 100

wikiann/sk

  • 구성 설명 : Wikiann sk train/dev/test splits

  • 데이터 세트 크기 : 7.01 MiB

  • 분할 :

나뉘다
'test' 10,000
'train' 20,000
'validation' 10,000

wikiann/sl

  • 구성 설명 : Wikiann sl 기차/개발/테스트 분할

  • 데이터 세트 크기 : 5.61 MiB

  • 분할 :

나뉘다
'test' 10,000
'train' 15,000
'validation' 10,000

위키앤/그래서

  • 구성 설명 : Wikiann 그래서 훈련/개발/테스트 분할

  • 데이터 세트 크기 : 48.82 KiB

  • 분할 :

나뉘다
'test' 100
'train' 100
'validation' 100

위키앤/스퀘어

  • 구성 설명 : Wikiann sq train/dev/test 분할

  • 데이터 세트 크기 : 1.11 MiB

  • 분할 :

나뉘다
'test' 1,000
'train' 5,000
'validation' 1,000

위키앤/sr

  • 구성 설명 : Wikiann sr 훈련/개발/테스트 분할

  • 데이터 세트 크기 : 8.22 MiB

  • 분할 :

나뉘다
'test' 10,000
'train' 20,000
'validation' 10,000

wikiann/su

  • 구성 설명 : Wikiann su train/dev/test splits

  • 데이터세트 크기 : 51.14 KiB

  • 분할 :

나뉘다
'test' 100
'train' 100
'validation' 100

wikiann/sv

  • 구성 설명 : Wikiann sv 훈련/개발/테스트 분할

  • 데이터 세트 크기 : 7.70 MiB

  • 분할 :

나뉘다
'test' 10,000
'train' 20,000
'validation' 10,000

wikiann/sw

  • 구성 설명 : Wikiann sw 훈련/개발/테스트 분할

  • 데이터 세트 크기 : 427.56 KiB

  • 분할 :

나뉘다
'test' 1,000
'train' 1,000
'validation' 1,000

위키앤/szl

  • 구성 설명 : Wikiann szl 기차/개발/테스트 분할

  • 데이터 세트 크기 : 46.39 KiB

  • 분할 :

나뉘다
'test' 100
'train' 100
'validation' 100

위키/타

  • 구성 설명 : Wikiann ta train/dev/test splits

  • 데이터 세트 크기 : 5.08 MiB

  • 분할 :

나뉘다
'test' 1,000
'train' 15,000
'validation' 1,000

위키/테

  • 구성 설명 : Wikiann te train/dev/test splits

  • 데이터 세트 크기 : 906.64 KiB

  • 분할 :

나뉘다
'test' 1,000
'train' 1,000
'validation' 1,000

wikiann/tg

  • 구성 설명 : Wikiann tg 기차/개발/테스트 분할

  • 데이터 세트 크기 : 67.61 KiB

  • 분할 :

나뉘다
'test' 100
'train' 100
'validation' 100

위키아/th

  • 구성 설명 : Wikiann th train/dev/test splits

  • 데이터 세트 크기 : 29.46 MiB

  • 분할 :

나뉘다
'test' 10,000
'train' 20,000
'validation' 10,000

위키앤/tk

  • 구성 설명 : Wikiann tk 기차/개발/테스트 분할

  • 데이터 세트 크기 : 49.70 KiB

  • 분할 :

나뉘다
'test' 100
'train' 100
'validation' 100

위키아/tl

  • 구성 설명 : Wikiann tl 기차/개발/테스트 분할

  • 데이터 세트 크기 : 1.60 MiB

  • 분할 :

나뉘다
'test' 1,000
'train' 10,000
'validation' 1,000

위키아/tr

  • 구성 설명 : Wikiann tr 기차/개발/테스트 분할

  • 데이터 세트 크기 : 6.94 MiB

  • 분할 :

나뉘다
'test' 10,000
'train' 20,000
'validation' 10,000

wikiann/tt

  • 구성 설명 : Wikiann tt 기차/개발/테스트 분할

  • 데이터 세트 크기 : 684.14 KiB

  • 분할 :

나뉘다
'test' 1,000
'train' 1,000
'validation' 1,000

위키/ug

  • 구성 설명 : Wikiann ug train/dev/test splits

  • 데이터 세트 크기 : 75.12 KiB

  • 분할 :

나뉘다
'test' 100
'train' 100
'validation' 100

위키아/영국

  • 구성 설명 : Wikiann 영국 기차/개발/테스트 분할

  • 데이터 세트 크기 : 9.39 MiB

  • 분할 :

나뉘다
'test' 10,000
'train' 20,000
'validation' 10,000

위키아/ur

  • 구성 설명 : Wikiann ur train/dev/test splits

  • 데이터 세트 크기 : 3.95 MiB

  • 분할 :

나뉘다
'test' 1,000
'train' 20,000
'validation' 1,000

wikiann/uz

  • 구성 설명 : Wikiann uz 기차/개발/테스트 분할

  • 데이터 세트 크기 : 469.58 KiB

  • 분할 :

나뉘다
'test' 1,000
'train' 1,000
'validation' 1,000

위키앤/벡

  • 구성 설명 : Wikiann vec 기차/개발/테스트 분할

  • 데이터 세트 크기 : 48.79 KiB

  • 분할 :

나뉘다
'test' 100
'train' 100
'validation' 100

위키앤/vep

  • 구성 설명 : Wikiann vep 기차/개발/테스트 분할

  • 데이터 세트 크기 : 51.53 KiB

  • 분할 :

나뉘다
'test' 100
'train' 100
'validation' 100

위키/vi

  • 구성 설명 : Wikiann vi 훈련/개발/테스트 분할

  • 데이터 세트 크기 : 6.22 MiB

  • 분할 :

나뉘다
'test' 10,000
'train' 20,000
'validation' 10,000

위키앤/vls

  • 구성 설명 : Wikiann vls 훈련/개발/테스트 분할

  • 데이터 세트 크기 : 59.63 KiB

  • 분할 :

나뉘다
'test' 100
'train' 100
'validation' 100

위키/보

  • 구성 설명 : Wikiann vo 훈련/개발/테스트 분할

  • 데이터 세트 크기 : 38.88 KiB

  • 분할 :

나뉘다
'test' 100
'train' 100
'validation' 100

위키앤/전쟁

  • 구성 설명 : Wikiann 워 트레인/개발/테스트 분할

  • 데이터 세트 크기 : 47.04 KiB

  • 분할 :

나뉘다
'test' 100
'train' 100
'validation' 100

위키아/wa

  • 구성 설명 : Wikiann wa 훈련/개발/테스트 분할

  • 데이터 세트 크기 : 50.23 KiB

  • 분할 :

나뉘다
'test' 100
'train' 100
'validation' 100

위키앤/우우

  • 구성 설명 : Wikiann wuu 훈련/개발/테스트 분할

  • 데이터 세트 크기 : 48.28 KiB

  • 분할 :

나뉘다
'test' 100
'train' 100
'validation' 100

위키안/xmf

  • 구성 설명 : Wikiann xmf 기차/개발/테스트 분할

  • 데이터 세트 크기 : 92.71 KiB

  • 분할 :

나뉘다
'test' 100
'train' 100
'validation' 100

위키앤/이

  • 구성 설명 : Wikiann yi 훈련/개발/테스트 분할

  • 데이터 세트 크기 : 63.57 KiB

  • 분할 :

나뉘다
'test' 100
'train' 100
'validation' 100

위키앤/요

  • 구성 설명 : Wikiann yo 기차/개발/테스트 분할

  • 데이터 세트 크기 : 47.97 KiB

  • 분할 :

나뉘다
'test' 100
'train' 100
'validation' 100

위키앤/제아

  • 구성 설명 : Wikiann zea train/dev/test splits

  • 데이터 세트 크기 : 53.35 KiB

  • 분할 :

나뉘다
'test' 100
'train' 100
'validation' 100

wikiann/zh-클래식

  • 구성 설명 : Wikiann zh-클래식 기차/개발/테스트 분할

  • 데이터 세트 크기 : 129.73 KiB

  • 분할 :

나뉘다
'test' 100
'train' 100
'validation' 100

wikiann/zh-민-난

  • 구성 설명 : Wikiann zh-min-nan 기차/개발/테스트 분할

  • 데이터 세트 크기 : 59.82 KiB

  • 분할 :

나뉘다
'test' 100
'train' 100
'validation' 100

위키/zh

  • 구성 설명 : Wikiann zh 훈련/개발/테스트 분할

  • 데이터 세트 크기 : 10.87 MiB

  • 분할 :

나뉘다
'test' 10,000
'train' 20,000
'validation' 10,000

wikiann/zh-yue

  • 구성 설명 : Wikiann zh-yue 기차/개발/테스트 분할

  • 데이터 세트 크기 : 12.62 MiB

  • 분할 :

나뉘다
'test' 10,000
'train' 20,000
'validation' 10,000