conll2002

  • Açıklama :

CoNLL-2002'nin paylaşılan görevi, dilden bağımsız adlandırılmış varlık tanıma ile ilgilidir. Adlandırılmış varlık türleri şunları içerir: önceki üç gruba ait olmayan kişiler, yerler, kuruluşlar ve çeşitli varlıkların adları. Paylaşılan görevin katılımcılarına en az iki dil için eğitim ve test verileri sunuldu. Bu paylaşılan görevde eğitim verileri dışındaki bilgi kaynakları kullanılmış olabilir.

@inproceedings{tjong-kim-sang-2002-introduction,
    title = "Introduction to the {C}o{NLL}-2002 Shared Task: Language-Independent Named Entity Recognition",
    author = "Tjong Kim Sang, Erik F.",
    booktitle = "{COLING}-02: The 6th Conference on Natural Language Learning 2002 ({C}o{NLL}-2002)",
    year = "2002",
    url = "https://aclanthology.org/W02-2024",
}

conll2002/es (varsayılan yapılandırma)

  • İndirme boyutu : 3.95 MiB

  • Veri kümesi boyutu : 3.52 MiB

  • bölmeler :

Bölmek örnekler
'dev' 1.916
'test' 1.518
'train' 8.324
  • Özellik yapısı :
FeaturesDict({
    'ner': Sequence(ClassLabel(shape=(), dtype=int64, num_classes=9)),
    'pos': Sequence(ClassLabel(shape=(), dtype=int64, num_classes=60)),
    'tokens': Sequence(Text(shape=(), dtype=string)),
})
  • Özellik belgeleri :
Özellik Sınıf Şekil Dtipi Açıklama
ÖzelliklerDict
ner Sıra(SınıfEtiketi) (Hiçbiri,) int64
pozisyon Sıra(SınıfEtiketi) (Hiçbiri,) int64
belirteçler Sıra(Metin) (Hiçbiri,) sicim

conll2002/nl

  • İndirme boyutu : 3.47 MiB

  • Veri kümesi boyutu : 3.55 MiB

  • bölmeler :

Bölmek örnekler
'dev' 2.896
'test' 5.196
'train' 15.807
  • Özellik yapısı :
FeaturesDict({
    'ner': Sequence(ClassLabel(shape=(), dtype=int64, num_classes=9)),
    'pos': Sequence(ClassLabel(shape=(), dtype=int64, num_classes=12)),
    'tokens': Sequence(Text(shape=(), dtype=string)),
})
  • Özellik belgeleri :
Özellik Sınıf Şekil Dtipi Açıklama
ÖzelliklerDict
ner Sıra(SınıfEtiketi) (Hiçbiri,) int64
pozisyon Sıra(SınıfEtiketi) (Hiçbiri,) int64
belirteçler Sıra(Metin) (Hiçbiri,) sicim