conll2003

  • Descriptif :

La tâche partagée de CoNLL-2003 concerne la reconnaissance d'entités nommées indépendante de la langue et se concentre sur quatre types d'entités nommées : les personnes, les lieux, les organisations et les noms d'entités diverses qui n'appartiennent pas aux trois groupes précédents.

Diviser Exemples
'dev' 3 251
'test' 3 454
'train' 14 042
  • Structure des fonctionnalités :
FeaturesDict({
    'chunks': Sequence(ClassLabel(shape=(), dtype=int64, num_classes=23)),
    'ner': Sequence(ClassLabel(shape=(), dtype=int64, num_classes=9)),
    'pos': Sequence(ClassLabel(shape=(), dtype=int64, num_classes=47)),
    'tokens': Sequence(Text(shape=(), dtype=string)),
})
  • Documentation des fonctionnalités :
Caractéristique Classe Façonner Dtype Description
FonctionnalitésDict
morceaux Séquence(ClassLabel) (Aucun,) int64
ner Séquence(ClassLabel) (Aucun,) int64
position Séquence(ClassLabel) (Aucun,) int64
jetons Séquence (texte) (Aucun,) chaîne de caractères
  • Citation :
@inproceedings{tjong-kim-sang-de-meulder-2003-introduction,
    title = "Introduction to the {C}o{NLL}-2003 Shared Task: Language-Independent Named Entity Recognition",
    author = "Tjong Kim Sang, Erik F.  and
      De Meulder, Fien",
    booktitle = "Proceedings of the Seventh Conference on Natural Language Learning at {HLT}-{NAACL} 2003",
    year = "2003",
    url = "https://www.aclweb.org/anthology/W03-0419",
    pages = "142--147",
}

conll2003/conll2003 (configuration par défaut)

,

  • Descriptif :

La tâche partagée de CoNLL-2003 concerne la reconnaissance d'entités nommées indépendante de la langue et se concentre sur quatre types d'entités nommées : les personnes, les lieux, les organisations et les noms d'entités diverses qui n'appartiennent pas aux trois groupes précédents.

Diviser Exemples
'dev' 3 251
'test' 3 454
'train' 14 042
  • Structure des fonctionnalités :
FeaturesDict({
    'chunks': Sequence(ClassLabel(shape=(), dtype=int64, num_classes=23)),
    'ner': Sequence(ClassLabel(shape=(), dtype=int64, num_classes=9)),
    'pos': Sequence(ClassLabel(shape=(), dtype=int64, num_classes=47)),
    'tokens': Sequence(Text(shape=(), dtype=string)),
})
  • Documentation des fonctionnalités :
Caractéristique Classe Façonner Dtype Description
FonctionnalitésDict
morceaux Séquence(ClassLabel) (Aucun,) int64
ner Séquence(ClassLabel) (Aucun,) int64
position Séquence(ClassLabel) (Aucun,) int64
jetons Séquence (texte) (Aucun,) chaîne de caractères
  • Citation :
@inproceedings{tjong-kim-sang-de-meulder-2003-introduction,
    title = "Introduction to the {C}o{NLL}-2003 Shared Task: Language-Independent Named Entity Recognition",
    author = "Tjong Kim Sang, Erik F.  and
      De Meulder, Fien",
    booktitle = "Proceedings of the Seventh Conference on Natural Language Learning at {HLT}-{NAACL} 2003",
    year = "2003",
    url = "https://www.aclweb.org/anthology/W03-0419",
    pages = "142--147",
}

conll2003/conll2003 (configuration par défaut)