- Descriptif :
La tâche partagée de CoNLL-2003 concerne la reconnaissance d'entités nommées indépendante de la langue et se concentre sur quatre types d'entités nommées : les personnes, les lieux, les organisations et les noms d'entités diverses qui n'appartiennent pas aux trois groupes précédents.
Page d' accueil : https://www.aclweb.org/anthology/W03-0419/
Code source :
tfds.text.conll2003.Conll2003
Versions :
-
1.0.0
(par défaut) : version initiale.
-
Taille du téléchargement :
959.94 KiB
Taille du jeu de données :
3.87 MiB
Mise en cache automatique ( documentation ): Oui
Fractionnements :
Diviser | Exemples |
---|---|
'dev' | 3 251 |
'test' | 3 454 |
'train' | 14 042 |
- Structure des fonctionnalités :
FeaturesDict({
'chunks': Sequence(ClassLabel(shape=(), dtype=int64, num_classes=23)),
'ner': Sequence(ClassLabel(shape=(), dtype=int64, num_classes=9)),
'pos': Sequence(ClassLabel(shape=(), dtype=int64, num_classes=47)),
'tokens': Sequence(Text(shape=(), dtype=string)),
})
- Documentation des fonctionnalités :
Caractéristique | Classe | Façonner | Dtype | Description |
---|---|---|---|---|
FonctionnalitésDict | ||||
morceaux | Séquence(ClassLabel) | (Aucun,) | int64 | |
ner | Séquence(ClassLabel) | (Aucun,) | int64 | |
position | Séquence(ClassLabel) | (Aucun,) | int64 | |
jetons | Séquence (texte) | (Aucun,) | chaîne de caractères |
Clés supervisées (Voir
as_supervised
doc ):None
Figure ( tfds.show_examples ) : non pris en charge.
Exemples ( tfds.as_dataframe ):
- Citation :
@inproceedings{tjong-kim-sang-de-meulder-2003-introduction,
title = "Introduction to the {C}o{NLL}-2003 Shared Task: Language-Independent Named Entity Recognition",
author = "Tjong Kim Sang, Erik F. and
De Meulder, Fien",
booktitle = "Proceedings of the Seventh Conference on Natural Language Learning at {HLT}-{NAACL} 2003",
year = "2003",
url = "https://www.aclweb.org/anthology/W03-0419",
pages = "142--147",
}
conll2003/conll2003 (configuration par défaut)
,- Descriptif :
La tâche partagée de CoNLL-2003 concerne la reconnaissance d'entités nommées indépendante de la langue et se concentre sur quatre types d'entités nommées : les personnes, les lieux, les organisations et les noms d'entités diverses qui n'appartiennent pas aux trois groupes précédents.
Page d' accueil : https://www.aclweb.org/anthology/W03-0419/
Code source :
tfds.text.conll2003.Conll2003
Versions :
-
1.0.0
(par défaut) : version initiale.
-
Taille du téléchargement :
959.94 KiB
Taille du jeu de données :
3.87 MiB
Mise en cache automatique ( documentation ): Oui
Fractionnements :
Diviser | Exemples |
---|---|
'dev' | 3 251 |
'test' | 3 454 |
'train' | 14 042 |
- Structure des fonctionnalités :
FeaturesDict({
'chunks': Sequence(ClassLabel(shape=(), dtype=int64, num_classes=23)),
'ner': Sequence(ClassLabel(shape=(), dtype=int64, num_classes=9)),
'pos': Sequence(ClassLabel(shape=(), dtype=int64, num_classes=47)),
'tokens': Sequence(Text(shape=(), dtype=string)),
})
- Documentation des fonctionnalités :
Caractéristique | Classe | Façonner | Dtype | Description |
---|---|---|---|---|
FonctionnalitésDict | ||||
morceaux | Séquence(ClassLabel) | (Aucun,) | int64 | |
ner | Séquence(ClassLabel) | (Aucun,) | int64 | |
position | Séquence(ClassLabel) | (Aucun,) | int64 | |
jetons | Séquence (texte) | (Aucun,) | chaîne de caractères |
Clés supervisées (Voir
as_supervised
doc ):None
Figure ( tfds.show_examples ) : non pris en charge.
Exemples ( tfds.as_dataframe ):
- Citation :
@inproceedings{tjong-kim-sang-de-meulder-2003-introduction,
title = "Introduction to the {C}o{NLL}-2003 Shared Task: Language-Independent Named Entity Recognition",
author = "Tjong Kim Sang, Erik F. and
De Meulder, Fien",
booktitle = "Proceedings of the Seventh Conference on Natural Language Learning at {HLT}-{NAACL} 2003",
year = "2003",
url = "https://www.aclweb.org/anthology/W03-0419",
pages = "142--147",
}