- Descrição :
A tarefa compartilhada do CoNLL-2003 diz respeito ao reconhecimento de entidades nomeadas independentes de idioma e concentra-se em quatro tipos de entidades nomeadas: pessoas, locais, organizações e nomes de entidades diversas que não pertencem aos três grupos anteriores.
Página inicial : https://www.aclweb.org/anthology/W03-0419/
Código -fonte:
tfds.text.conll2003.Conll2003
Versões :
-
1.0.0
(padrão): versão inicial.
-
Tamanho do download :
959.94 KiB
Tamanho do conjunto de dados :
3.87 MiB
Cache automático ( documentação ): Sim
Divisões :
Dividir | Exemplos |
---|---|
'dev' | 3.251 |
'test' | 3.454 |
'train' | 14.042 |
- Estrutura de recursos :
FeaturesDict({
'chunks': Sequence(ClassLabel(shape=(), dtype=int64, num_classes=23)),
'ner': Sequence(ClassLabel(shape=(), dtype=int64, num_classes=9)),
'pos': Sequence(ClassLabel(shape=(), dtype=int64, num_classes=47)),
'tokens': Sequence(Text(shape=(), dtype=string)),
})
- Documentação do recurso:
Funcionalidade | Aula | Forma | Tipo D | Descrição |
---|---|---|---|---|
RecursosDict | ||||
pedaços | Sequência(ClassLabel) | (Nenhum,) | int64 | |
ner | Sequência(ClassLabel) | (Nenhum,) | int64 | |
pos | Sequência(ClassLabel) | (Nenhum,) | int64 | |
fichas | Sequência (Texto) | (Nenhum,) | fragmento |
Chaves supervisionadas (Consulte
as_supervised
doc ):None
Figura ( tfds.show_examples ): Não compatível.
Exemplos ( tfds.as_dataframe ):
- Citação :
@inproceedings{tjong-kim-sang-de-meulder-2003-introduction,
title = "Introduction to the {C}o{NLL}-2003 Shared Task: Language-Independent Named Entity Recognition",
author = "Tjong Kim Sang, Erik F. and
De Meulder, Fien",
booktitle = "Proceedings of the Seventh Conference on Natural Language Learning at {HLT}-{NAACL} 2003",
year = "2003",
url = "https://www.aclweb.org/anthology/W03-0419",
pages = "142--147",
}
conll2003/conll2003 (configuração padrão)
,- Descrição :
A tarefa compartilhada do CoNLL-2003 diz respeito ao reconhecimento de entidades nomeadas independentes de idioma e concentra-se em quatro tipos de entidades nomeadas: pessoas, locais, organizações e nomes de entidades diversas que não pertencem aos três grupos anteriores.
Página inicial : https://www.aclweb.org/anthology/W03-0419/
Código -fonte:
tfds.text.conll2003.Conll2003
Versões :
-
1.0.0
(padrão): versão inicial.
-
Tamanho do download :
959.94 KiB
Tamanho do conjunto de dados :
3.87 MiB
Cache automático ( documentação ): Sim
Divisões :
Dividir | Exemplos |
---|---|
'dev' | 3.251 |
'test' | 3.454 |
'train' | 14.042 |
- Estrutura de recursos :
FeaturesDict({
'chunks': Sequence(ClassLabel(shape=(), dtype=int64, num_classes=23)),
'ner': Sequence(ClassLabel(shape=(), dtype=int64, num_classes=9)),
'pos': Sequence(ClassLabel(shape=(), dtype=int64, num_classes=47)),
'tokens': Sequence(Text(shape=(), dtype=string)),
})
- Documentação do recurso:
Funcionalidade | Aula | Forma | Tipo D | Descrição |
---|---|---|---|---|
RecursosDict | ||||
pedaços | Sequência(ClassLabel) | (Nenhum,) | int64 | |
ner | Sequência(ClassLabel) | (Nenhum,) | int64 | |
pos | Sequência(ClassLabel) | (Nenhum,) | int64 | |
fichas | Sequência (Texto) | (Nenhum,) | fragmento |
Chaves supervisionadas (Consulte
as_supervised
doc ):None
Figura ( tfds.show_examples ): Não suportado.
Exemplos ( tfds.as_dataframe ):
- Citação :
@inproceedings{tjong-kim-sang-de-meulder-2003-introduction,
title = "Introduction to the {C}o{NLL}-2003 Shared Task: Language-Independent Named Entity Recognition",
author = "Tjong Kim Sang, Erik F. and
De Meulder, Fien",
booktitle = "Proceedings of the Seventh Conference on Natural Language Learning at {HLT}-{NAACL} 2003",
year = "2003",
url = "https://www.aclweb.org/anthology/W03-0419",
pages = "142--147",
}