- Описание :
Общая задача CoNLL-2003 касается распознавания именованных объектов, не зависящих от языка, и концентрируется на четырех типах именованных объектов: лицах, местах, организациях и именах разных объектов, которые не принадлежат к предыдущим трем группам.
Домашняя страница : https://www.aclweb.org/anthology/W03-0419/
Исходный код :
tfds.text.conll2003.Conll2003
Версии :
-
1.0.0
(по умолчанию): Первоначальный выпуск.
-
Размер загрузки :
959.94 KiB
Размер набора данных :
3.87 MiB
.Автоматическое кэширование ( документация ): Да
Сплиты :
Расколоть | Примеры |
---|---|
'dev' | 3251 |
'test' | 3454 |
'train' | 14 042 |
- Структура функции :
FeaturesDict({
'chunks': Sequence(ClassLabel(shape=(), dtype=int64, num_classes=23)),
'ner': Sequence(ClassLabel(shape=(), dtype=int64, num_classes=9)),
'pos': Sequence(ClassLabel(shape=(), dtype=int64, num_classes=47)),
'tokens': Sequence(Text(shape=(), dtype=string)),
})
- Документация по функциям :
Особенность | Учебный класс | Форма | Dтип | Описание |
---|---|---|---|---|
ОсобенностиDict | ||||
куски | Последовательность (метка класса) | (Никто,) | int64 | |
нер | Последовательность (метка класса) | (Никто,) | int64 | |
поз | Последовательность (метка класса) | (Никто,) | int64 | |
жетоны | Последовательность (текст) | (Никто,) | нить |
Ключи под наблюдением (см . документ
as_supervised
):None
Рисунок ( tfds.show_examples ): не поддерживается.
Примеры ( tfds.as_dataframe ):
- Цитата :
@inproceedings{tjong-kim-sang-de-meulder-2003-introduction,
title = "Introduction to the {C}o{NLL}-2003 Shared Task: Language-Independent Named Entity Recognition",
author = "Tjong Kim Sang, Erik F. and
De Meulder, Fien",
booktitle = "Proceedings of the Seventh Conference on Natural Language Learning at {HLT}-{NAACL} 2003",
year = "2003",
url = "https://www.aclweb.org/anthology/W03-0419",
pages = "142--147",
}
conll2003/conll2003 (конфигурация по умолчанию)
,- Описание :
Общая задача CoNLL-2003 касается распознавания именованных объектов, не зависящих от языка, и концентрируется на четырех типах именованных объектов: лицах, местах, организациях и именах разных объектов, которые не принадлежат к предыдущим трем группам.
Домашняя страница : https://www.aclweb.org/anthology/W03-0419/
Исходный код :
tfds.text.conll2003.Conll2003
Версии :
-
1.0.0
(по умолчанию): Первоначальный выпуск.
-
Размер загрузки :
959.94 KiB
Размер набора данных :
3.87 MiB
.Автоматическое кэширование ( документация ): Да
Сплиты :
Расколоть | Примеры |
---|---|
'dev' | 3251 |
'test' | 3454 |
'train' | 14 042 |
- Структура функции :
FeaturesDict({
'chunks': Sequence(ClassLabel(shape=(), dtype=int64, num_classes=23)),
'ner': Sequence(ClassLabel(shape=(), dtype=int64, num_classes=9)),
'pos': Sequence(ClassLabel(shape=(), dtype=int64, num_classes=47)),
'tokens': Sequence(Text(shape=(), dtype=string)),
})
- Документация по функциям :
Особенность | Учебный класс | Форма | Dтип | Описание |
---|---|---|---|---|
ОсобенностиDict | ||||
куски | Последовательность (метка класса) | (Никто,) | int64 | |
нер | Последовательность (метка класса) | (Никто,) | int64 | |
поз | Последовательность (метка класса) | (Никто,) | int64 | |
жетоны | Последовательность (текст) | (Никто,) | нить |
Ключи под наблюдением (см . документ
as_supervised
):None
Рисунок ( tfds.show_examples ): не поддерживается.
Примеры ( tfds.as_dataframe ):
- Цитата :
@inproceedings{tjong-kim-sang-de-meulder-2003-introduction,
title = "Introduction to the {C}o{NLL}-2003 Shared Task: Language-Independent Named Entity Recognition",
author = "Tjong Kim Sang, Erik F. and
De Meulder, Fien",
booktitle = "Proceedings of the Seventh Conference on Natural Language Learning at {HLT}-{NAACL} 2003",
year = "2003",
url = "https://www.aclweb.org/anthology/W03-0419",
pages = "142--147",
}