- Deskripsi :
Tugas bersama dari CoNLL-2003 menyangkut pengenalan entitas bernama yang tidak tergantung bahasa dan berkonsentrasi pada empat jenis entitas bernama: orang, lokasi, organisasi, dan nama entitas lain-lain yang tidak termasuk dalam tiga kelompok sebelumnya.
Kode sumber :
tfds.text.conll2003.Conll2003
Versi :
-
1.0.0
(default): Rilis awal.
-
Ukuran unduhan :
959.94 KiB
Ukuran dataset :
3.87 MiB
Di-cache otomatis ( dokumentasi ): Ya
Perpecahan :
Membelah | Contoh |
---|---|
'dev' | 3.251 |
'test' | 3.454 |
'train' | 14.042 |
- Struktur fitur :
FeaturesDict({
'chunks': Sequence(ClassLabel(shape=(), dtype=int64, num_classes=23)),
'ner': Sequence(ClassLabel(shape=(), dtype=int64, num_classes=9)),
'pos': Sequence(ClassLabel(shape=(), dtype=int64, num_classes=47)),
'tokens': Sequence(Text(shape=(), dtype=string)),
})
- Dokumentasi fitur :
Fitur | Kelas | Membentuk | Dtype | Keterangan |
---|---|---|---|---|
fiturDict | ||||
potongan | Urutan(Label Kelas) | (Tidak ada,) | int64 | |
ner | Urutan(Label Kelas) | (Tidak ada,) | int64 | |
pos | Urutan(Label Kelas) | (Tidak ada,) | int64 | |
token | Urutan (Teks) | (Tidak ada,) | rangkaian |
Kunci yang diawasi (Lihat
as_supervised
doc ):None
Gambar ( tfds.show_examples ): Tidak didukung.
Contoh ( tfds.as_dataframe ):
- Kutipan :
@inproceedings{tjong-kim-sang-de-meulder-2003-introduction,
title = "Introduction to the {C}o{NLL}-2003 Shared Task: Language-Independent Named Entity Recognition",
author = "Tjong Kim Sang, Erik F. and
De Meulder, Fien",
booktitle = "Proceedings of the Seventh Conference on Natural Language Learning at {HLT}-{NAACL} 2003",
year = "2003",
url = "https://www.aclweb.org/anthology/W03-0419",
pages = "142--147",
}
conll2003/conll2003 (konfigurasi default)
,- Deskripsi :
Tugas bersama dari CoNLL-2003 menyangkut pengenalan entitas bernama yang tidak tergantung bahasa dan berkonsentrasi pada empat jenis entitas bernama: orang, lokasi, organisasi, dan nama entitas lain-lain yang tidak termasuk dalam tiga kelompok sebelumnya.
Kode sumber :
tfds.text.conll2003.Conll2003
Versi :
-
1.0.0
(default): Rilis awal.
-
Ukuran unduhan :
959.94 KiB
Ukuran dataset :
3.87 MiB
Di-cache otomatis ( dokumentasi ): Ya
Perpecahan :
Membelah | Contoh |
---|---|
'dev' | 3.251 |
'test' | 3.454 |
'train' | 14.042 |
- Struktur fitur :
FeaturesDict({
'chunks': Sequence(ClassLabel(shape=(), dtype=int64, num_classes=23)),
'ner': Sequence(ClassLabel(shape=(), dtype=int64, num_classes=9)),
'pos': Sequence(ClassLabel(shape=(), dtype=int64, num_classes=47)),
'tokens': Sequence(Text(shape=(), dtype=string)),
})
- Dokumentasi fitur :
Fitur | Kelas | Membentuk | Dtype | Keterangan |
---|---|---|---|---|
fiturDict | ||||
potongan | Urutan(Label Kelas) | (Tidak ada,) | int64 | |
ner | Urutan(Label Kelas) | (Tidak ada,) | int64 | |
pos | Urutan(Label Kelas) | (Tidak ada,) | int64 | |
token | Urutan (Teks) | (Tidak ada,) | rangkaian |
Kunci yang diawasi (Lihat
as_supervised
doc ):None
Gambar ( tfds.show_examples ): Tidak didukung.
Contoh ( tfds.as_dataframe ):
- Kutipan :
@inproceedings{tjong-kim-sang-de-meulder-2003-introduction,
title = "Introduction to the {C}o{NLL}-2003 Shared Task: Language-Independent Named Entity Recognition",
author = "Tjong Kim Sang, Erik F. and
De Meulder, Fien",
booktitle = "Proceedings of the Seventh Conference on Natural Language Learning at {HLT}-{NAACL} 2003",
year = "2003",
url = "https://www.aclweb.org/anthology/W03-0419",
pages = "142--147",
}