conll2003

  • توضیحات :

وظیفه مشترک CoNLL-2003 مربوط به تشخیص موجودیت نامگذاری شده مستقل از زبان است و بر چهار نوع موجودیت نامگذاری شده متمرکز است: افراد، مکانها، سازمانها و نامهای موجودیتهای متفرقه که به سه گروه قبلی تعلق ندارند.

شکاف مثال ها
'dev' 3,251
'test' 3,454
'train' 14,042
  • ساختار ویژگی :
FeaturesDict({
   
'chunks': Sequence(ClassLabel(shape=(), dtype=int64, num_classes=23)),
   
'ner': Sequence(ClassLabel(shape=(), dtype=int64, num_classes=9)),
   
'pos': Sequence(ClassLabel(shape=(), dtype=int64, num_classes=47)),
   
'tokens': Sequence(Text(shape=(), dtype=string)),
})
  • مستندات ویژگی :
ویژگی کلاس شکل نوع D شرح
FeaturesDict
تکه ها دنباله (ClassLabel) (هیچ یک،) int64
ner دنباله (ClassLabel) (هیچ یک،) int64
pos دنباله (ClassLabel) (هیچ یک،) int64
توکن ها دنباله (متن) (هیچ یک،) رشته
  • نقل قول :
@inproceedings{tjong-kim-sang-de-meulder-2003-introduction,
    title
= "Introduction to the {C}o{NLL}-2003 Shared Task: Language-Independent Named Entity Recognition",
    author
= "Tjong Kim Sang, Erik F.  and
      De Meulder, Fien"
,
    booktitle
= "Proceedings of the Seventh Conference on Natural Language Learning at {HLT}-{NAACL} 2003",
    year
= "2003",
    url
= "https://www.aclweb.org/anthology/W03-0419",
    pages
= "142--147",
}

conll2003/conll2003 (پیکربندی پیش فرض)

،

  • توضیحات :

وظیفه مشترک CoNLL-2003 مربوط به تشخیص موجودیت نامگذاری شده مستقل از زبان است و بر چهار نوع موجودیت نامگذاری شده متمرکز است: افراد، مکانها، سازمانها و نامهای موجودیتهای متفرقه که به سه گروه قبلی تعلق ندارند.

شکاف مثال ها
'dev' 3,251
'test' 3,454
'train' 14,042
  • ساختار ویژگی :
FeaturesDict({
   
'chunks': Sequence(ClassLabel(shape=(), dtype=int64, num_classes=23)),
   
'ner': Sequence(ClassLabel(shape=(), dtype=int64, num_classes=9)),
   
'pos': Sequence(ClassLabel(shape=(), dtype=int64, num_classes=47)),
   
'tokens': Sequence(Text(shape=(), dtype=string)),
})
  • مستندات ویژگی :
ویژگی کلاس شکل نوع D شرح
FeaturesDict
تکه ها دنباله (ClassLabel) (هیچ یک،) int64
ner دنباله (ClassLabel) (هیچ یک،) int64
pos دنباله (ClassLabel) (هیچ یک،) int64
توکن ها دنباله (متن) (هیچ یک،) رشته
  • نقل قول :
@inproceedings{tjong-kim-sang-de-meulder-2003-introduction,
    title
= "Introduction to the {C}o{NLL}-2003 Shared Task: Language-Independent Named Entity Recognition",
    author
= "Tjong Kim Sang, Erik F.  and
      De Meulder, Fien"
,
    booktitle
= "Proceedings of the Seventh Conference on Natural Language Learning at {HLT}-{NAACL} 2003",
    year
= "2003",
    url
= "https://www.aclweb.org/anthology/W03-0419",
    pages
= "142--147",
}

conll2003/conll2003 (پیکربندی پیش فرض)