- توضیحات :
Race یک مجموعه داده درک مطلب در مقیاس بزرگ با بیش از 28000 متن و نزدیک به 100000 سوال است. مجموعه داده از امتحانات انگلیسی در چین جمع آوری شده است که برای دانش آموزان دبیرستانی و دبیرستانی طراحی شده است. مجموعه داده را می توان به عنوان مجموعه آموزشی و آزمایشی برای درک ماشین استفاده کرد.
اسناد اضافی : کاوش در کاغذها با کد
توضیحات پیکربندی : پیکربندی سازنده برای مجموعه داده RACE.
صفحه اصلی : https://www.cs.cmu.edu/~glai1/data/race/
کد منبع :
tfds.datasets.race.Builder
نسخه ها :
-
1.0.0
: انتشار اولیه. -
2.0.0
(پیش فرض): شناسه مثال را اضافه کنید.
-
حجم دانلود :
24.26 MiB
ذخیره خودکار ( اسناد ): بله
ساختار ویژگی :
FeaturesDict({
'answers': Sequence(Text(shape=(), dtype=string)),
'article': Text(shape=(), dtype=string),
'example_id': Text(shape=(), dtype=string),
'options': Sequence(Sequence(Text(shape=(), dtype=string))),
'questions': Sequence(Text(shape=(), dtype=string)),
})
- مستندات ویژگی :
ویژگی | کلاس | شکل | نوع D | شرح |
---|---|---|---|---|
FeaturesDict | ||||
پاسخ می دهد | دنباله (متن) | (هیچ یک،) | رشته | |
مقاله | متن | رشته | ||
example_id | متن | رشته | ||
گزینه ها | دنباله (توالی (متن)) | (هیچ، هیچکدام) | رشته | |
سوالات | دنباله (متن) | (هیچ یک،) | رشته |
کلیدهای نظارت شده (به
as_supervised
doc مراجعه کنید):None
شکل ( tfds.show_examples ): پشتیبانی نمی شود.
نقل قول :
@article{lai2017large,
title={RACE: Large-scale ReAding Comprehension Dataset From Examinations},
author={Lai, Guokun and Xie, Qizhe and Liu, Hanxiao and Yang, Yiming and Hovy, Eduard},
journal={arXiv preprint arXiv:1704.04683},
year={2017}
}
مسابقه/بالا (پیکربندی پیش فرض)
حجم مجموعه داده :
52.39 MiB
تقسیم ها :
شکاف | مثال ها |
---|---|
'dev' | 1021 |
'test' | 1,045 |
'train' | 18728 |
- مثالها ( tfds.as_dataframe ):
نژاد / وسط
حجم مجموعه داده :
12.51 MiB
تقسیم ها :
شکاف | مثال ها |
---|---|
'dev' | 368 |
'test' | 362 |
'train' | 6,409 |
- مثالها ( tfds.as_dataframe ):