پنگوئن ها

  • توضیحات :

اندازه گیری سه گونه پنگوئن مشاهده شده در مجمع الجزایر پالمر، قطب جنوب.

این داده ها از سال 2007 تا 2009 توسط دکتر کریستن گورمن با برنامه تحقیقات زیست محیطی بلندمدت ایستگاه پالمر ، بخشی از شبکه تحقیقات زیست محیطی بلند مدت ایالات متحده جمع آوری شده است. داده‌ها در اصل از پورتال داده‌های Environmental Data Initiative (EDI) وارد شده‌اند و مطابق با خط‌مشی داده‌های ایستگاه پالمر برای استفاده توسط مجوز CC0 ("بدون حقوق محفوظ") در دسترس هستند. این کپی از مخزن GitHub آلیسون هورست وارد شده است.

@Manual{,
  title = {palmerpenguins: Palmer Archipelago (Antarctica) penguin data},
  author = {Allison Marie Horst and Alison Presmanes Hill and Kristen B Gorman},
  year = {2020},
  note = {R package version 0.1.0},
  doi = {10.5281/zenodo.3960218},
  url = {https://allisonhorst.github.io/palmerpenguins/},
}

پنگوئن ها / پردازش شده (پیکربندی پیش فرض)

  • توضیحات پیکربندی : penguins/processed شده جایگزینی برای مجموعه داده iris است. این شامل 4 ویژگی عددی نرمال شده ارائه شده به عنوان یک تانسور منفرد، بدون مقادیر گم شده است و برچسب کلاس (گونه) به عنوان یک عدد صحیح (n = 334) ارائه می شود.

  • حجم دانلود : 25.05 KiB

  • حجم مجموعه داده : 17.61 KiB

  • تقسیم ها :

شکاف مثال ها
'train' 334
  • ساختار ویژگی :
FeaturesDict({
    'features': Tensor(shape=(4,), dtype=float32),
    'species': ClassLabel(shape=(), dtype=int64, num_classes=3),
})
  • مستندات ویژگی :
ویژگی کلاس شکل نوع D شرح
FeaturesDict
امکانات تانسور (4،) float32
گونه ها ClassLabel int64

پنگوئن / ساده

  • توضیحات پیکربندی : penguins/simple از مجموعه داده خام پردازش شده است، با برچسب‌های کلاس ساده‌شده که از فیلدهای متنی مشتق شده‌اند، مقادیر گمشده به‌عنوان NaN/NA علامت‌گذاری شده‌اند و تنها 7 ویژگی مهم را حفظ می‌کند (n = 344).

  • حجم دانلود : 13.20 KiB

  • حجم مجموعه داده : 56.10 KiB

  • تقسیم ها :

شکاف مثال ها
'train' 344
  • ساختار ویژگی :
FeaturesDict({
    'body_mass_g': float32,
    'culmen_depth_mm': float32,
    'culmen_length_mm': float32,
    'flipper_length_mm': float32,
    'island': ClassLabel(shape=(), dtype=int64, num_classes=3),
    'sex': ClassLabel(shape=(), dtype=int64, num_classes=3),
    'species': ClassLabel(shape=(), dtype=int64, num_classes=3),
})
  • مستندات ویژگی :
ویژگی کلاس شکل نوع D شرح
FeaturesDict
جرم_بدن_گرم تانسور float32
culmen_depth_mm تانسور float32
culmen_length_mm تانسور float32
باله_طول_میلی متر تانسور float32
جزیره ClassLabel int64
رابطه ی جنسی ClassLabel int64
گونه ها ClassLabel int64
  • کلیدهای نظارت شده (به as_supervised نظارت شده رجوع کنید): ({'body_mass_g': 'body_mass_g', 'culmen_depth_mm': 'culmen_depth_mm', 'culmen_length_mm': 'culmen_length_mm', 'flipper_length_mm': 'flipper_length_mm', 'island': 'island', 'sex': 'sex', 'species': 'species'}, 'species')

  • مثال‌ها ( tfds.as_dataframe ):

پنگوئن / خام

  • توضیحات پیکربندی : penguins/raw کپی اصلی و پردازش نشده از @allisonhorst است که شامل تمام 17 ویژگی است که به صورت انواع عددی یا به صورت متن خام ارائه شده است (n = 344).

  • حجم دانلود : 49.72 KiB

  • اندازه مجموعه داده : 164.51 KiB

  • تقسیم ها :

شکاف مثال ها
'train' 344
  • ساختار ویژگی :
FeaturesDict({
    'Body Mass (g)': float32,
    'Clutch Completion': Text(shape=(), dtype=string),
    'Comments': Text(shape=(), dtype=string),
    'Culmen Depth (mm)': float32,
    'Culmen Length (mm)': float32,
    'Date Egg': Text(shape=(), dtype=string),
    'Delta 13 C (o/oo)': float32,
    'Delta 15 N (o/oo)': float32,
    'Flipper Length (mm)': float32,
    'Individual ID': Text(shape=(), dtype=string),
    'Island': Text(shape=(), dtype=string),
    'Region': Text(shape=(), dtype=string),
    'Sample Number': int32,
    'Sex': Text(shape=(), dtype=string),
    'Species': Text(shape=(), dtype=string),
    'Stage': Text(shape=(), dtype=string),
    'studyName': Text(shape=(), dtype=string),
})
  • مستندات ویژگی :
ویژگی کلاس شکل نوع D شرح
FeaturesDict
توده بدن (گرم) تانسور float32
تکمیل کلاچ متن رشته
نظرات متن رشته
عمق کولمن (میلی متر) تانسور float32
طول کولمن (میلی متر) تانسور float32
تخم مرغ خرما متن رشته
Delta 13 C (o/oo) تانسور float32
Delta 15 N (o/oo) تانسور float32
طول باله (میلی متر) تانسور float32
شناسنامه فردی متن رشته
جزیره متن رشته
منطقه متن رشته
شماره نمونه تانسور int32
رابطه ی جنسی متن رشته
گونه ها متن رشته
صحنه متن رشته
نام مطالعه متن رشته