ペンギン

  • 説明:

南極のパーマー群島で観察された 3 種のペンギンの測定。

これらのデータは、米国長期生態研究ネットワークの一部であるパー​​マー ステーション長期生態研究プログラムのクリステン ゴーマン博士によって 2007 ~ 2009 年に収集されました。データはもともと環境データ イニシアチブ(EDI) データ ポータルからインポートされたもので、パーマー ステーション データ ポリシーに従って CC0 ライセンス (「権利予約なし」) で使用できます。このコピーは、 Allison Horst の GitHub リポジトリからインポートされました。

@Manual{,
  title = {palmerpenguins: Palmer Archipelago (Antarctica) penguin data},
  author = {Allison Marie Horst and Alison Presmanes Hill and Kristen B Gorman},
  year = {2020},
  note = {R package version 0.1.0},
  doi = {10.5281/zenodo.3960218},
  url = {https://allisonhorst.github.io/palmerpenguins/},
}

penguins/processed (デフォルト設定)

  • 構成の説明: penguins/processedは、 irisデータセットのドロップイン置換です。これには、単一のテンソルとして提示される 4 つの正規化された数値的特徴が含まれ、欠損値はなく、クラス ラベル (種) は整数 (n = 334) として提示されます。

  • ダウンロードサイズ: 25.05 KiB

  • データセットサイズ: 17.61 KiB

  • スプリット:

スプリット
'train' 334
  • 機能構造:
FeaturesDict({
    'features': Tensor(shape=(4,), dtype=float32),
    'species': ClassLabel(shape=(), dtype=int64, num_classes=3),
})
  • 機能のドキュメント:
特徴クラスDtype説明
特徴辞書
特徴テンソル(4) float32
種族クラスラベルint64

ペンギン/シンプル

  • 構成の説明: penguins/simpleは未加工のデータセットから処理され、テキスト フィールドから派生した単純化されたクラス ラベル、NaN/NA としてマークされた欠損値、および 7 つの重要な機能のみが保持されます (n = 344)。

  • ダウンロードサイズ: 13.20 KiB

  • データセットサイズ: 56.10 KiB

  • スプリット:

スプリット
'train' 344
  • 機能構造:
FeaturesDict({
    'body_mass_g': float32,
    'culmen_depth_mm': float32,
    'culmen_length_mm': float32,
    'flipper_length_mm': float32,
    'island': ClassLabel(shape=(), dtype=int64, num_classes=3),
    'sex': ClassLabel(shape=(), dtype=int64, num_classes=3),
    'species': ClassLabel(shape=(), dtype=int64, num_classes=3),
})
  • 機能のドキュメント:
特徴クラスDtype説明
特徴辞書
body_mass_gテンソルfloat32
culmen_depth_mmテンソルfloat32
culmen_length_mmテンソルfloat32
フリッパーの長さ_mmテンソルfloat32
小島クラスラベルint64
セックスクラスラベルint64
種族クラスラベルint64
  • 監視キー( as_supervised docを参照): ({'body_mass_g': 'body_mass_g', 'culmen_depth_mm': 'culmen_depth_mm', 'culmen_length_mm': 'culmen_length_mm', 'flipper_length_mm': 'flipper_length_mm', 'island': 'island', 'sex': 'sex', 'species': 'species'}, 'species')

  • ( tfds.as_dataframe ):

ペンギン/生

  • 構成の説明: penguins/rawは @allisonhorst からの元の未処理のコピーで、数値型または生のテキスト (n = 344) として表示される 17 個の機能すべてを含みます。

  • ダウンロードサイズ: 49.72 KiB

  • データセットサイズ: 164.51 KiB

  • スプリット:

スプリット
'train' 344
  • 機能構造:
FeaturesDict({
    'Body Mass (g)': float32,
    'Clutch Completion': Text(shape=(), dtype=string),
    'Comments': Text(shape=(), dtype=string),
    'Culmen Depth (mm)': float32,
    'Culmen Length (mm)': float32,
    'Date Egg': Text(shape=(), dtype=string),
    'Delta 13 C (o/oo)': float32,
    'Delta 15 N (o/oo)': float32,
    'Flipper Length (mm)': float32,
    'Individual ID': Text(shape=(), dtype=string),
    'Island': Text(shape=(), dtype=string),
    'Region': Text(shape=(), dtype=string),
    'Sample Number': int32,
    'Sex': Text(shape=(), dtype=string),
    'Species': Text(shape=(), dtype=string),
    'Stage': Text(shape=(), dtype=string),
    'studyName': Text(shape=(), dtype=string),
})
  • 機能のドキュメント:
特徴クラスDtype説明
特徴辞書
体重 (g)テンソルfloat32
クラッチの完成文章ストリング
コメント文章ストリング
カルメン深さ (mm)テンソルfloat32
カルメン長 (mm)テンソルfloat32
日付の卵文章ストリング
デルタ 13 C (o/oo)テンソルfloat32
デルタ 15 N (o/oo)テンソルfloat32
フリッパーの長さ (mm)テンソルfloat32
個人ID文章ストリング
小島文章ストリング
領域文章ストリング
サンプル番号テンソルint32
セックス文章ストリング
種族文章ストリング
ステージ文章ストリング
studyName文章ストリング