TFDS はCroissant 🥐 形式をサポートするようになりました。詳細については、ドキュメントをお読みください。

このページは Cloud Translation API によって翻訳されました。

gtzan

説明:

データセットは、30 秒ごとに 1000 のオーディオトラックで構成されます。 10 のジャンルが含まれており、それぞれが 100 のトラックで表されます。トラックはすべて、.wav 形式の 22050Hz モノラル 16 ビットオーディオファイルです。

ジャンルは次のとおりです。

ブルース
クラシカル
国
ディスコ
ヒップホップ
ジャズ
金属
ポップ
レゲエ
石
追加のドキュメント:コードを使用したペーパーの探索
ホームページ: http://marsyas.info/index.html
ソースコード: tfds.audio.gtzan.GTZAN
バージョン:
- 1.0.0 (デフォルト): リリースノートはありません。
ダウンロードサイズ: 1.14 GiB
データセットサイズ: 3.71 GiB
自動キャッシュ(ドキュメント): いいえ
スプリット:

スプリット	例
`'train'`	1,000

機能構造:

FeaturesDict({
    'audio': Audio(shape=(None,), dtype=int64),
    'audio/filename': Text(shape=(), dtype=string),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=10),
})

機能のドキュメント:

特徴	クラス	形	Dtype	説明
	特徴辞書
オーディオ	オーディオ	（なし、）	int64
オーディオ/ファイル名	文章		ストリング
ラベル	クラスラベル		int64

監視されたキー( as_supervised docを参照): ('audio', 'label')
図( tfds.show_examples ): サポートされていません。
例( tfds.as_dataframe ):

引用：

@misc{tzanetakis_essl_cook_2001,
author    = "Tzanetakis, George and Essl, Georg and Cook, Perry",
title     = "Automatic Musical Genre Classification Of Audio Signals",
url       = "http://ismir2001.ismir.net/pdf/tzanetakis.pdf",
publisher = "The International Society for Music Information Retrieval",
year      = "2001"
}

特に記載のない限り、このページのコンテンツはクリエイティブ・コモンズの表示 4.0 ライセンスにより使用許諾されます。コードサンプルは Apache 2.0 ライセンスにより使用許諾されます。詳しくは、Google Developers サイトのポリシーをご覧ください。Java は Oracle および関連会社の登録商標です。

最終更新日 2022-12-06 UTC。