gtzan

বর্ণনা :

ডেটাসেটে প্রতি 30 সেকেন্ডের 1000টি অডিও ট্র্যাক থাকে। এটিতে 10টি জেনার রয়েছে, প্রতিটি 100টি ট্র্যাক দ্বারা উপস্থাপিত। ট্র্যাকগুলি হল .wav ফর্ম্যাটে 22050Hz Mono 16-বিট অডিও ফাইল৷

ঘরানাগুলি হল:

ব্লুজ
শাস্ত্রীয়
দেশ
ডিস্কো
হিপ - হপ
জ্যাজ
ধাতু
পপ
রেগে
শিলা
অতিরিক্ত ডকুমেন্টেশন : কোড সহ কাগজপত্রে অন্বেষণ করুন
হোমপেজ : http://marsyas.info/index.html
সোর্স কোড : tfds.audio.gtzan.GTZAN
সংস্করণ :
- 1.0.0 (ডিফল্ট): কোনো রিলিজ নোট নেই।
ডাউনলোড সাইজ : 1.14 GiB
ডেটাসেটের আকার : 3.71 GiB
স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): না
বিভাজন :

বিভক্ত	উদাহরণ
`'train'`	1,000

বৈশিষ্ট্য গঠন :

FeaturesDict({
    'audio': Audio(shape=(None,), dtype=int64),
    'audio/filename': Text(shape=(), dtype=string),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=10),
})

বৈশিষ্ট্য ডকুমেন্টেশন :

বৈশিষ্ট্য	ক্লাস	আকৃতি	ডিটাইপ
	ফিচারসডিক্ট
শ্রুতি	শ্রুতি	(কোনটিই নয়,)	int64
অডিও/ফাইলের নাম	পাঠ্য		স্ট্রিং
লেবেল	ক্লাসলেবেল		int64

তত্ত্বাবধান করা কী (দেখুন as_supervised doc ): ('audio', 'label')
চিত্র ( tfds.show_examples ): সমর্থিত নয়।
উদাহরণ ( tfds.as_dataframe ):

উদ্ধৃতি :

@misc{tzanetakis_essl_cook_2001,
author    = "Tzanetakis, George and Essl, Georg and Cook, Perry",
title     = "Automatic Musical Genre Classification Of Audio Signals",
url       = "http://ismir2001.ismir.net/pdf/tzanetakis.pdf",
publisher = "The International Society for Music Information Retrieval",
year      = "2001"
}

gtzan সেভ করা পৃষ্ঠা গুছিয়ে রাখতে 'সংগ্রহ' ব্যবহার করুন আপনার পছন্দ অনুযায়ী কন্টেন্ট সেভ করুন ও সঠিক বিভাগে রাখুন।

gtzan