ljspeech

বর্ণনা :

এটি একটি পাবলিক ডোমেন স্পিচ ডেটাসেট যাতে 7টি নন-ফিকশন বই থেকে একটি একক স্পিকার পড়ার অনুচ্ছেদের 13,100টি ছোট অডিও ক্লিপ রয়েছে। প্রতিটি ক্লিপের জন্য একটি প্রতিলিপি প্রদান করা হয়। ক্লিপগুলির দৈর্ঘ্য 1 থেকে 10 সেকেন্ডের মধ্যে পরিবর্তিত হয় এবং মোট দৈর্ঘ্য প্রায় 24 ঘন্টা থাকে।

পাঠ্যগুলি 1884 এবং 1964 সালের মধ্যে প্রকাশিত হয়েছিল এবং সর্বজনীন ডোমেনে রয়েছে। অডিওটি 2016-17 সালে LibriVox প্রকল্প দ্বারা রেকর্ড করা হয়েছিল এবং এটি সর্বজনীন ডোমেনেও রয়েছে।

অতিরিক্ত ডকুমেন্টেশন : কোড সহ কাগজপত্রে অন্বেষণ করুন
হোমপেজ : https://keithito.com/LJ-Speech-Dataset/
সোর্স কোড : tfds.datasets.ljspeech.Builder
সংস্করণ :
- 1.1.1 (ডিফল্ট): dtype=tf.int16 দিয়ে স্পিচ ডেটা টাইপ ঠিক করুন।
ডাউনলোড সাইজ : 2.56 GiB
ডেটাসেটের আকার : 10.73 GiB
স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): না
বিভাজন :

বিভক্ত	উদাহরণ
`'train'`	13,100

বৈশিষ্ট্য গঠন :

FeaturesDict({
    'id': string,
    'speech': Audio(shape=(None,), dtype=int16),
    'text': Text(shape=(), dtype=string),
    'text_normalized': Text(shape=(), dtype=string),
})

বৈশিষ্ট্য ডকুমেন্টেশন :

বৈশিষ্ট্য	ক্লাস	আকৃতি	ডিটাইপ
	ফিচারসডিক্ট
আইডি	টেনসর		স্ট্রিং
বক্তৃতা	শ্রুতি	(কোনটিই নয়,)	int16
পাঠ্য	পাঠ্য		স্ট্রিং
টেক্সট_নর্মালাইজড	পাঠ্য		স্ট্রিং

তত্ত্বাবধানে থাকা কী ( as_supervised doc হিসেবে): ('text_normalized', 'speech')
চিত্র ( tfds.show_examples ): সমর্থিত নয়।
উদাহরণ ( tfds.as_dataframe ):

উদ্ধৃতি :

@misc{ljspeech17,
  author       = {Keith Ito},
  title        = {The LJ Speech Dataset},
  howpublished = {\url{https://keithito.com/LJ-Speech-Dataset/} },
  year         = 2017
}

ljspeech সেভ করা পৃষ্ঠা গুছিয়ে রাখতে 'সংগ্রহ' ব্যবহার করুন আপনার পছন্দ অনুযায়ী কন্টেন্ট সেভ করুন ও সঠিক বিভাগে রাখুন।

ljspeech