তথ্যসূত্র:
জেআরসি
TFDS এ এই ডেটাসেট লোড করতে নিম্নলিখিত কমান্ডটি ব্যবহার করুন:
ds = tfds.load('huggingface:large_spanish_corpus/JRC')
- বর্ণনা :
The Large Spanish Corpus is a compilation of 15 unlabelled Spanish corpora spanning Wikipedia to European parliament notes. Each config contains the data corresponding to a different corpus. For example, "all_wiki" only includes examples from Spanish Wikipedia. By default, the config is set to "combined" which loads all the corpora; with this setting you can also specify the number of samples to return per corpus by configuring the "split" argument.
- লাইসেন্স : এমআইটি
- সংস্করণ : 1.1.0
- বিভাজন :
বিভক্ত | উদাহরণ |
---|---|
'train' | 3410620 |
- বৈশিষ্ট্য :
{
"text": {
"dtype": "string",
"id": null,
"_type": "Value"
}
}
EMEA
TFDS এ এই ডেটাসেট লোড করতে নিম্নলিখিত কমান্ডটি ব্যবহার করুন:
ds = tfds.load('huggingface:large_spanish_corpus/EMEA')
- বর্ণনা :
The Large Spanish Corpus is a compilation of 15 unlabelled Spanish corpora spanning Wikipedia to European parliament notes. Each config contains the data corresponding to a different corpus. For example, "all_wiki" only includes examples from Spanish Wikipedia. By default, the config is set to "combined" which loads all the corpora; with this setting you can also specify the number of samples to return per corpus by configuring the "split" argument.
- লাইসেন্স : এমআইটি
- সংস্করণ : 1.1.0
- বিভাজন :
বিভক্ত | উদাহরণ |
---|---|
'train' | 1221233 |
- বৈশিষ্ট্য :
{
"text": {
"dtype": "string",
"id": null,
"_type": "Value"
}
}
গ্লোবালভয়েস
TFDS এ এই ডেটাসেট লোড করতে নিম্নলিখিত কমান্ডটি ব্যবহার করুন:
ds = tfds.load('huggingface:large_spanish_corpus/GlobalVoices')
- বর্ণনা :
The Large Spanish Corpus is a compilation of 15 unlabelled Spanish corpora spanning Wikipedia to European parliament notes. Each config contains the data corresponding to a different corpus. For example, "all_wiki" only includes examples from Spanish Wikipedia. By default, the config is set to "combined" which loads all the corpora; with this setting you can also specify the number of samples to return per corpus by configuring the "split" argument.
- লাইসেন্স : এমআইটি
- সংস্করণ : 1.1.0
- বিভাজন :
বিভক্ত | উদাহরণ |
---|---|
'train' | 897075 |
- বৈশিষ্ট্য :
{
"text": {
"dtype": "string",
"id": null,
"_type": "Value"
}
}
ইসিবি
TFDS এ এই ডেটাসেট লোড করতে নিম্নলিখিত কমান্ডটি ব্যবহার করুন:
ds = tfds.load('huggingface:large_spanish_corpus/ECB')
- বর্ণনা :
The Large Spanish Corpus is a compilation of 15 unlabelled Spanish corpora spanning Wikipedia to European parliament notes. Each config contains the data corresponding to a different corpus. For example, "all_wiki" only includes examples from Spanish Wikipedia. By default, the config is set to "combined" which loads all the corpora; with this setting you can also specify the number of samples to return per corpus by configuring the "split" argument.
- লাইসেন্স : এমআইটি
- সংস্করণ : 1.1.0
- বিভাজন :
বিভক্ত | উদাহরণ |
---|---|
'train' | 1875738 |
- বৈশিষ্ট্য :
{
"text": {
"dtype": "string",
"id": null,
"_type": "Value"
}
}
DOGC
TFDS এ এই ডেটাসেট লোড করতে নিম্নলিখিত কমান্ডটি ব্যবহার করুন:
ds = tfds.load('huggingface:large_spanish_corpus/DOGC')
- বর্ণনা :
The Large Spanish Corpus is a compilation of 15 unlabelled Spanish corpora spanning Wikipedia to European parliament notes. Each config contains the data corresponding to a different corpus. For example, "all_wiki" only includes examples from Spanish Wikipedia. By default, the config is set to "combined" which loads all the corpora; with this setting you can also specify the number of samples to return per corpus by configuring the "split" argument.
- লাইসেন্স : এমআইটি
- সংস্করণ : 1.1.0
- বিভাজন :
বিভক্ত | উদাহরণ |
---|---|
'train' | 10917053 |
- বৈশিষ্ট্য :
{
"text": {
"dtype": "string",
"id": null,
"_type": "Value"
}
}
সব_উইকি
TFDS এ এই ডেটাসেট লোড করতে নিম্নলিখিত কমান্ডটি ব্যবহার করুন:
ds = tfds.load('huggingface:large_spanish_corpus/all_wikis')
- বর্ণনা :
The Large Spanish Corpus is a compilation of 15 unlabelled Spanish corpora spanning Wikipedia to European parliament notes. Each config contains the data corresponding to a different corpus. For example, "all_wiki" only includes examples from Spanish Wikipedia. By default, the config is set to "combined" which loads all the corpora; with this setting you can also specify the number of samples to return per corpus by configuring the "split" argument.
- লাইসেন্স : এমআইটি
- সংস্করণ : 1.1.0
- বিভাজন :
বিভক্ত | উদাহরণ |
---|---|
'train' | 28109484 |
- বৈশিষ্ট্য :
{
"text": {
"dtype": "string",
"id": null,
"_type": "Value"
}
}
TED
TFDS এ এই ডেটাসেট লোড করতে নিম্নলিখিত কমান্ডটি ব্যবহার করুন:
ds = tfds.load('huggingface:large_spanish_corpus/TED')
- বর্ণনা :
The Large Spanish Corpus is a compilation of 15 unlabelled Spanish corpora spanning Wikipedia to European parliament notes. Each config contains the data corresponding to a different corpus. For example, "all_wiki" only includes examples from Spanish Wikipedia. By default, the config is set to "combined" which loads all the corpora; with this setting you can also specify the number of samples to return per corpus by configuring the "split" argument.
- লাইসেন্স : এমআইটি
- সংস্করণ : 1.1.0
- বিভাজন :
বিভক্ত | উদাহরণ |
---|---|
'train' | 157910 |
- বৈশিষ্ট্য :
{
"text": {
"dtype": "string",
"id": null,
"_type": "Value"
}
}
multiUN
TFDS এ এই ডেটাসেট লোড করতে নিম্নলিখিত কমান্ডটি ব্যবহার করুন:
ds = tfds.load('huggingface:large_spanish_corpus/multiUN')
- বর্ণনা :
The Large Spanish Corpus is a compilation of 15 unlabelled Spanish corpora spanning Wikipedia to European parliament notes. Each config contains the data corresponding to a different corpus. For example, "all_wiki" only includes examples from Spanish Wikipedia. By default, the config is set to "combined" which loads all the corpora; with this setting you can also specify the number of samples to return per corpus by configuring the "split" argument.
- লাইসেন্স : এমআইটি
- সংস্করণ : 1.1.0
- বিভাজন :
বিভক্ত | উদাহরণ |
---|---|
'train' | 13127490 |
- বৈশিষ্ট্য :
{
"text": {
"dtype": "string",
"id": null,
"_type": "Value"
}
}
ইউরোপারল
TFDS এ এই ডেটাসেট লোড করতে নিম্নলিখিত কমান্ডটি ব্যবহার করুন:
ds = tfds.load('huggingface:large_spanish_corpus/Europarl')
- বর্ণনা :
The Large Spanish Corpus is a compilation of 15 unlabelled Spanish corpora spanning Wikipedia to European parliament notes. Each config contains the data corresponding to a different corpus. For example, "all_wiki" only includes examples from Spanish Wikipedia. By default, the config is set to "combined" which loads all the corpora; with this setting you can also specify the number of samples to return per corpus by configuring the "split" argument.
- লাইসেন্স : এমআইটি
- সংস্করণ : 1.1.0
- বিভাজন :
বিভক্ত | উদাহরণ |
---|---|
'train' | 2174141 |
- বৈশিষ্ট্য :
{
"text": {
"dtype": "string",
"id": null,
"_type": "Value"
}
}
সংবাদ মন্তব্য 11
TFDS এ এই ডেটাসেট লোড করতে নিম্নলিখিত কমান্ডটি ব্যবহার করুন:
ds = tfds.load('huggingface:large_spanish_corpus/NewsCommentary11')
- বর্ণনা :
The Large Spanish Corpus is a compilation of 15 unlabelled Spanish corpora spanning Wikipedia to European parliament notes. Each config contains the data corresponding to a different corpus. For example, "all_wiki" only includes examples from Spanish Wikipedia. By default, the config is set to "combined" which loads all the corpora; with this setting you can also specify the number of samples to return per corpus by configuring the "split" argument.
- লাইসেন্স : এমআইটি
- সংস্করণ : 1.1.0
- বিভাজন :
বিভক্ত | উদাহরণ |
---|---|
'train' | 288771 |
- বৈশিষ্ট্য :
{
"text": {
"dtype": "string",
"id": null,
"_type": "Value"
}
}
জাতিসংঘ
TFDS এ এই ডেটাসেট লোড করতে নিম্নলিখিত কমান্ডটি ব্যবহার করুন:
ds = tfds.load('huggingface:large_spanish_corpus/UN')
- বর্ণনা :
The Large Spanish Corpus is a compilation of 15 unlabelled Spanish corpora spanning Wikipedia to European parliament notes. Each config contains the data corresponding to a different corpus. For example, "all_wiki" only includes examples from Spanish Wikipedia. By default, the config is set to "combined" which loads all the corpora; with this setting you can also specify the number of samples to return per corpus by configuring the "split" argument.
- লাইসেন্স : এমআইটি
- সংস্করণ : 1.1.0
- বিভাজন :
বিভক্ত | উদাহরণ |
---|---|
'train' | 74067 |
- বৈশিষ্ট্য :
{
"text": {
"dtype": "string",
"id": null,
"_type": "Value"
}
}
EUBookShop
TFDS এ এই ডেটাসেট লোড করতে নিম্নলিখিত কমান্ডটি ব্যবহার করুন:
ds = tfds.load('huggingface:large_spanish_corpus/EUBookShop')
- বর্ণনা :
The Large Spanish Corpus is a compilation of 15 unlabelled Spanish corpora spanning Wikipedia to European parliament notes. Each config contains the data corresponding to a different corpus. For example, "all_wiki" only includes examples from Spanish Wikipedia. By default, the config is set to "combined" which loads all the corpora; with this setting you can also specify the number of samples to return per corpus by configuring the "split" argument.
- লাইসেন্স : এমআইটি
- সংস্করণ : 1.1.0
- বিভাজন :
বিভক্ত | উদাহরণ |
---|---|
'train' | 8214959 |
- বৈশিষ্ট্য :
{
"text": {
"dtype": "string",
"id": null,
"_type": "Value"
}
}
প্যারাক্রল
TFDS এ এই ডেটাসেট লোড করতে নিম্নলিখিত কমান্ডটি ব্যবহার করুন:
ds = tfds.load('huggingface:large_spanish_corpus/ParaCrawl')
- বর্ণনা :
The Large Spanish Corpus is a compilation of 15 unlabelled Spanish corpora spanning Wikipedia to European parliament notes. Each config contains the data corresponding to a different corpus. For example, "all_wiki" only includes examples from Spanish Wikipedia. By default, the config is set to "combined" which loads all the corpora; with this setting you can also specify the number of samples to return per corpus by configuring the "split" argument.
- লাইসেন্স : এমআইটি
- সংস্করণ : 1.1.0
- বিভাজন :
বিভক্ত | উদাহরণ |
---|---|
'train' | 15510649 |
- বৈশিষ্ট্য :
{
"text": {
"dtype": "string",
"id": null,
"_type": "Value"
}
}
OpenSubtitles2018
TFDS এ এই ডেটাসেট লোড করতে নিম্নলিখিত কমান্ডটি ব্যবহার করুন:
ds = tfds.load('huggingface:large_spanish_corpus/OpenSubtitles2018')
- বর্ণনা :
The Large Spanish Corpus is a compilation of 15 unlabelled Spanish corpora spanning Wikipedia to European parliament notes. Each config contains the data corresponding to a different corpus. For example, "all_wiki" only includes examples from Spanish Wikipedia. By default, the config is set to "combined" which loads all the corpora; with this setting you can also specify the number of samples to return per corpus by configuring the "split" argument.
- লাইসেন্স : এমআইটি
- সংস্করণ : 1.1.0
- বিভাজন :
বিভক্ত | উদাহরণ |
---|---|
'train' | 213508602 |
- বৈশিষ্ট্য :
{
"text": {
"dtype": "string",
"id": null,
"_type": "Value"
}
}
ডিজিটি
TFDS এ এই ডেটাসেট লোড করতে নিম্নলিখিত কমান্ডটি ব্যবহার করুন:
ds = tfds.load('huggingface:large_spanish_corpus/DGT')
- বর্ণনা :
The Large Spanish Corpus is a compilation of 15 unlabelled Spanish corpora spanning Wikipedia to European parliament notes. Each config contains the data corresponding to a different corpus. For example, "all_wiki" only includes examples from Spanish Wikipedia. By default, the config is set to "combined" which loads all the corpora; with this setting you can also specify the number of samples to return per corpus by configuring the "split" argument.
- লাইসেন্স : এমআইটি
- সংস্করণ : 1.1.0
- বিভাজন :
বিভক্ত | উদাহরণ |
---|---|
'train' | 3168368 |
- বৈশিষ্ট্য :
{
"text": {
"dtype": "string",
"id": null,
"_type": "Value"
}
}
মিলিত
TFDS এ এই ডেটাসেট লোড করতে নিম্নলিখিত কমান্ডটি ব্যবহার করুন:
ds = tfds.load('huggingface:large_spanish_corpus/combined')
- বর্ণনা :
The Large Spanish Corpus is a compilation of 15 unlabelled Spanish corpora spanning Wikipedia to European parliament notes. Each config contains the data corresponding to a different corpus. For example, "all_wiki" only includes examples from Spanish Wikipedia. By default, the config is set to "combined" which loads all the corpora; with this setting you can also specify the number of samples to return per corpus by configuring the "split" argument.
- লাইসেন্স : এমআইটি
- সংস্করণ : 1.1.0
- বিভাজন :
বিভক্ত | উদাহরণ |
---|---|
'train' | 302656160 |
- বৈশিষ্ট্য :
{
"text": {
"dtype": "string",
"id": null,
"_type": "Value"
}
}