Huggingface টিএফডিএসকে কাঁটা দিয়েছে এবং প্রচুর পাঠ্য ডেটাসেট সরবরাহ করে। আরো ডকুমেন্টেশনের জন্য এখানে দেখুন. এরপরে আপনি TFDS এর সাথে ব্যবহার করা যেতে পারে এমন সমস্ত ডেটাসেটের তালিকা খুঁজে পেতে পারেন।
- acrony_identification
- ade_corpus_v2
- adv_আঠা
- প্রতিপক্ষ_qa
- aeslc
- আফ্রিকান_নার_কর্পাস
- ag_news
- ai2_arch
- air_dialogue
- ajgt_twitter_ar
- allegro_reviews
- অ্যালোসিন
- alt
- amazon_polarity
- amazon_reviews_multi
- amazon_us_reviews
- ambig_qa
- americas_nli
- আমি কি
- amttl
- anli
- অ্যাপ_রিভিউ
- aqua_rat
- জলজ
- ar_cov19
- ar_res_reviews
- ar_sarcasm
- আরবি_বিলিয়ন_শব্দ
- আরবি_পোস_উপভাষা
- arabic_speech_corpus
- arcd
- arsend_lev
- শিল্প
- arxiv_dataset
- ascent_kb
- aslg_pc12
- asnq
- সম্পদ
- গুপ্তঘাতক
- assin2
- পারমাণবিক
- অশুমাটো
- babi_qa
- ব্যাংকিং77
- bbaw_মিশরীয়
- bbc_hindi_nli
- bc2gm_corpus
- মটরশুটি
- সেরা 2009
- বিয়ানেট
- bible_para
- বড়_পেটেন্ট
- বিগবেঞ্চ
- বিলসাম
- bing_coronavirus_query_set
- biomrc
- বায়োসেস
- biwi_kinect_head_pose
- blbooks
- blbooks জেনার
- মিশ্রিত_দক্ষতা_কথা
- ব্লিম্প
- blog_authorship_corpus
- bn_ঘৃণা_বক্তৃতা
- bnl_newspapers
- বুককর্পাস
- bookcorpusopen
- boolq
- bprec
- ব্রেক_ডেটা
- brwac
- bsd_ja_en
- bswac
- c3
- c4
- cail2018
- ক্যানার
- capes
- ক্যাসিনো
- ক্যাটালোনিয়া_স্বাধীনতা
- বিড়াল_বনাম_কুকুর
- cawac
- সিবিটি
- cc100
- cc_news
- caligned_বহুভাষিক
- cdsc
- cdt
- সিডার
- cfq
- chr_en
- cifar10
- cifar100
- প্রায়
- নাগরিক_মন্তব্য
- clickbait_news_bg
- জলবায়ু_জ্বর
- clinc_oos
- সূত্র
- cmrc2018
- cmu_Hinglish_dog
- cnn_dailymail
- coached_conv_pref
- coarse_discourse
- চোদা
- কোড_সার্চ_নেট
- code_x_glue_cc_clone_detection_big_clone_bench
- code_x_glue_cc_clone_detection_poj104
- code_x_glue_cc_cloze_testing_all
- code_x_glue_cc_cloze_testing_maxmin
- code_x_glue_cc_code_completion_line
- code_x_glue_cc_code_completion_token
- code_x_glue_cc_code_refinement
- code_x_glue_cc_code_to_code_trans
- code_x_glue_cc_defect_detection
- code_x_glue_ct_code_to_text
- code_x_glue_tc_nl_code_search_adv
- code_x_glue_tc_text_to_code
- code_x_glue_tt_text_to_text
- com_qa
- সাধারণ_জেন
- সাধারণ ভাষা
- সাধারণ_কণ্ঠ
- commonsense_qa
- প্রতিযোগিতা_গণিত
- অনুমান কি
- কনসেপ্টনেট5
- ধারণাগত_12 মি
- ধারণাগত_ক্যাপশন
- conll2000
- conll2002
- conll2003
- conll2012_ontonotesv5
- conllpp
- ভোক্তা-অর্থ-অভিযোগ
- conv_ai
- conv_ai_2
- conv_ai_3
- conv_questions
- কোকা
- কর্ড19
- cornell_movie_dialog
- cos_e
- cosmos_qa
- পাল্টা
- covid_qa_castorini
- covid_qa_deepset
- covid_qa_ucsd
- covid_tweets_japanese
- covost2
- cppe-5
- craigslist_দরদাম
- crawl_domain
- crd3
- অপরাধ_এবং শাস্তি
- কাক_জোড়া
- ক্রিপ্টোনাইট
- cs_restaurants
- cuad
- কৌতূহল_সংলাপ
- daily_dialog
- ডেন
- ডেনিশ_রাজনৈতিক_মন্তব্য
- ডার্ট
- datacommons_factcheck
- dbpedia_14
- dbrd
- চুক্তি_বা_না_সংলাপ
- definite_pronoun_resolution
- ডেঙ্গু_ফিলিপিনো
- dialog_re
- কূটনীতি_সনাক্তকরণ
- দুর্যোগ_প্রতিক্রিয়া_বার্তা
- বিচ্ছিন্ন করা
- আবিষ্কার
- disfl_qa
- doc2dial
- মতবাদ
- দোকা
- স্বপ্ন
- ড্রপ
- duorc
- ডাচ_সামাজিক
- dyk
- e2e_nlg
- e2e_nlg_পরিষ্কার করা হয়েছে
- ecb
- ecthr_cases
- শিক্ষা
- ehealth_kd
- eitb_parcc
- বিদ্যুৎ_লোড_ডায়াগ্রাম
- eli5
- eli5_শ্রেণী
- elkarhizketak
- emea
- ইমো
- আবেগ
- emotone_ar
- সহানুভূতিশীল_সংলাপ
- সমৃদ্ধ_ওয়েব_এনএলজি
- enwik8
- ইরেজার_মাল্টি_আরসি
- esnli
- eth_py150_open
- নীতি
- ett
- eu_regulatory_ir
- ইউরলেক্স
- ইউরোনিউজ
- europa_eac_tm
- europa_ecdc_tm
- europarl_bilingual
- ঘটনা2মন
- প্রমাণ_ইনফার_ট্রিটমেন্ট
- পরীক্ষা
- factckbr
- ফেক_নিউজ_ইংরেজি
- fake_news_filipino
- farsi_news
- fashion_mnist
- জ্বর
- কয়েক_রেল
- আর্থিক_ফ্রেজব্যাঙ্ক
- সূক্ষ্ম
- flores
- ফ্লু
- খাদ্য101
- দল
- freebase_qa
- ফাঁক
- মণি
- generated_reviews_enth
- generics_kb
- জার্মান_আইনি_সত্তা_স্বীকৃতি
- জার্মান
- germeval_14
- giga_fren
- গিগাওয়ার্ড
- গ্লুকোজ
- আঠা
- gnad10
- go_emotions
- gooaq
- google_wellformed_query
- grail_qa
- মহান_কোড
- গ্রীক_আইনি_কোড
- gsm8k
- guardian_authorship
- গুটেনবার্গ_টাইম
- হ্যান্স
- হ্যান্সার্ডস
- কঠিন
- হারেম
- আছে_অংশ
- ঘৃণা_আপত্তিকর
- ঘৃণা_বক্তৃতা18
- ঘৃণা_বক্তৃতা_ফিলিপিনো
- ঘৃণা_বক্তৃতা_আপত্তিকর
- ঘৃণা_বক্তৃতা_pl
- ঘৃণা_বক্তৃতা_পর্তুগিজ
- হেট ব্যাখ্যা
- hausa_voa_ner
- hausa_voa_topics
- hda_nli_হিন্দি
- head_qa
- স্বাস্থ্য_তথ্য
- hebrew_projectbenyehuda
- হিব্রু_সেন্টিমেন্ট
- হিব্রু_এই_বিশ্ব
- হেলাসওয়াগ
- হেন্ড্রিক্স_টেস্ট
- hind_encorp
- হিন্দি_কথা
- হিপোকর্পাস
- hkcancor
- এইচএলজিডি
- আশা_ইডি
- hotpot_qa
- হোভার
- hrenwac_para
- hrwac
- humicroedit
- hybrid_qa
- hyperpartisan_news_detection
- iapp_wiki_qa_squad
- id_clickbait
- id_liputan6
- id_nergrit_corpus
- id_newspapers_2018
- id_panl_bppt
- id_puisi
- igbo_English_machine_translation
- igbo_monolingual
- igbo_ner
- আমি তালিকা
- imagenet-1k
- imagenet_sketch
- imdb
- imdb_urdu_reviews
- প্রভাবিত করে
- indic_glue
- indonli
- indonlu
- inquisitive_qg
- interpress_news_category_tr
- interpress_news_category_tr_lite
- irc_disentangle
- isixhosa_ner_corpus
- isizulu_ner_corpus
- iwslt2017
- বিপদ
- jfleg
- jigsaw_toxicity_pred
- jigsaw_unintended_bias
- jnlpba
- সাংবাদিকদের_প্রশ্ন
- কান_আশা
- কন্নড়_সংবাদ
- kd_conv
- kde4
- কেলম
- kilt_tasks
- kilt_wikipedia
- kinnews_kirnews
- klue
- kor_3i4k
- kor_hate
- kor_ner
- kor_nli
- kor_nlu
- kor_qpair
- kor_sae
- kor_sarcasm
- ল্যাবর
- লামা
- লাম্বাদা
- বড়_স্প্যানিশ_কর্পাস
- laroseda
- lc_quad
- এলসিসি
- lener_br
- লেক্স_আঠা
- মিথ্যাবাদী
- librispeech_asr
- librispeech_lm
- সীমা
- লিন্স
- লিনিয়াস
- liveqa
- lj_speech
- lm1 খ
- lst20
- m_lama
- mac_morpho
- মাখজান
- মাসখানের
- গণিত_ডেটাসেট
- math_qa
- matinf
- এমবিপিপি
- mc4
- mc_taco
- md_gender_bias
- এমডিডি
- med_hop
- পদক
- মেডিকেল_ডায়ালগ
- চিকিৎসা_প্রশ্ন_জোড়া
- medmcqa
- menyo20k_mt
- meta_woz
- মেটাশিফ্ট
- metooma
- metrec
- মিয়াম
- mkb
- mkqa
- mlqa
- mlsum
- mnist
- মোচা
- monash_tsf
- মরোকো
- চলচ্চিত্র_যুক্তি
- mrqa
- ms_marco
- ms_terms
- msr_genomics_kbcomp
- msr_sqa
- msr_text_compression
- msr_zhen_translation_parity
- msra_ner
- mt_eng_ভিয়েতনামী
- মুকোসিন
- মাল্টি_বুক
- মাল্টি_ইউরলেক্স
- বহু_সংবাদ
- multi_nli
- বহু_nli_অমিল
- মাল্টি_প্যারা_ক্রল
- multi_re_qa
- multi_woz_v22
- multi_x_science_sum
- multidoc2dial
- বহুভাষিক_লিব্রিস্পিচ
- পারস্পরিক বন্ধু
- mwsc
- মায়ানমার_সংবাদ
- আখ্যান
- narrativeqa_manual
- স্বাভাবিক_প্রশ্ন
- ncbi_রোগ
- nchlt
- ncslgr
- নেল
- নিউরাল_কোড_সার্চ
- সংবাদ_মন্তব্য
- সংবাদ গোষ্ঠী
- সংবাদ
- newsph_nli
- নিউজপপ
- newsqa
- নিউজরুম
- nkjp-ner
- nli_tr
- nlu_মূল্যায়ন_ডেটা
- norec
- নরনে
- নরওয়েজিয়ান_নার
- nq_খোলা
- nsmc
- সংখ্যা_বোধ
- সংখ্যাসূচক_ফিউজড_হেড
- oclar
- offcombr
- offenseval2020_tr
- offenseval_dravidian
- অফিস_পাবলিক
- ohsumed
- অলি
- omp
- onestop_english
- onestop_qa
- খোলা_সাবটাইটেল
- openai_humaneval
- openbookqa
- openslr
- openwebtext
- opinosis
- opus100
- opus_books
- opus_dgt
- opus_dogc
- opus_elhuyar
- opus_euconst
- opus_finlex
- opus_fiskmo
- opus_gnome
- opus_infopankki
- opus_memat
- opus_montenegrinsubs
- opus_openoffice
- opus_paracrawl
- opus_rf
- opus_tedtalks
- opus_ubuntu
- opus_wikipedia
- opus_xhosanavy
- কমলা_সমষ্টি
- অস্কার
- para_crawl
- para_pat
- parsinlu_reading_comprehension
- পাস
- paws
- paws-x
- পিইসি
- peer_read
- জনগণের_দৈনিক_নার
- প্রতি_প্রেরিত
- পার্সিয়ান_নার
- pg19
- php
- piaf
- পিব
- পিকা
- pn_summary
- কবিতা_অনুভূতি
- পোলেমো2
- poleval2019_সাইবার বুলিং
- poleval2019_mt
- polsum
- polyglot_ner
- prachathai67k
- প্রাগমেভাল
- proto_qa
- পিএসসি
- ptb_পাঠ্য_শুধুমাত্র
- pubmed
- pubmed_qa
- py_ast
- qa4mre
- qa_srl
- qa_zre
- ক্যাঙ্গারু
- কোয়ান্টা
- qasc
- কাস্পার
- qed
- qed_amara
- কোয়াক
- কোয়েল
- ঝগড়া
- কোয়ার্টজ
- দ্রুত আঁক
- কোরা
- কোরেফ
- জাতি
- পুনরায়_ডায়াল করুন
- যুক্তি_বিজি
- রেসিপি_এনএলজি
- reclor
- লাল_ক্যাপস
- reddit_tifu
- refreshd
- reuters21578
- ধাঁধা_বোধ
- ro_sent
- ro_sts
- ro_sts_সমান্তরাল
- roman_urdu
- রোমান_উর্দু_ঘৃণ্য_ভাষণ
- রোনেক
- দড়ি
- পচা টমেটো
- রাশিয়ান_সুপার_আঠা
- rvl_cdip
- s2orc
- সামসুম
- sanskrit_classic
- saudinewsnet
- sberquad
- sbu_ক্যাপশন
- স্ক্যান
- scb_mt_enth_2020
- দৃশ্য_পার্স_১৫০
- schema_guided_dstc8
- সাইসাইট
- scielo
- scientific_papers
- scifact
- sciq
- scitail
- scitldr
- search_qa
- sede
- সেলকা
- sem_eval_2010_task_8
- sem_eval_2014_task_1
- sem_eval_2018_task_1
- sem_eval_2020_task_11
- send_comp
- senti_lex
- senti_ws
- অনুভূতি140
- sepedi_ner
- সেসোথো_নার_কর্পাস
- সেট
- setswana_ner_corpus
- শার্ক
- sharc_modified
- অসুস্থ
- সিলিকন
- সহজ_প্রশ্ন_v2
- siswati_ner_corpus
- স্মার্টডেটা
- এসএমএস_স্প্যাম
- snips_built_in_intents
- snli
- তুষার_সরলীকৃত_জাপানি_কর্পাস
- so_stacksample
- সামাজিক_বায়াস_ফ্রেম
- সামাজিক_i_qa
- sofc_materials_articles
- sogou_news
- স্প্যানিশ_বিলিয়ন_শব্দ
- spc
- প্রজাতি_800
- স্পিচ_কমান্ড
- মাকড়সা
- দল
- স্কোয়াড_প্রতিপক্ষ
- squad_es
- স্কোয়াড_এটি
- squad_kor_v1
- squad_kor_v2
- squad_v1_pt
- squad_v2
- স্কোয়াডশিফ্ট
- srwac
- sst
- স্টেরিওসেট
- story_cloze
- stsb_mt_sv
- stsb_multi_mt
- শৈলী_পরিবর্তন_শনাক্তকরণ
- subjqa
- ভালো আঠা
- চমত্কার
- svhn
- চোরাই মাল
- সোয়াহিলি
- swahili_news
- swda
- সুইডিশ_মেডিকেল_নার
- সুইডিশ_নার_কর্পাস
- সুইডিশ_রিভিউ
- swiss_judgement_prediction
- ট্যাব_ফ্যাক্ট
- তামিলমিশ্রিত অনুভূতি
- তানজিল
- tapaco
- তাশকিলা
- টাস্কমাস্টার 1
- টাস্কমাস্টার2
- টাস্কমাস্টার3
- tatoeba
- ted_hrlr
- ted_iwlst2013
- ted_multi
- ted_talks_iwslt
- তেলুগু_বই
- তেলুগু_সংবাদ
- tep_en_fa_para
- text2log
- textvqa
- থাই_বিষাক্ত_টুইট
- থাইনার
- থাইকা_দল
- থাইসাম
- the_pile
- the_pile_books3
- the_pile_openwebtext2
- the_pile_stack_exchange
- টিল্ড_মডেল
- time_dial
- সময়ের_ভারত_সংবাদ_শিরোনাম
- timit_asr
- ছোট_শেক্সপিয়ার
- টিএলসি
- tmu_gfm_dataset
- tne
- কথিত-ব্র
- সম্পূর্ণ
- ট্রেক
- trivia_qa
- সত্যবাদী_qa
- tsac
- ttc4900
- টুনিজি
- tuple_ie
- তুর্ক
- turkic_xwmt
- তুর্কি_মুভি_সেন্টিমেন্ট
- তুর্কি_নার
- তুর্কি_পণ্য_পর্যালোচনা
- তুর্কি_সঙ্কুচিত_নার
- turku_ner_corpus
- tweet_eval
- tweet_qa
- tweets_ar_en_parallel
- tweets_hate_speech_detection
- twi_text_c3
- twi_wordsim353
- টাইডিকা
- ubuntu_dialogs_corpus
- udhr
- um005
- un_ga
- un_multi
- আন_পিসি
- সার্বজনীন_নির্ভরতা
- universal_morphologies
- urdu_fake_news
- urdu_sentiment_corpus
- vctk
- visual_genome
- vivos
- web_nlg
- web_of_science
- ওয়েব_প্রশ্ন
- weibo_ner
- wi_locness
- চওড়া_মুখ
- wiki40b
- wiki_asp
- wiki_atomic_edits
- উইকি_অটো
- wiki_bio
- উইকি_ডিপিআর
- উইকি_হপ
- wiki_lingua
- উইকি_মুভি
- wiki_qa
- wiki_qa_ar
- wiki_snippets
- wiki_source
- উইকি_বিভক্ত
- wiki_summary
- উইকিয়ান
- উইকিকর্পাস
- উইকিহাউ
- উইকিপিডিয়া
- wikisql
- উইকিটেবল প্রশ্ন
- উইকিটেক্সট
- wikitext_tl39
- wili_2018
- wino_bias
- winograd_wsc
- উইনোগ্রান্ড
- উইকা
- বুদ্ধিমান1000
- বুদ্ধিমান_অনুভূতি
- wmt14
- wmt15
- wmt16
- wmt17
- wmt18
- wmt19
- wmt20_mlqe_task1
- wmt20_mlqe_task2
- wmt20_mlqe_task3
- wmt_t2t
- wnut_17
- wongnai_reviews
- woz_dialogue
- wrbsc
- x_স্ট্যান্স
- এক্সকোপা
- xcsr
- xed_en_fi
- xglue
- xnli
- xor_tydi_qa
- xquad
- xquad_r
- xsum
- xsum_বাস্তবতা
- চরম
- yahoo_উত্তর_qa
- yahoo_উত্তর_বিষয়
- yelp_polarity
- yelp_review_full
- yoruba_bbc_topics
- yoruba_gv_ner
- yoruba_text_c3
- yoruba_wordsim353
- ইউটিউব_ক্যাপশন_সংশোধন
- zest