सन्दर्भ:
एआर-सीएस
इस डेटासेट को TFDS में लोड करने के लिए निम्नलिखित कमांड का उपयोग करें:
ds = tfds.load('huggingface:news_commentary/ar-cs')
- विवरण :
A parallel corpus of News Commentaries provided by WMT for training SMT. The source is taken from CASMACAT: http://www.casmacat.eu/corpus/news-commentary.html
12 languages, 63 bitexts
total number of files: 61,928
total number of tokens: 49.66M
total number of sentence fragments: 1.93M
- लाइसेंस : कोई ज्ञात लाइसेंस नहीं
- संस्करण : 11.0.0
- विभाजन :
विभाजित करना | उदाहरण |
---|---|
'train' | 52128 |
- विशेषताएँ :
{
"id": {
"dtype": "string",
"id": null,
"_type": "Value"
},
"translation": {
"languages": [
"ar",
"cs"
],
"id": null,
"_type": "Translation"
}
}
अर-दे
इस डेटासेट को TFDS में लोड करने के लिए निम्नलिखित कमांड का उपयोग करें:
ds = tfds.load('huggingface:news_commentary/ar-de')
- विवरण :
A parallel corpus of News Commentaries provided by WMT for training SMT. The source is taken from CASMACAT: http://www.casmacat.eu/corpus/news-commentary.html
12 languages, 63 bitexts
total number of files: 61,928
total number of tokens: 49.66M
total number of sentence fragments: 1.93M
- लाइसेंस : कोई ज्ञात लाइसेंस नहीं
- संस्करण : 11.0.0
- विभाजन :
विभाजित करना | उदाहरण |
---|---|
'train' | 68916 |
- विशेषताएँ :
{
"id": {
"dtype": "string",
"id": null,
"_type": "Value"
},
"translation": {
"languages": [
"ar",
"de"
],
"id": null,
"_type": "Translation"
}
}
सीएस-डी
इस डेटासेट को TFDS में लोड करने के लिए निम्नलिखित कमांड का उपयोग करें:
ds = tfds.load('huggingface:news_commentary/cs-de')
- विवरण :
A parallel corpus of News Commentaries provided by WMT for training SMT. The source is taken from CASMACAT: http://www.casmacat.eu/corpus/news-commentary.html
12 languages, 63 bitexts
total number of files: 61,928
total number of tokens: 49.66M
total number of sentence fragments: 1.93M
- लाइसेंस : कोई ज्ञात लाइसेंस नहीं
- संस्करण : 11.0.0
- विभाजन :
विभाजित करना | उदाहरण |
---|---|
'train' | 172706 |
- विशेषताएँ :
{
"id": {
"dtype": "string",
"id": null,
"_type": "Value"
},
"translation": {
"languages": [
"cs",
"de"
],
"id": null,
"_type": "Translation"
}
}
ar-एन
इस डेटासेट को TFDS में लोड करने के लिए निम्नलिखित कमांड का उपयोग करें:
ds = tfds.load('huggingface:news_commentary/ar-en')
- विवरण :
A parallel corpus of News Commentaries provided by WMT for training SMT. The source is taken from CASMACAT: http://www.casmacat.eu/corpus/news-commentary.html
12 languages, 63 bitexts
total number of files: 61,928
total number of tokens: 49.66M
total number of sentence fragments: 1.93M
- लाइसेंस : कोई ज्ञात लाइसेंस नहीं
- संस्करण : 11.0.0
- विभाजन :
विभाजित करना | उदाहरण |
---|---|
'train' | 83187 |
- विशेषताएँ :
{
"id": {
"dtype": "string",
"id": null,
"_type": "Value"
},
"translation": {
"languages": [
"ar",
"en"
],
"id": null,
"_type": "Translation"
}
}
सीएस-एन
इस डेटासेट को TFDS में लोड करने के लिए निम्नलिखित कमांड का उपयोग करें:
ds = tfds.load('huggingface:news_commentary/cs-en')
- विवरण :
A parallel corpus of News Commentaries provided by WMT for training SMT. The source is taken from CASMACAT: http://www.casmacat.eu/corpus/news-commentary.html
12 languages, 63 bitexts
total number of files: 61,928
total number of tokens: 49.66M
total number of sentence fragments: 1.93M
- लाइसेंस : कोई ज्ञात लाइसेंस नहीं
- संस्करण : 11.0.0
- विभाजन :
विभाजित करना | उदाहरण |
---|---|
'train' | 177278 |
- विशेषताएँ :
{
"id": {
"dtype": "string",
"id": null,
"_type": "Value"
},
"translation": {
"languages": [
"cs",
"en"
],
"id": null,
"_type": "Translation"
}
}
डे-एन
इस डेटासेट को TFDS में लोड करने के लिए निम्नलिखित कमांड का उपयोग करें:
ds = tfds.load('huggingface:news_commentary/de-en')
- विवरण :
A parallel corpus of News Commentaries provided by WMT for training SMT. The source is taken from CASMACAT: http://www.casmacat.eu/corpus/news-commentary.html
12 languages, 63 bitexts
total number of files: 61,928
total number of tokens: 49.66M
total number of sentence fragments: 1.93M
- लाइसेंस : कोई ज्ञात लाइसेंस नहीं
- संस्करण : 11.0.0
- विभाजन :
विभाजित करना | उदाहरण |
---|---|
'train' | 223153 |
- विशेषताएँ :
{
"id": {
"dtype": "string",
"id": null,
"_type": "Value"
},
"translation": {
"languages": [
"de",
"en"
],
"id": null,
"_type": "Translation"
}
}
ए आर-ES
इस डेटासेट को TFDS में लोड करने के लिए निम्नलिखित कमांड का उपयोग करें:
ds = tfds.load('huggingface:news_commentary/ar-es')
- विवरण :
A parallel corpus of News Commentaries provided by WMT for training SMT. The source is taken from CASMACAT: http://www.casmacat.eu/corpus/news-commentary.html
12 languages, 63 bitexts
total number of files: 61,928
total number of tokens: 49.66M
total number of sentence fragments: 1.93M
- लाइसेंस : कोई ज्ञात लाइसेंस नहीं
- संस्करण : 11.0.0
- विभाजन :
विभाजित करना | उदाहरण |
---|---|
'train' | 78074 |
- विशेषताएँ :
{
"id": {
"dtype": "string",
"id": null,
"_type": "Value"
},
"translation": {
"languages": [
"ar",
"es"
],
"id": null,
"_type": "Translation"
}
}
सीएस-ईएस
इस डेटासेट को TFDS में लोड करने के लिए निम्नलिखित कमांड का उपयोग करें:
ds = tfds.load('huggingface:news_commentary/cs-es')
- विवरण :
A parallel corpus of News Commentaries provided by WMT for training SMT. The source is taken from CASMACAT: http://www.casmacat.eu/corpus/news-commentary.html
12 languages, 63 bitexts
total number of files: 61,928
total number of tokens: 49.66M
total number of sentence fragments: 1.93M
- लाइसेंस : कोई ज्ञात लाइसेंस नहीं
- संस्करण : 11.0.0
- विभाजन :
विभाजित करना | उदाहरण |
---|---|
'train' | 170489 |
- विशेषताएँ :
{
"id": {
"dtype": "string",
"id": null,
"_type": "Value"
},
"translation": {
"languages": [
"cs",
"es"
],
"id": null,
"_type": "Translation"
}
}
डे-एस
इस डेटासेट को TFDS में लोड करने के लिए निम्नलिखित कमांड का उपयोग करें:
ds = tfds.load('huggingface:news_commentary/de-es')
- विवरण :
A parallel corpus of News Commentaries provided by WMT for training SMT. The source is taken from CASMACAT: http://www.casmacat.eu/corpus/news-commentary.html
12 languages, 63 bitexts
total number of files: 61,928
total number of tokens: 49.66M
total number of sentence fragments: 1.93M
- लाइसेंस : कोई ज्ञात लाइसेंस नहीं
- संस्करण : 11.0.0
- विभाजन :
विभाजित करना | उदाहरण |
---|---|
'train' | 209839 |
- विशेषताएँ :
{
"id": {
"dtype": "string",
"id": null,
"_type": "Value"
},
"translation": {
"languages": [
"de",
"es"
],
"id": null,
"_type": "Translation"
}
}
एन ES
इस डेटासेट को TFDS में लोड करने के लिए निम्नलिखित कमांड का उपयोग करें:
ds = tfds.load('huggingface:news_commentary/en-es')
- विवरण :
A parallel corpus of News Commentaries provided by WMT for training SMT. The source is taken from CASMACAT: http://www.casmacat.eu/corpus/news-commentary.html
12 languages, 63 bitexts
total number of files: 61,928
total number of tokens: 49.66M
total number of sentence fragments: 1.93M
- लाइसेंस : कोई ज्ञात लाइसेंस नहीं
- संस्करण : 11.0.0
- विभाजन :
विभाजित करना | उदाहरण |
---|---|
'train' | 238872 |
- विशेषताएँ :
{
"id": {
"dtype": "string",
"id": null,
"_type": "Value"
},
"translation": {
"languages": [
"en",
"es"
],
"id": null,
"_type": "Translation"
}
}
ar-fr
इस डेटासेट को TFDS में लोड करने के लिए निम्नलिखित कमांड का उपयोग करें:
ds = tfds.load('huggingface:news_commentary/ar-fr')
- विवरण :
A parallel corpus of News Commentaries provided by WMT for training SMT. The source is taken from CASMACAT: http://www.casmacat.eu/corpus/news-commentary.html
12 languages, 63 bitexts
total number of files: 61,928
total number of tokens: 49.66M
total number of sentence fragments: 1.93M
- लाइसेंस : कोई ज्ञात लाइसेंस नहीं
- संस्करण : 11.0.0
- विभाजन :
विभाजित करना | उदाहरण |
---|---|
'train' | 69157 |
- विशेषताएँ :
{
"id": {
"dtype": "string",
"id": null,
"_type": "Value"
},
"translation": {
"languages": [
"ar",
"fr"
],
"id": null,
"_type": "Translation"
}
}
सीएस-एफआर
इस डेटासेट को TFDS में लोड करने के लिए निम्नलिखित कमांड का उपयोग करें:
ds = tfds.load('huggingface:news_commentary/cs-fr')
- विवरण :
A parallel corpus of News Commentaries provided by WMT for training SMT. The source is taken from CASMACAT: http://www.casmacat.eu/corpus/news-commentary.html
12 languages, 63 bitexts
total number of files: 61,928
total number of tokens: 49.66M
total number of sentence fragments: 1.93M
- लाइसेंस : कोई ज्ञात लाइसेंस नहीं
- संस्करण : 11.0.0
- विभाजन :
विभाजित करना | उदाहरण |
---|---|
'train' | 148578 |
- विशेषताएँ :
{
"id": {
"dtype": "string",
"id": null,
"_type": "Value"
},
"translation": {
"languages": [
"cs",
"fr"
],
"id": null,
"_type": "Translation"
}
}
डे-फ्र
इस डेटासेट को TFDS में लोड करने के लिए निम्नलिखित कमांड का उपयोग करें:
ds = tfds.load('huggingface:news_commentary/de-fr')
- विवरण :
A parallel corpus of News Commentaries provided by WMT for training SMT. The source is taken from CASMACAT: http://www.casmacat.eu/corpus/news-commentary.html
12 languages, 63 bitexts
total number of files: 61,928
total number of tokens: 49.66M
total number of sentence fragments: 1.93M
- लाइसेंस : कोई ज्ञात लाइसेंस नहीं
- संस्करण : 11.0.0
- विभाजन :
विभाजित करना | उदाहरण |
---|---|
'train' | 185442 |
- विशेषताएँ :
{
"id": {
"dtype": "string",
"id": null,
"_type": "Value"
},
"translation": {
"languages": [
"de",
"fr"
],
"id": null,
"_type": "Translation"
}
}
एन-फ्र
इस डेटासेट को TFDS में लोड करने के लिए निम्नलिखित कमांड का उपयोग करें:
ds = tfds.load('huggingface:news_commentary/en-fr')
- विवरण :
A parallel corpus of News Commentaries provided by WMT for training SMT. The source is taken from CASMACAT: http://www.casmacat.eu/corpus/news-commentary.html
12 languages, 63 bitexts
total number of files: 61,928
total number of tokens: 49.66M
total number of sentence fragments: 1.93M
- लाइसेंस : कोई ज्ञात लाइसेंस नहीं
- संस्करण : 11.0.0
- विभाजन :
विभाजित करना | उदाहरण |
---|---|
'train' | 209479 |
- विशेषताएँ :
{
"id": {
"dtype": "string",
"id": null,
"_type": "Value"
},
"translation": {
"languages": [
"en",
"fr"
],
"id": null,
"_type": "Translation"
}
}
es-fr
इस डेटासेट को TFDS में लोड करने के लिए निम्नलिखित कमांड का उपयोग करें:
ds = tfds.load('huggingface:news_commentary/es-fr')
- विवरण :
A parallel corpus of News Commentaries provided by WMT for training SMT. The source is taken from CASMACAT: http://www.casmacat.eu/corpus/news-commentary.html
12 languages, 63 bitexts
total number of files: 61,928
total number of tokens: 49.66M
total number of sentence fragments: 1.93M
- लाइसेंस : कोई ज्ञात लाइसेंस नहीं
- संस्करण : 11.0.0
- विभाजन :
विभाजित करना | उदाहरण |
---|---|
'train' | 195241 |
- विशेषताएँ :
{
"id": {
"dtype": "string",
"id": null,
"_type": "Value"
},
"translation": {
"languages": [
"es",
"fr"
],
"id": null,
"_type": "Translation"
}
}
ar-it
इस डेटासेट को TFDS में लोड करने के लिए निम्नलिखित कमांड का उपयोग करें:
ds = tfds.load('huggingface:news_commentary/ar-it')
- विवरण :
A parallel corpus of News Commentaries provided by WMT for training SMT. The source is taken from CASMACAT: http://www.casmacat.eu/corpus/news-commentary.html
12 languages, 63 bitexts
total number of files: 61,928
total number of tokens: 49.66M
total number of sentence fragments: 1.93M
- लाइसेंस : कोई ज्ञात लाइसेंस नहीं
- संस्करण : 11.0.0
- विभाजन :
विभाजित करना | उदाहरण |
---|---|
'train' | 17227 |
- विशेषताएँ :
{
"id": {
"dtype": "string",
"id": null,
"_type": "Value"
},
"translation": {
"languages": [
"ar",
"it"
],
"id": null,
"_type": "Translation"
}
}
सीएस-यह
इस डेटासेट को TFDS में लोड करने के लिए निम्नलिखित कमांड का उपयोग करें:
ds = tfds.load('huggingface:news_commentary/cs-it')
- विवरण :
A parallel corpus of News Commentaries provided by WMT for training SMT. The source is taken from CASMACAT: http://www.casmacat.eu/corpus/news-commentary.html
12 languages, 63 bitexts
total number of files: 61,928
total number of tokens: 49.66M
total number of sentence fragments: 1.93M
- लाइसेंस : कोई ज्ञात लाइसेंस नहीं
- संस्करण : 11.0.0
- विभाजन :
विभाजित करना | उदाहरण |
---|---|
'train' | 30547 |
- विशेषताएँ :
{
"id": {
"dtype": "string",
"id": null,
"_type": "Value"
},
"translation": {
"languages": [
"cs",
"it"
],
"id": null,
"_type": "Translation"
}
}
डे-IT
इस डेटासेट को TFDS में लोड करने के लिए निम्नलिखित कमांड का उपयोग करें:
ds = tfds.load('huggingface:news_commentary/de-it')
- विवरण :
A parallel corpus of News Commentaries provided by WMT for training SMT. The source is taken from CASMACAT: http://www.casmacat.eu/corpus/news-commentary.html
12 languages, 63 bitexts
total number of files: 61,928
total number of tokens: 49.66M
total number of sentence fragments: 1.93M
- लाइसेंस : कोई ज्ञात लाइसेंस नहीं
- संस्करण : 11.0.0
- विभाजन :
विभाजित करना | उदाहरण |
---|---|
'train' | 38961 |
- विशेषताएँ :
{
"id": {
"dtype": "string",
"id": null,
"_type": "Value"
},
"translation": {
"languages": [
"de",
"it"
],
"id": null,
"_type": "Translation"
}
}
एन आईटी
इस डेटासेट को TFDS में लोड करने के लिए निम्नलिखित कमांड का उपयोग करें:
ds = tfds.load('huggingface:news_commentary/en-it')
- विवरण :
A parallel corpus of News Commentaries provided by WMT for training SMT. The source is taken from CASMACAT: http://www.casmacat.eu/corpus/news-commentary.html
12 languages, 63 bitexts
total number of files: 61,928
total number of tokens: 49.66M
total number of sentence fragments: 1.93M
- लाइसेंस : कोई ज्ञात लाइसेंस नहीं
- संस्करण : 11.0.0
- विभाजन :
विभाजित करना | उदाहरण |
---|---|
'train' | 40009 |
- विशेषताएँ :
{
"id": {
"dtype": "string",
"id": null,
"_type": "Value"
},
"translation": {
"languages": [
"en",
"it"
],
"id": null,
"_type": "Translation"
}
}
es-it
इस डेटासेट को TFDS में लोड करने के लिए निम्नलिखित कमांड का उपयोग करें:
ds = tfds.load('huggingface:news_commentary/es-it')
- विवरण :
A parallel corpus of News Commentaries provided by WMT for training SMT. The source is taken from CASMACAT: http://www.casmacat.eu/corpus/news-commentary.html
12 languages, 63 bitexts
total number of files: 61,928
total number of tokens: 49.66M
total number of sentence fragments: 1.93M
- लाइसेंस : कोई ज्ञात लाइसेंस नहीं
- संस्करण : 11.0.0
- विभाजन :
विभाजित करना | उदाहरण |
---|---|
'train' | 41497 |
- विशेषताएँ :
{
"id": {
"dtype": "string",
"id": null,
"_type": "Value"
},
"translation": {
"languages": [
"es",
"it"
],
"id": null,
"_type": "Translation"
}
}
fr-it
इस डेटासेट को TFDS में लोड करने के लिए निम्नलिखित कमांड का उपयोग करें:
ds = tfds.load('huggingface:news_commentary/fr-it')
- विवरण :
A parallel corpus of News Commentaries provided by WMT for training SMT. The source is taken from CASMACAT: http://www.casmacat.eu/corpus/news-commentary.html
12 languages, 63 bitexts
total number of files: 61,928
total number of tokens: 49.66M
total number of sentence fragments: 1.93M
- लाइसेंस : कोई ज्ञात लाइसेंस नहीं
- संस्करण : 11.0.0
- विभाजन :
विभाजित करना | उदाहरण |
---|---|
'train' | 38485 |
- विशेषताएँ :
{
"id": {
"dtype": "string",
"id": null,
"_type": "Value"
},
"translation": {
"languages": [
"fr",
"it"
],
"id": null,
"_type": "Translation"
}
}
अर-जा
इस डेटासेट को TFDS में लोड करने के लिए निम्नलिखित कमांड का उपयोग करें:
ds = tfds.load('huggingface:news_commentary/ar-ja')
- विवरण :
A parallel corpus of News Commentaries provided by WMT for training SMT. The source is taken from CASMACAT: http://www.casmacat.eu/corpus/news-commentary.html
12 languages, 63 bitexts
total number of files: 61,928
total number of tokens: 49.66M
total number of sentence fragments: 1.93M
- लाइसेंस : कोई ज्ञात लाइसेंस नहीं
- संस्करण : 11.0.0
- विभाजन :
विभाजित करना | उदाहरण |
---|---|
'train' | 569 |
- विशेषताएँ :
{
"id": {
"dtype": "string",
"id": null,
"_type": "Value"
},
"translation": {
"languages": [
"ar",
"ja"
],
"id": null,
"_type": "Translation"
}
}
सीएस-जे.ए
इस डेटासेट को TFDS में लोड करने के लिए निम्नलिखित कमांड का उपयोग करें:
ds = tfds.load('huggingface:news_commentary/cs-ja')
- विवरण :
A parallel corpus of News Commentaries provided by WMT for training SMT. The source is taken from CASMACAT: http://www.casmacat.eu/corpus/news-commentary.html
12 languages, 63 bitexts
total number of files: 61,928
total number of tokens: 49.66M
total number of sentence fragments: 1.93M
- लाइसेंस : कोई ज्ञात लाइसेंस नहीं
- संस्करण : 11.0.0
- विभाजन :
विभाजित करना | उदाहरण |
---|---|
'train' | 622 |
- विशेषताएँ :
{
"id": {
"dtype": "string",
"id": null,
"_type": "Value"
},
"translation": {
"languages": [
"cs",
"ja"
],
"id": null,
"_type": "Translation"
}
}
दे-जा
इस डेटासेट को TFDS में लोड करने के लिए निम्नलिखित कमांड का उपयोग करें:
ds = tfds.load('huggingface:news_commentary/de-ja')
- विवरण :
A parallel corpus of News Commentaries provided by WMT for training SMT. The source is taken from CASMACAT: http://www.casmacat.eu/corpus/news-commentary.html
12 languages, 63 bitexts
total number of files: 61,928
total number of tokens: 49.66M
total number of sentence fragments: 1.93M
- लाइसेंस : कोई ज्ञात लाइसेंस नहीं
- संस्करण : 11.0.0
- विभाजन :
विभाजित करना | उदाहरण |
---|---|
'train' | 582 |
- विशेषताएँ :
{
"id": {
"dtype": "string",
"id": null,
"_type": "Value"
},
"translation": {
"languages": [
"de",
"ja"
],
"id": null,
"_type": "Translation"
}
}
एन-जा
इस डेटासेट को TFDS में लोड करने के लिए निम्नलिखित कमांड का उपयोग करें:
ds = tfds.load('huggingface:news_commentary/en-ja')
- विवरण :
A parallel corpus of News Commentaries provided by WMT for training SMT. The source is taken from CASMACAT: http://www.casmacat.eu/corpus/news-commentary.html
12 languages, 63 bitexts
total number of files: 61,928
total number of tokens: 49.66M
total number of sentence fragments: 1.93M
- लाइसेंस : कोई ज्ञात लाइसेंस नहीं
- संस्करण : 11.0.0
- विभाजन :
विभाजित करना | उदाहरण |
---|---|
'train' | 637 |
- विशेषताएँ :
{
"id": {
"dtype": "string",
"id": null,
"_type": "Value"
},
"translation": {
"languages": [
"en",
"ja"
],
"id": null,
"_type": "Translation"
}
}
es-ja
इस डेटासेट को TFDS में लोड करने के लिए निम्नलिखित कमांड का उपयोग करें:
ds = tfds.load('huggingface:news_commentary/es-ja')
- विवरण :
A parallel corpus of News Commentaries provided by WMT for training SMT. The source is taken from CASMACAT: http://www.casmacat.eu/corpus/news-commentary.html
12 languages, 63 bitexts
total number of files: 61,928
total number of tokens: 49.66M
total number of sentence fragments: 1.93M
- लाइसेंस : कोई ज्ञात लाइसेंस नहीं
- संस्करण : 11.0.0
- विभाजन :
विभाजित करना | उदाहरण |
---|---|
'train' | 602 |
- विशेषताएँ :
{
"id": {
"dtype": "string",
"id": null,
"_type": "Value"
},
"translation": {
"languages": [
"es",
"ja"
],
"id": null,
"_type": "Translation"
}
}
FR-जावेद
इस डेटासेट को TFDS में लोड करने के लिए निम्नलिखित कमांड का उपयोग करें:
ds = tfds.load('huggingface:news_commentary/fr-ja')
- विवरण :
A parallel corpus of News Commentaries provided by WMT for training SMT. The source is taken from CASMACAT: http://www.casmacat.eu/corpus/news-commentary.html
12 languages, 63 bitexts
total number of files: 61,928
total number of tokens: 49.66M
total number of sentence fragments: 1.93M
- लाइसेंस : कोई ज्ञात लाइसेंस नहीं
- संस्करण : 11.0.0
- विभाजन :
विभाजित करना | उदाहरण |
---|---|
'train' | 519 |
- विशेषताएँ :
{
"id": {
"dtype": "string",
"id": null,
"_type": "Value"
},
"translation": {
"languages": [
"fr",
"ja"
],
"id": null,
"_type": "Translation"
}
}
ar-nl
इस डेटासेट को TFDS में लोड करने के लिए निम्नलिखित कमांड का उपयोग करें:
ds = tfds.load('huggingface:news_commentary/ar-nl')
- विवरण :
A parallel corpus of News Commentaries provided by WMT for training SMT. The source is taken from CASMACAT: http://www.casmacat.eu/corpus/news-commentary.html
12 languages, 63 bitexts
total number of files: 61,928
total number of tokens: 49.66M
total number of sentence fragments: 1.93M
- लाइसेंस : कोई ज्ञात लाइसेंस नहीं
- संस्करण : 11.0.0
- विभाजन :
विभाजित करना | उदाहरण |
---|---|
'train' | 9047 |
- विशेषताएँ :
{
"id": {
"dtype": "string",
"id": null,
"_type": "Value"
},
"translation": {
"languages": [
"ar",
"nl"
],
"id": null,
"_type": "Translation"
}
}
सीएस-एनएल
इस डेटासेट को TFDS में लोड करने के लिए निम्नलिखित कमांड का उपयोग करें:
ds = tfds.load('huggingface:news_commentary/cs-nl')
- विवरण :
A parallel corpus of News Commentaries provided by WMT for training SMT. The source is taken from CASMACAT: http://www.casmacat.eu/corpus/news-commentary.html
12 languages, 63 bitexts
total number of files: 61,928
total number of tokens: 49.66M
total number of sentence fragments: 1.93M
- लाइसेंस : कोई ज्ञात लाइसेंस नहीं
- संस्करण : 11.0.0
- विभाजन :
विभाजित करना | उदाहरण |
---|---|
'train' | 17358 |
- विशेषताएँ :
{
"id": {
"dtype": "string",
"id": null,
"_type": "Value"
},
"translation": {
"languages": [
"cs",
"nl"
],
"id": null,
"_type": "Translation"
}
}
डी-एनएल
इस डेटासेट को TFDS में लोड करने के लिए निम्नलिखित कमांड का उपयोग करें:
ds = tfds.load('huggingface:news_commentary/de-nl')
- विवरण :
A parallel corpus of News Commentaries provided by WMT for training SMT. The source is taken from CASMACAT: http://www.casmacat.eu/corpus/news-commentary.html
12 languages, 63 bitexts
total number of files: 61,928
total number of tokens: 49.66M
total number of sentence fragments: 1.93M
- लाइसेंस : कोई ज्ञात लाइसेंस नहीं
- संस्करण : 11.0.0
- विभाजन :
विभाजित करना | उदाहरण |
---|---|
'train' | 21439 |
- विशेषताएँ :
{
"id": {
"dtype": "string",
"id": null,
"_type": "Value"
},
"translation": {
"languages": [
"de",
"nl"
],
"id": null,
"_type": "Translation"
}
}
en-nl
इस डेटासेट को TFDS में लोड करने के लिए निम्नलिखित कमांड का उपयोग करें:
ds = tfds.load('huggingface:news_commentary/en-nl')
- विवरण :
A parallel corpus of News Commentaries provided by WMT for training SMT. The source is taken from CASMACAT: http://www.casmacat.eu/corpus/news-commentary.html
12 languages, 63 bitexts
total number of files: 61,928
total number of tokens: 49.66M
total number of sentence fragments: 1.93M
- लाइसेंस : कोई ज्ञात लाइसेंस नहीं
- संस्करण : 11.0.0
- विभाजन :
विभाजित करना | उदाहरण |
---|---|
'train' | 19399 |
- विशेषताएँ :
{
"id": {
"dtype": "string",
"id": null,
"_type": "Value"
},
"translation": {
"languages": [
"en",
"nl"
],
"id": null,
"_type": "Translation"
}
}
es-nl
इस डेटासेट को TFDS में लोड करने के लिए निम्नलिखित कमांड का उपयोग करें:
ds = tfds.load('huggingface:news_commentary/es-nl')
- विवरण :
A parallel corpus of News Commentaries provided by WMT for training SMT. The source is taken from CASMACAT: http://www.casmacat.eu/corpus/news-commentary.html
12 languages, 63 bitexts
total number of files: 61,928
total number of tokens: 49.66M
total number of sentence fragments: 1.93M
- लाइसेंस : कोई ज्ञात लाइसेंस नहीं
- संस्करण : 11.0.0
- विभाजन :
विभाजित करना | उदाहरण |
---|---|
'train' | 21012 |
- विशेषताएँ :
{
"id": {
"dtype": "string",
"id": null,
"_type": "Value"
},
"translation": {
"languages": [
"es",
"nl"
],
"id": null,
"_type": "Translation"
}
}
fr-nl
इस डेटासेट को TFDS में लोड करने के लिए निम्नलिखित कमांड का उपयोग करें:
ds = tfds.load('huggingface:news_commentary/fr-nl')
- विवरण :
A parallel corpus of News Commentaries provided by WMT for training SMT. The source is taken from CASMACAT: http://www.casmacat.eu/corpus/news-commentary.html
12 languages, 63 bitexts
total number of files: 61,928
total number of tokens: 49.66M
total number of sentence fragments: 1.93M
- लाइसेंस : कोई ज्ञात लाइसेंस नहीं
- संस्करण : 11.0.0
- विभाजन :
विभाजित करना | उदाहरण |
---|---|
'train' | 20898 |
- विशेषताएँ :
{
"id": {
"dtype": "string",
"id": null,
"_type": "Value"
},
"translation": {
"languages": [
"fr",
"nl"
],
"id": null,
"_type": "Translation"
}
}
आईटी-एनएल
इस डेटासेट को TFDS में लोड करने के लिए निम्नलिखित कमांड का उपयोग करें:
ds = tfds.load('huggingface:news_commentary/it-nl')
- विवरण :
A parallel corpus of News Commentaries provided by WMT for training SMT. The source is taken from CASMACAT: http://www.casmacat.eu/corpus/news-commentary.html
12 languages, 63 bitexts
total number of files: 61,928
total number of tokens: 49.66M
total number of sentence fragments: 1.93M
- लाइसेंस : कोई ज्ञात लाइसेंस नहीं
- संस्करण : 11.0.0
- विभाजन :
विभाजित करना | उदाहरण |
---|---|
'train' | 15428 |
- विशेषताएँ :
{
"id": {
"dtype": "string",
"id": null,
"_type": "Value"
},
"translation": {
"languages": [
"it",
"nl"
],
"id": null,
"_type": "Translation"
}
}
एआर-पीटी
इस डेटासेट को TFDS में लोड करने के लिए निम्नलिखित कमांड का उपयोग करें:
ds = tfds.load('huggingface:news_commentary/ar-pt')
- विवरण :
A parallel corpus of News Commentaries provided by WMT for training SMT. The source is taken from CASMACAT: http://www.casmacat.eu/corpus/news-commentary.html
12 languages, 63 bitexts
total number of files: 61,928
total number of tokens: 49.66M
total number of sentence fragments: 1.93M
- लाइसेंस : कोई ज्ञात लाइसेंस नहीं
- संस्करण : 11.0.0
- विभाजन :
विभाजित करना | उदाहरण |
---|---|
'train' | 11433 |
- विशेषताएँ :
{
"id": {
"dtype": "string",
"id": null,
"_type": "Value"
},
"translation": {
"languages": [
"ar",
"pt"
],
"id": null,
"_type": "Translation"
}
}
सीएस-पीटी
इस डेटासेट को TFDS में लोड करने के लिए निम्नलिखित कमांड का उपयोग करें:
ds = tfds.load('huggingface:news_commentary/cs-pt')
- विवरण :
A parallel corpus of News Commentaries provided by WMT for training SMT. The source is taken from CASMACAT: http://www.casmacat.eu/corpus/news-commentary.html
12 languages, 63 bitexts
total number of files: 61,928
total number of tokens: 49.66M
total number of sentence fragments: 1.93M
- लाइसेंस : कोई ज्ञात लाइसेंस नहीं
- संस्करण : 11.0.0
- विभाजन :
विभाजित करना | उदाहरण |
---|---|
'train' | 18356 |
- विशेषताएँ :
{
"id": {
"dtype": "string",
"id": null,
"_type": "Value"
},
"translation": {
"languages": [
"cs",
"pt"
],
"id": null,
"_type": "Translation"
}
}
डी-पीटी
इस डेटासेट को TFDS में लोड करने के लिए निम्नलिखित कमांड का उपयोग करें:
ds = tfds.load('huggingface:news_commentary/de-pt')
- विवरण :
A parallel corpus of News Commentaries provided by WMT for training SMT. The source is taken from CASMACAT: http://www.casmacat.eu/corpus/news-commentary.html
12 languages, 63 bitexts
total number of files: 61,928
total number of tokens: 49.66M
total number of sentence fragments: 1.93M
- लाइसेंस : कोई ज्ञात लाइसेंस नहीं
- संस्करण : 11.0.0
- विभाजन :
विभाजित करना | उदाहरण |
---|---|
'train' | 21884 |
- विशेषताएँ :
{
"id": {
"dtype": "string",
"id": null,
"_type": "Value"
},
"translation": {
"languages": [
"de",
"pt"
],
"id": null,
"_type": "Translation"
}
}
एन पं
इस डेटासेट को TFDS में लोड करने के लिए निम्नलिखित कमांड का उपयोग करें:
ds = tfds.load('huggingface:news_commentary/en-pt')
- विवरण :
A parallel corpus of News Commentaries provided by WMT for training SMT. The source is taken from CASMACAT: http://www.casmacat.eu/corpus/news-commentary.html
12 languages, 63 bitexts
total number of files: 61,928
total number of tokens: 49.66M
total number of sentence fragments: 1.93M
- लाइसेंस : कोई ज्ञात लाइसेंस नहीं
- संस्करण : 11.0.0
- विभाजन :
विभाजित करना | उदाहरण |
---|---|
'train' | 25929 |
- विशेषताएँ :
{
"id": {
"dtype": "string",
"id": null,
"_type": "Value"
},
"translation": {
"languages": [
"en",
"pt"
],
"id": null,
"_type": "Translation"
}
}
ईएस-पीटी
इस डेटासेट को TFDS में लोड करने के लिए निम्नलिखित कमांड का उपयोग करें:
ds = tfds.load('huggingface:news_commentary/es-pt')
- विवरण :
A parallel corpus of News Commentaries provided by WMT for training SMT. The source is taken from CASMACAT: http://www.casmacat.eu/corpus/news-commentary.html
12 languages, 63 bitexts
total number of files: 61,928
total number of tokens: 49.66M
total number of sentence fragments: 1.93M
- लाइसेंस : कोई ज्ञात लाइसेंस नहीं
- संस्करण : 11.0.0
- विभाजन :
विभाजित करना | उदाहरण |
---|---|
'train' | 25551 |
- विशेषताएँ :
{
"id": {
"dtype": "string",
"id": null,
"_type": "Value"
},
"translation": {
"languages": [
"es",
"pt"
],
"id": null,
"_type": "Translation"
}
}
FR-पीटी
इस डेटासेट को TFDS में लोड करने के लिए निम्नलिखित कमांड का उपयोग करें:
ds = tfds.load('huggingface:news_commentary/fr-pt')
- विवरण :
A parallel corpus of News Commentaries provided by WMT for training SMT. The source is taken from CASMACAT: http://www.casmacat.eu/corpus/news-commentary.html
12 languages, 63 bitexts
total number of files: 61,928
total number of tokens: 49.66M
total number of sentence fragments: 1.93M
- लाइसेंस : कोई ज्ञात लाइसेंस नहीं
- संस्करण : 11.0.0
- विभाजन :
विभाजित करना | उदाहरण |
---|---|
'train' | 25642 |
- विशेषताएँ :
{
"id": {
"dtype": "string",
"id": null,
"_type": "Value"
},
"translation": {
"languages": [
"fr",
"pt"
],
"id": null,
"_type": "Translation"
}
}
आईटी पीटी
इस डेटासेट को TFDS में लोड करने के लिए निम्नलिखित कमांड का उपयोग करें:
ds = tfds.load('huggingface:news_commentary/it-pt')
- विवरण :
A parallel corpus of News Commentaries provided by WMT for training SMT. The source is taken from CASMACAT: http://www.casmacat.eu/corpus/news-commentary.html
12 languages, 63 bitexts
total number of files: 61,928
total number of tokens: 49.66M
total number of sentence fragments: 1.93M
- लाइसेंस : कोई ज्ञात लाइसेंस नहीं
- संस्करण : 11.0.0
- विभाजन :
विभाजित करना | उदाहरण |
---|---|
'train' | 11407 |
- विशेषताएँ :
{
"id": {
"dtype": "string",
"id": null,
"_type": "Value"
},
"translation": {
"languages": [
"it",
"pt"
],
"id": null,
"_type": "Translation"
}
}
एनएल-पीटी
इस डेटासेट को TFDS में लोड करने के लिए निम्नलिखित कमांड का उपयोग करें:
ds = tfds.load('huggingface:news_commentary/nl-pt')
- विवरण :
A parallel corpus of News Commentaries provided by WMT for training SMT. The source is taken from CASMACAT: http://www.casmacat.eu/corpus/news-commentary.html
12 languages, 63 bitexts
total number of files: 61,928
total number of tokens: 49.66M
total number of sentence fragments: 1.93M
- लाइसेंस : कोई ज्ञात लाइसेंस नहीं
- संस्करण : 11.0.0
- विभाजन :
विभाजित करना | उदाहरण |
---|---|
'train' | 10598 |
- विशेषताएँ :
{
"id": {
"dtype": "string",
"id": null,
"_type": "Value"
},
"translation": {
"languages": [
"nl",
"pt"
],
"id": null,
"_type": "Translation"
}
}
एआर-आरयू
इस डेटासेट को TFDS में लोड करने के लिए निम्नलिखित कमांड का उपयोग करें:
ds = tfds.load('huggingface:news_commentary/ar-ru')
- विवरण :
A parallel corpus of News Commentaries provided by WMT for training SMT. The source is taken from CASMACAT: http://www.casmacat.eu/corpus/news-commentary.html
12 languages, 63 bitexts
total number of files: 61,928
total number of tokens: 49.66M
total number of sentence fragments: 1.93M
- लाइसेंस : कोई ज्ञात लाइसेंस नहीं
- संस्करण : 11.0.0
- विभाजन :
विभाजित करना | उदाहरण |
---|---|
'train' | 84455 |
- विशेषताएँ :
{
"id": {
"dtype": "string",
"id": null,
"_type": "Value"
},
"translation": {
"languages": [
"ar",
"ru"
],
"id": null,
"_type": "Translation"
}
}
सीएस-आरयू
इस डेटासेट को TFDS में लोड करने के लिए निम्नलिखित कमांड का उपयोग करें:
ds = tfds.load('huggingface:news_commentary/cs-ru')
- विवरण :
A parallel corpus of News Commentaries provided by WMT for training SMT. The source is taken from CASMACAT: http://www.casmacat.eu/corpus/news-commentary.html
12 languages, 63 bitexts
total number of files: 61,928
total number of tokens: 49.66M
total number of sentence fragments: 1.93M
- लाइसेंस : कोई ज्ञात लाइसेंस नहीं
- संस्करण : 11.0.0
- विभाजन :
विभाजित करना | उदाहरण |
---|---|
'train' | 161133 |
- विशेषताएँ :
{
"id": {
"dtype": "string",
"id": null,
"_type": "Value"
},
"translation": {
"languages": [
"cs",
"ru"
],
"id": null,
"_type": "Translation"
}
}
डे-रू
इस डेटासेट को TFDS में लोड करने के लिए निम्नलिखित कमांड का उपयोग करें:
ds = tfds.load('huggingface:news_commentary/de-ru')
- विवरण :
A parallel corpus of News Commentaries provided by WMT for training SMT. The source is taken from CASMACAT: http://www.casmacat.eu/corpus/news-commentary.html
12 languages, 63 bitexts
total number of files: 61,928
total number of tokens: 49.66M
total number of sentence fragments: 1.93M
- लाइसेंस : कोई ज्ञात लाइसेंस नहीं
- संस्करण : 11.0.0
- विभाजन :
विभाजित करना | उदाहरण |
---|---|
'train' | 175905 |
- विशेषताएँ :
{
"id": {
"dtype": "string",
"id": null,
"_type": "Value"
},
"translation": {
"languages": [
"de",
"ru"
],
"id": null,
"_type": "Translation"
}
}
एन आरयू
इस डेटासेट को TFDS में लोड करने के लिए निम्नलिखित कमांड का उपयोग करें:
ds = tfds.load('huggingface:news_commentary/en-ru')
- विवरण :
A parallel corpus of News Commentaries provided by WMT for training SMT. The source is taken from CASMACAT: http://www.casmacat.eu/corpus/news-commentary.html
12 languages, 63 bitexts
total number of files: 61,928
total number of tokens: 49.66M
total number of sentence fragments: 1.93M
- लाइसेंस : कोई ज्ञात लाइसेंस नहीं
- संस्करण : 11.0.0
- विभाजन :
विभाजित करना | उदाहरण |
---|---|
'train' | 190104 |
- विशेषताएँ :
{
"id": {
"dtype": "string",
"id": null,
"_type": "Value"
},
"translation": {
"languages": [
"en",
"ru"
],
"id": null,
"_type": "Translation"
}
}
es-ru
इस डेटासेट को TFDS में लोड करने के लिए निम्नलिखित कमांड का उपयोग करें:
ds = tfds.load('huggingface:news_commentary/es-ru')
- विवरण :
A parallel corpus of News Commentaries provided by WMT for training SMT. The source is taken from CASMACAT: http://www.casmacat.eu/corpus/news-commentary.html
12 languages, 63 bitexts
total number of files: 61,928
total number of tokens: 49.66M
total number of sentence fragments: 1.93M
- लाइसेंस : कोई ज्ञात लाइसेंस नहीं
- संस्करण : 11.0.0
- विभाजन :
विभाजित करना | उदाहरण |
---|---|
'train' | 180217 |
- विशेषताएँ :
{
"id": {
"dtype": "string",
"id": null,
"_type": "Value"
},
"translation": {
"languages": [
"es",
"ru"
],
"id": null,
"_type": "Translation"
}
}
fr-ru
इस डेटासेट को TFDS में लोड करने के लिए निम्नलिखित कमांड का उपयोग करें:
ds = tfds.load('huggingface:news_commentary/fr-ru')
- विवरण :
A parallel corpus of News Commentaries provided by WMT for training SMT. The source is taken from CASMACAT: http://www.casmacat.eu/corpus/news-commentary.html
12 languages, 63 bitexts
total number of files: 61,928
total number of tokens: 49.66M
total number of sentence fragments: 1.93M
- लाइसेंस : कोई ज्ञात लाइसेंस नहीं
- संस्करण : 11.0.0
- विभाजन :
विभाजित करना | उदाहरण |
---|---|
'train' | 160740 |
- विशेषताएँ :
{
"id": {
"dtype": "string",
"id": null,
"_type": "Value"
},
"translation": {
"languages": [
"fr",
"ru"
],
"id": null,
"_type": "Translation"
}
}
यह-आरयू
इस डेटासेट को TFDS में लोड करने के लिए निम्नलिखित कमांड का उपयोग करें:
ds = tfds.load('huggingface:news_commentary/it-ru')
- विवरण :
A parallel corpus of News Commentaries provided by WMT for training SMT. The source is taken from CASMACAT: http://www.casmacat.eu/corpus/news-commentary.html
12 languages, 63 bitexts
total number of files: 61,928
total number of tokens: 49.66M
total number of sentence fragments: 1.93M
- लाइसेंस : कोई ज्ञात लाइसेंस नहीं
- संस्करण : 11.0.0
- विभाजन :
विभाजित करना | उदाहरण |
---|---|
'train' | 27267 |
- विशेषताएँ :
{
"id": {
"dtype": "string",
"id": null,
"_type": "Value"
},
"translation": {
"languages": [
"it",
"ru"
],
"id": null,
"_type": "Translation"
}
}
जा-रू
इस डेटासेट को TFDS में लोड करने के लिए निम्नलिखित कमांड का उपयोग करें:
ds = tfds.load('huggingface:news_commentary/ja-ru')
- विवरण :
A parallel corpus of News Commentaries provided by WMT for training SMT. The source is taken from CASMACAT: http://www.casmacat.eu/corpus/news-commentary.html
12 languages, 63 bitexts
total number of files: 61,928
total number of tokens: 49.66M
total number of sentence fragments: 1.93M
- लाइसेंस : कोई ज्ञात लाइसेंस नहीं
- संस्करण : 11.0.0
- विभाजन :
विभाजित करना | उदाहरण |
---|---|
'train' | 586 |
- विशेषताएँ :
{
"id": {
"dtype": "string",
"id": null,
"_type": "Value"
},
"translation": {
"languages": [
"ja",
"ru"
],
"id": null,
"_type": "Translation"
}
}
एनएल-आरयू
इस डेटासेट को TFDS में लोड करने के लिए निम्नलिखित कमांड का उपयोग करें:
ds = tfds.load('huggingface:news_commentary/nl-ru')
- विवरण :
A parallel corpus of News Commentaries provided by WMT for training SMT. The source is taken from CASMACAT: http://www.casmacat.eu/corpus/news-commentary.html
12 languages, 63 bitexts
total number of files: 61,928
total number of tokens: 49.66M
total number of sentence fragments: 1.93M
- लाइसेंस : कोई ज्ञात लाइसेंस नहीं
- संस्करण : 11.0.0
- विभाजन :
विभाजित करना | उदाहरण |
---|---|
'train' | 19112 |
- विशेषताएँ :
{
"id": {
"dtype": "string",
"id": null,
"_type": "Value"
},
"translation": {
"languages": [
"nl",
"ru"
],
"id": null,
"_type": "Translation"
}
}
पीटी-आरयू
इस डेटासेट को TFDS में लोड करने के लिए निम्नलिखित कमांड का उपयोग करें:
ds = tfds.load('huggingface:news_commentary/pt-ru')
- विवरण :
A parallel corpus of News Commentaries provided by WMT for training SMT. The source is taken from CASMACAT: http://www.casmacat.eu/corpus/news-commentary.html
12 languages, 63 bitexts
total number of files: 61,928
total number of tokens: 49.66M
total number of sentence fragments: 1.93M
- लाइसेंस : कोई ज्ञात लाइसेंस नहीं
- संस्करण : 11.0.0
- विभाजन :
विभाजित करना | उदाहरण |
---|---|
'train' | 18458 |
- विशेषताएँ :
{
"id": {
"dtype": "string",
"id": null,
"_type": "Value"
},
"translation": {
"languages": [
"pt",
"ru"
],
"id": null,
"_type": "Translation"
}
}
ar-zh
इस डेटासेट को TFDS में लोड करने के लिए निम्नलिखित कमांड का उपयोग करें:
ds = tfds.load('huggingface:news_commentary/ar-zh')
- विवरण :
A parallel corpus of News Commentaries provided by WMT for training SMT. The source is taken from CASMACAT: http://www.casmacat.eu/corpus/news-commentary.html
12 languages, 63 bitexts
total number of files: 61,928
total number of tokens: 49.66M
total number of sentence fragments: 1.93M
- लाइसेंस : कोई ज्ञात लाइसेंस नहीं
- संस्करण : 11.0.0
- विभाजन :
विभाजित करना | उदाहरण |
---|---|
'train' | 66021 |
- विशेषताएँ :
{
"id": {
"dtype": "string",
"id": null,
"_type": "Value"
},
"translation": {
"languages": [
"ar",
"zh"
],
"id": null,
"_type": "Translation"
}
}
सीएस-zh
इस डेटासेट को TFDS में लोड करने के लिए निम्नलिखित कमांड का उपयोग करें:
ds = tfds.load('huggingface:news_commentary/cs-zh')
- विवरण :
A parallel corpus of News Commentaries provided by WMT for training SMT. The source is taken from CASMACAT: http://www.casmacat.eu/corpus/news-commentary.html
12 languages, 63 bitexts
total number of files: 61,928
total number of tokens: 49.66M
total number of sentence fragments: 1.93M
- लाइसेंस : कोई ज्ञात लाइसेंस नहीं
- संस्करण : 11.0.0
- विभाजन :
विभाजित करना | उदाहरण |
---|---|
'train' | 45424 |
- विशेषताएँ :
{
"id": {
"dtype": "string",
"id": null,
"_type": "Value"
},
"translation": {
"languages": [
"cs",
"zh"
],
"id": null,
"_type": "Translation"
}
}
डे-ज़ह
इस डेटासेट को TFDS में लोड करने के लिए निम्नलिखित कमांड का उपयोग करें:
ds = tfds.load('huggingface:news_commentary/de-zh')
- विवरण :
A parallel corpus of News Commentaries provided by WMT for training SMT. The source is taken from CASMACAT: http://www.casmacat.eu/corpus/news-commentary.html
12 languages, 63 bitexts
total number of files: 61,928
total number of tokens: 49.66M
total number of sentence fragments: 1.93M
- लाइसेंस : कोई ज्ञात लाइसेंस नहीं
- संस्करण : 11.0.0
- विभाजन :
विभाजित करना | उदाहरण |
---|---|
'train' | 59020 |
- विशेषताएँ :
{
"id": {
"dtype": "string",
"id": null,
"_type": "Value"
},
"translation": {
"languages": [
"de",
"zh"
],
"id": null,
"_type": "Translation"
}
}
en-zh
इस डेटासेट को TFDS में लोड करने के लिए निम्नलिखित कमांड का उपयोग करें:
ds = tfds.load('huggingface:news_commentary/en-zh')
- विवरण :
A parallel corpus of News Commentaries provided by WMT for training SMT. The source is taken from CASMACAT: http://www.casmacat.eu/corpus/news-commentary.html
12 languages, 63 bitexts
total number of files: 61,928
total number of tokens: 49.66M
total number of sentence fragments: 1.93M
- लाइसेंस : कोई ज्ञात लाइसेंस नहीं
- संस्करण : 11.0.0
- विभाजन :
विभाजित करना | उदाहरण |
---|---|
'train' | 69206 |
- विशेषताएँ :
{
"id": {
"dtype": "string",
"id": null,
"_type": "Value"
},
"translation": {
"languages": [
"en",
"zh"
],
"id": null,
"_type": "Translation"
}
}
es-zh
इस डेटासेट को TFDS में लोड करने के लिए निम्नलिखित कमांड का उपयोग करें:
ds = tfds.load('huggingface:news_commentary/es-zh')
- विवरण :
A parallel corpus of News Commentaries provided by WMT for training SMT. The source is taken from CASMACAT: http://www.casmacat.eu/corpus/news-commentary.html
12 languages, 63 bitexts
total number of files: 61,928
total number of tokens: 49.66M
total number of sentence fragments: 1.93M
- लाइसेंस : कोई ज्ञात लाइसेंस नहीं
- संस्करण : 11.0.0
- विभाजन :
विभाजित करना | उदाहरण |
---|---|
'train' | 65424 |
- विशेषताएँ :
{
"id": {
"dtype": "string",
"id": null,
"_type": "Value"
},
"translation": {
"languages": [
"es",
"zh"
],
"id": null,
"_type": "Translation"
}
}
fr-zh
इस डेटासेट को TFDS में लोड करने के लिए निम्नलिखित कमांड का उपयोग करें:
ds = tfds.load('huggingface:news_commentary/fr-zh')
- विवरण :
A parallel corpus of News Commentaries provided by WMT for training SMT. The source is taken from CASMACAT: http://www.casmacat.eu/corpus/news-commentary.html
12 languages, 63 bitexts
total number of files: 61,928
total number of tokens: 49.66M
total number of sentence fragments: 1.93M
- लाइसेंस : कोई ज्ञात लाइसेंस नहीं
- संस्करण : 11.0.0
- विभाजन :
विभाजित करना | उदाहरण |
---|---|
'train' | 59060 |
- विशेषताएँ :
{
"id": {
"dtype": "string",
"id": null,
"_type": "Value"
},
"translation": {
"languages": [
"fr",
"zh"
],
"id": null,
"_type": "Translation"
}
}
यह-zh
इस डेटासेट को TFDS में लोड करने के लिए निम्नलिखित कमांड का उपयोग करें:
ds = tfds.load('huggingface:news_commentary/it-zh')
- विवरण :
A parallel corpus of News Commentaries provided by WMT for training SMT. The source is taken from CASMACAT: http://www.casmacat.eu/corpus/news-commentary.html
12 languages, 63 bitexts
total number of files: 61,928
total number of tokens: 49.66M
total number of sentence fragments: 1.93M
- लाइसेंस : कोई ज्ञात लाइसेंस नहीं
- संस्करण : 11.0.0
- विभाजन :
विभाजित करना | उदाहरण |
---|---|
'train' | 14652 |
- विशेषताएँ :
{
"id": {
"dtype": "string",
"id": null,
"_type": "Value"
},
"translation": {
"languages": [
"it",
"zh"
],
"id": null,
"_type": "Translation"
}
}
ja-zh
इस डेटासेट को TFDS में लोड करने के लिए निम्नलिखित कमांड का उपयोग करें:
ds = tfds.load('huggingface:news_commentary/ja-zh')
- विवरण :
A parallel corpus of News Commentaries provided by WMT for training SMT. The source is taken from CASMACAT: http://www.casmacat.eu/corpus/news-commentary.html
12 languages, 63 bitexts
total number of files: 61,928
total number of tokens: 49.66M
total number of sentence fragments: 1.93M
- लाइसेंस : कोई ज्ञात लाइसेंस नहीं
- संस्करण : 11.0.0
- विभाजन :
विभाजित करना | उदाहरण |
---|---|
'train' | 570 |
- विशेषताएँ :
{
"id": {
"dtype": "string",
"id": null,
"_type": "Value"
},
"translation": {
"languages": [
"ja",
"zh"
],
"id": null,
"_type": "Translation"
}
}
nl-zh
इस डेटासेट को TFDS में लोड करने के लिए निम्नलिखित कमांड का उपयोग करें:
ds = tfds.load('huggingface:news_commentary/nl-zh')
- विवरण :
A parallel corpus of News Commentaries provided by WMT for training SMT. The source is taken from CASMACAT: http://www.casmacat.eu/corpus/news-commentary.html
12 languages, 63 bitexts
total number of files: 61,928
total number of tokens: 49.66M
total number of sentence fragments: 1.93M
- लाइसेंस : कोई ज्ञात लाइसेंस नहीं
- संस्करण : 11.0.0
- विभाजन :
विभाजित करना | उदाहरण |
---|---|
'train' | 8433 |
- विशेषताएँ :
{
"id": {
"dtype": "string",
"id": null,
"_type": "Value"
},
"translation": {
"languages": [
"nl",
"zh"
],
"id": null,
"_type": "Translation"
}
}
pt-zh
इस डेटासेट को TFDS में लोड करने के लिए निम्नलिखित कमांड का उपयोग करें:
ds = tfds.load('huggingface:news_commentary/pt-zh')
- विवरण :
A parallel corpus of News Commentaries provided by WMT for training SMT. The source is taken from CASMACAT: http://www.casmacat.eu/corpus/news-commentary.html
12 languages, 63 bitexts
total number of files: 61,928
total number of tokens: 49.66M
total number of sentence fragments: 1.93M
- लाइसेंस : कोई ज्ञात लाइसेंस नहीं
- संस्करण : 11.0.0
- विभाजन :
विभाजित करना | उदाहरण |
---|---|
'train' | 10873 |
- विशेषताएँ :
{
"id": {
"dtype": "string",
"id": null,
"_type": "Value"
},
"translation": {
"languages": [
"pt",
"zh"
],
"id": null,
"_type": "Translation"
}
}
रु-झ
इस डेटासेट को TFDS में लोड करने के लिए निम्नलिखित कमांड का उपयोग करें:
ds = tfds.load('huggingface:news_commentary/ru-zh')
- विवरण :
A parallel corpus of News Commentaries provided by WMT for training SMT. The source is taken from CASMACAT: http://www.casmacat.eu/corpus/news-commentary.html
12 languages, 63 bitexts
total number of files: 61,928
total number of tokens: 49.66M
total number of sentence fragments: 1.93M
- लाइसेंस : कोई ज्ञात लाइसेंस नहीं
- संस्करण : 11.0.0
- विभाजन :
विभाजित करना | उदाहरण |
---|---|
'train' | 47687 |
- विशेषताएँ :
{
"id": {
"dtype": "string",
"id": null,
"_type": "Value"
},
"translation": {
"languages": [
"ru",
"zh"
],
"id": null,
"_type": "Translation"
}
}