पीआईबी

सन्दर्भ:

या-उर

इस डेटासेट को TFDS में लोड करने के लिए निम्नलिखित कमांड का उपयोग करें:

ds = tfds.load('huggingface:pib/or-ur')
  • विवरण :
Sentence aligned parallel corpus between 11 Indian Languages, crawled and extracted from the press information bureau
website.
  • लाइसेंस : कोई ज्ञात लाइसेंस नहीं
  • संस्करण : 1.3.0
  • विभाजन :
विभाजित करना उदाहरण
'train' 43766
  • विशेषताएँ :
{
    "translation": {
        "languages": [
            "or",
            "ur"
        ],
        "id": null,
        "_type": "Translation"
    }
}

एमएल-या

इस डेटासेट को TFDS में लोड करने के लिए निम्नलिखित कमांड का उपयोग करें:

ds = tfds.load('huggingface:pib/ml-or')
  • विवरण :
Sentence aligned parallel corpus between 11 Indian Languages, crawled and extracted from the press information bureau
website.
  • लाइसेंस : कोई ज्ञात लाइसेंस नहीं
  • संस्करण : 1.3.0
  • विभाजन :
विभाजित करना उदाहरण
'train' 19413
  • विशेषताएँ :
{
    "translation": {
        "languages": [
            "ml",
            "or"
        ],
        "id": null,
        "_type": "Translation"
    }
}

बीएन-टीए

इस डेटासेट को TFDS में लोड करने के लिए निम्नलिखित कमांड का उपयोग करें:

ds = tfds.load('huggingface:pib/bn-ta')
  • विवरण :
Sentence aligned parallel corpus between 11 Indian Languages, crawled and extracted from the press information bureau
website.
  • लाइसेंस : कोई ज्ञात लाइसेंस नहीं
  • संस्करण : 1.3.0
  • विभाजन :
विभाजित करना उदाहरण
'train' 33005
  • विशेषताएँ :
{
    "translation": {
        "languages": [
            "bn",
            "ta"
        ],
        "id": null,
        "_type": "Translation"
    }
}

गु-श्री

इस डेटासेट को TFDS में लोड करने के लिए निम्नलिखित कमांड का उपयोग करें:

ds = tfds.load('huggingface:pib/gu-mr')
  • विवरण :
Sentence aligned parallel corpus between 11 Indian Languages, crawled and extracted from the press information bureau
website.
  • लाइसेंस : कोई ज्ञात लाइसेंस नहीं
  • संस्करण : 1.3.0
  • विभाजन :
विभाजित करना उदाहरण
'train' 30766
  • विशेषताएँ :
{
    "translation": {
        "languages": [
            "gu",
            "mr"
        ],
        "id": null,
        "_type": "Translation"
    }
}

हाय-या

इस डेटासेट को TFDS में लोड करने के लिए निम्नलिखित कमांड का उपयोग करें:

ds = tfds.load('huggingface:pib/hi-or')
  • विवरण :
Sentence aligned parallel corpus between 11 Indian Languages, crawled and extracted from the press information bureau
website.
  • लाइसेंस : कोई ज्ञात लाइसेंस नहीं
  • संस्करण : 1.3.0
  • विभाजन :
विभाजित करना उदाहरण
'train' 61070
  • विशेषताएँ :
{
    "translation": {
        "languages": [
            "hi",
            "or"
        ],
        "id": null,
        "_type": "Translation"
    }
}

एन-या

इस डेटासेट को TFDS में लोड करने के लिए निम्नलिखित कमांड का उपयोग करें:

ds = tfds.load('huggingface:pib/en-or')
  • विवरण :
Sentence aligned parallel corpus between 11 Indian Languages, crawled and extracted from the press information bureau
website.
  • लाइसेंस : कोई ज्ञात लाइसेंस नहीं
  • संस्करण : 1.3.0
  • विभाजन :
विभाजित करना उदाहरण
'train' 98230
  • विशेषताएँ :
{
    "translation": {
        "languages": [
            "en",
            "or"
        ],
        "id": null,
        "_type": "Translation"
    }
}

श्रीमान-उर

इस डेटासेट को TFDS में लोड करने के लिए निम्नलिखित कमांड का उपयोग करें:

ds = tfds.load('huggingface:pib/mr-ur')
  • विवरण :
Sentence aligned parallel corpus between 11 Indian Languages, crawled and extracted from the press information bureau
website.
  • लाइसेंस : कोई ज्ञात लाइसेंस नहीं
  • संस्करण : 1.3.0
  • विभाजन :
विभाजित करना उदाहरण
'train' 49691
  • विशेषताएँ :
{
    "translation": {
        "languages": [
            "mr",
            "ur"
        ],
        "id": null,
        "_type": "Translation"
    }
}

एन-टा

इस डेटासेट को TFDS में लोड करने के लिए निम्नलिखित कमांड का उपयोग करें:

ds = tfds.load('huggingface:pib/en-ta')
  • विवरण :
Sentence aligned parallel corpus between 11 Indian Languages, crawled and extracted from the press information bureau
website.
  • लाइसेंस : कोई ज्ञात लाइसेंस नहीं
  • संस्करण : 1.3.0
  • विभाजन :
विभाजित करना उदाहरण
'train' 118759
  • विशेषताएँ :
{
    "translation": {
        "languages": [
            "en",
            "ta"
        ],
        "id": null,
        "_type": "Translation"
    }
}

मारना

इस डेटासेट को TFDS में लोड करने के लिए निम्नलिखित कमांड का उपयोग करें:

ds = tfds.load('huggingface:pib/hi-ta')
  • विवरण :
Sentence aligned parallel corpus between 11 Indian Languages, crawled and extracted from the press information bureau
website.
  • लाइसेंस : कोई ज्ञात लाइसेंस नहीं
  • संस्करण : 1.3.0
  • विभाजन :
विभाजित करना उदाहरण
'train' 64945
  • विशेषताएँ :
{
    "translation": {
        "languages": [
            "hi",
            "ta"
        ],
        "id": null,
        "_type": "Translation"
    }
}

बीएन-एन

इस डेटासेट को TFDS में लोड करने के लिए निम्नलिखित कमांड का उपयोग करें:

ds = tfds.load('huggingface:pib/bn-en')
  • विवरण :
Sentence aligned parallel corpus between 11 Indian Languages, crawled and extracted from the press information bureau
website.
  • लाइसेंस : कोई ज्ञात लाइसेंस नहीं
  • संस्करण : 1.3.0
  • विभाजन :
विभाजित करना उदाहरण
'train' 93560
  • विशेषताएँ :
{
    "translation": {
        "languages": [
            "bn",
            "en"
        ],
        "id": null,
        "_type": "Translation"
    }
}

बीएन-या

इस डेटासेट को TFDS में लोड करने के लिए निम्नलिखित कमांड का उपयोग करें:

ds = tfds.load('huggingface:pib/bn-or')
  • विवरण :
Sentence aligned parallel corpus between 11 Indian Languages, crawled and extracted from the press information bureau
website.
  • लाइसेंस : कोई ज्ञात लाइसेंस नहीं
  • संस्करण : 1.3.0
  • विभाजन :
विभाजित करना उदाहरण
'train' 26456
  • विशेषताएँ :
{
    "translation": {
        "languages": [
            "bn",
            "or"
        ],
        "id": null,
        "_type": "Translation"
    }
}

एमएल-टा

इस डेटासेट को TFDS में लोड करने के लिए निम्नलिखित कमांड का उपयोग करें:

ds = tfds.load('huggingface:pib/ml-ta')
  • विवरण :
Sentence aligned parallel corpus between 11 Indian Languages, crawled and extracted from the press information bureau
website.
  • लाइसेंस : कोई ज्ञात लाइसेंस नहीं
  • संस्करण : 1.3.0
  • विभाजन :
विभाजित करना उदाहरण
'train' 23609
  • विशेषताएँ :
{
    "translation": {
        "languages": [
            "ml",
            "ta"
        ],
        "id": null,
        "_type": "Translation"
    }
}

गु-उर

इस डेटासेट को TFDS में लोड करने के लिए निम्नलिखित कमांड का उपयोग करें:

ds = tfds.load('huggingface:pib/gu-ur')
  • विवरण :
Sentence aligned parallel corpus between 11 Indian Languages, crawled and extracted from the press information bureau
website.
  • लाइसेंस : कोई ज्ञात लाइसेंस नहीं
  • संस्करण : 1.3.0
  • विभाजन :
विभाजित करना उदाहरण
'train' 29938
  • विशेषताएँ :
{
    "translation": {
        "languages": [
            "gu",
            "ur"
        ],
        "id": null,
        "_type": "Translation"
    }
}

बीएन-एमएल

इस डेटासेट को TFDS में लोड करने के लिए निम्नलिखित कमांड का उपयोग करें:

ds = tfds.load('huggingface:pib/bn-ml')
  • विवरण :
Sentence aligned parallel corpus between 11 Indian Languages, crawled and extracted from the press information bureau
website.
  • लाइसेंस : कोई ज्ञात लाइसेंस नहीं
  • संस्करण : 1.3.0
  • विभाजन :
विभाजित करना उदाहरण
'train' 18149
  • विशेषताएँ :
{
    "translation": {
        "languages": [
            "bn",
            "ml"
        ],
        "id": null,
        "_type": "Translation"
    }
}

एमएल-पीए

इस डेटासेट को TFDS में लोड करने के लिए निम्नलिखित कमांड का उपयोग करें:

ds = tfds.load('huggingface:pib/ml-pa')
  • विवरण :
Sentence aligned parallel corpus between 11 Indian Languages, crawled and extracted from the press information bureau
website.
  • लाइसेंस : कोई ज्ञात लाइसेंस नहीं
  • संस्करण : 1.3.0
  • विभाजन :
विभाजित करना उदाहरण
'train' 21978
  • विशेषताएँ :
{
    "translation": {
        "languages": [
            "ml",
            "pa"
        ],
        "id": null,
        "_type": "Translation"
    }
}

en-pa

इस डेटासेट को TFDS में लोड करने के लिए निम्नलिखित कमांड का उपयोग करें:

ds = tfds.load('huggingface:pib/en-pa')
  • विवरण :
Sentence aligned parallel corpus between 11 Indian Languages, crawled and extracted from the press information bureau
website.
  • लाइसेंस : कोई ज्ञात लाइसेंस नहीं
  • संस्करण : 1.3.0
  • विभाजन :
विभाजित करना उदाहरण
'train' 103296
  • विशेषताएँ :
{
    "translation": {
        "languages": [
            "en",
            "pa"
        ],
        "id": null,
        "_type": "Translation"
    }
}

बीएन-हाय

इस डेटासेट को TFDS में लोड करने के लिए निम्नलिखित कमांड का उपयोग करें:

ds = tfds.load('huggingface:pib/bn-hi')
  • विवरण :
Sentence aligned parallel corpus between 11 Indian Languages, crawled and extracted from the press information bureau
website.
  • लाइसेंस : कोई ज्ञात लाइसेंस नहीं
  • संस्करण : 1.3.0
  • विभाजन :
विभाजित करना उदाहरण
'train' 49598
  • विशेषताएँ :
{
    "translation": {
        "languages": [
            "bn",
            "hi"
        ],
        "id": null,
        "_type": "Translation"
    }
}

हाय-पा

इस डेटासेट को TFDS में लोड करने के लिए निम्नलिखित कमांड का उपयोग करें:

ds = tfds.load('huggingface:pib/hi-pa')
  • विवरण :
Sentence aligned parallel corpus between 11 Indian Languages, crawled and extracted from the press information bureau
website.
  • लाइसेंस : कोई ज्ञात लाइसेंस नहीं
  • संस्करण : 1.3.0
  • विभाजन :
विभाजित करना उदाहरण
'train' 75200
  • विशेषताएँ :
{
    "translation": {
        "languages": [
            "hi",
            "pa"
        ],
        "id": null,
        "_type": "Translation"
    }
}

गु-ते

इस डेटासेट को TFDS में लोड करने के लिए निम्नलिखित कमांड का उपयोग करें:

ds = tfds.load('huggingface:pib/gu-te')
  • विवरण :
Sentence aligned parallel corpus between 11 Indian Languages, crawled and extracted from the press information bureau
website.
  • लाइसेंस : कोई ज्ञात लाइसेंस नहीं
  • संस्करण : 1.3.0
  • विभाजन :
विभाजित करना उदाहरण
'train' 16335
  • विशेषताएँ :
{
    "translation": {
        "languages": [
            "gu",
            "te"
        ],
        "id": null,
        "_type": "Translation"
    }
}

पा-ता

इस डेटासेट को TFDS में लोड करने के लिए निम्नलिखित कमांड का उपयोग करें:

ds = tfds.load('huggingface:pib/pa-ta')
  • विवरण :
Sentence aligned parallel corpus between 11 Indian Languages, crawled and extracted from the press information bureau
website.
  • लाइसेंस : कोई ज्ञात लाइसेंस नहीं
  • संस्करण : 1.3.0
  • विभाजन :
विभाजित करना उदाहरण
'train' 46349
  • विशेषताएँ :
{
    "translation": {
        "languages": [
            "pa",
            "ta"
        ],
        "id": null,
        "_type": "Translation"
    }
}

हाय-एमएल

इस डेटासेट को TFDS में लोड करने के लिए निम्नलिखित कमांड का उपयोग करें:

ds = tfds.load('huggingface:pib/hi-ml')
  • विवरण :
Sentence aligned parallel corpus between 11 Indian Languages, crawled and extracted from the press information bureau
website.
  • लाइसेंस : कोई ज्ञात लाइसेंस नहीं
  • संस्करण : 1.3.0
  • विभाजन :
विभाजित करना उदाहरण
'train' 27167
  • विशेषताएँ :
{
    "translation": {
        "languages": [
            "hi",
            "ml"
        ],
        "id": null,
        "_type": "Translation"
    }
}

या-ते

इस डेटासेट को TFDS में लोड करने के लिए निम्नलिखित कमांड का उपयोग करें:

ds = tfds.load('huggingface:pib/or-te')
  • विवरण :
Sentence aligned parallel corpus between 11 Indian Languages, crawled and extracted from the press information bureau
website.
  • लाइसेंस : कोई ज्ञात लाइसेंस नहीं
  • संस्करण : 1.3.0
  • विभाजन :
विभाजित करना उदाहरण
'train' 10475
  • विशेषताएँ :
{
    "translation": {
        "languages": [
            "or",
            "te"
        ],
        "id": null,
        "_type": "Translation"
    }
}

एन-एमएल

इस डेटासेट को TFDS में लोड करने के लिए निम्नलिखित कमांड का उपयोग करें:

ds = tfds.load('huggingface:pib/en-ml')
  • विवरण :
Sentence aligned parallel corpus between 11 Indian Languages, crawled and extracted from the press information bureau
website.
  • लाइसेंस : कोई ज्ञात लाइसेंस नहीं
  • संस्करण : 1.3.0
  • विभाजन :
विभाजित करना उदाहरण
'train' 44986
  • विशेषताएँ :
{
    "translation": {
        "languages": [
            "en",
            "ml"
        ],
        "id": null,
        "_type": "Translation"
    }
}

en-हाय

इस डेटासेट को TFDS में लोड करने के लिए निम्नलिखित कमांड का उपयोग करें:

ds = tfds.load('huggingface:pib/en-hi')
  • विवरण :
Sentence aligned parallel corpus between 11 Indian Languages, crawled and extracted from the press information bureau
website.
  • लाइसेंस : कोई ज्ञात लाइसेंस नहीं
  • संस्करण : 1.3.0
  • विभाजन :
विभाजित करना उदाहरण
'train' 269594
  • विशेषताएँ :
{
    "translation": {
        "languages": [
            "en",
            "hi"
        ],
        "id": null,
        "_type": "Translation"
    }
}

बीएन-पा

इस डेटासेट को TFDS में लोड करने के लिए निम्नलिखित कमांड का उपयोग करें:

ds = tfds.load('huggingface:pib/bn-pa')
  • विवरण :
Sentence aligned parallel corpus between 11 Indian Languages, crawled and extracted from the press information bureau
website.
  • लाइसेंस : कोई ज्ञात लाइसेंस नहीं
  • संस्करण : 1.3.0
  • विभाजन :
विभाजित करना उदाहरण
'train' 35109
  • विशेषताएँ :
{
    "translation": {
        "languages": [
            "bn",
            "pa"
        ],
        "id": null,
        "_type": "Translation"
    }
}

श्री-ते

इस डेटासेट को TFDS में लोड करने के लिए निम्नलिखित कमांड का उपयोग करें:

ds = tfds.load('huggingface:pib/mr-te')
  • विवरण :
Sentence aligned parallel corpus between 11 Indian Languages, crawled and extracted from the press information bureau
website.
  • लाइसेंस : कोई ज्ञात लाइसेंस नहीं
  • संस्करण : 1.3.0
  • विभाजन :
विभाजित करना उदाहरण
'train' 18179
  • विशेषताएँ :
{
    "translation": {
        "languages": [
            "mr",
            "te"
        ],
        "id": null,
        "_type": "Translation"
    }
}

श्री-पा

इस डेटासेट को TFDS में लोड करने के लिए निम्नलिखित कमांड का उपयोग करें:

ds = tfds.load('huggingface:pib/mr-pa')
  • विवरण :
Sentence aligned parallel corpus between 11 Indian Languages, crawled and extracted from the press information bureau
website.
  • लाइसेंस : कोई ज्ञात लाइसेंस नहीं
  • संस्करण : 1.3.0
  • विभाजन :
विभाजित करना उदाहरण
'train' 50418
  • विशेषताएँ :
{
    "translation": {
        "languages": [
            "mr",
            "pa"
        ],
        "id": null,
        "_type": "Translation"
    }
}

बीएन-ते

इस डेटासेट को TFDS में लोड करने के लिए निम्नलिखित कमांड का उपयोग करें:

ds = tfds.load('huggingface:pib/bn-te')
  • विवरण :
Sentence aligned parallel corpus between 11 Indian Languages, crawled and extracted from the press information bureau
website.
  • लाइसेंस : कोई ज्ञात लाइसेंस नहीं
  • संस्करण : 1.3.0
  • विभाजन :
विभाजित करना उदाहरण
'train' 17605
  • विशेषताएँ :
{
    "translation": {
        "languages": [
            "bn",
            "te"
        ],
        "id": null,
        "_type": "Translation"
    }
}

गु-हाय

इस डेटासेट को TFDS में लोड करने के लिए निम्नलिखित कमांड का उपयोग करें:

ds = tfds.load('huggingface:pib/gu-hi')
  • विवरण :
Sentence aligned parallel corpus between 11 Indian Languages, crawled and extracted from the press information bureau
website.
  • लाइसेंस : कोई ज्ञात लाइसेंस नहीं
  • संस्करण : 1.3.0
  • विभाजन :
विभाजित करना उदाहरण
'train' 41587
  • विशेषताएँ :
{
    "translation": {
        "languages": [
            "gu",
            "hi"
        ],
        "id": null,
        "_type": "Translation"
    }
}

ता-उर

इस डेटासेट को TFDS में लोड करने के लिए निम्नलिखित कमांड का उपयोग करें:

ds = tfds.load('huggingface:pib/ta-ur')
  • विवरण :
Sentence aligned parallel corpus between 11 Indian Languages, crawled and extracted from the press information bureau
website.
  • लाइसेंस : कोई ज्ञात लाइसेंस नहीं
  • संस्करण : 1.3.0
  • विभाजन :
विभाजित करना उदाहरण
'train' 48892
  • विशेषताएँ :
{
    "translation": {
        "languages": [
            "ta",
            "ur"
        ],
        "id": null,
        "_type": "Translation"
    }
}

ते-उर

इस डेटासेट को TFDS में लोड करने के लिए निम्नलिखित कमांड का उपयोग करें:

ds = tfds.load('huggingface:pib/te-ur')
  • विवरण :
Sentence aligned parallel corpus between 11 Indian Languages, crawled and extracted from the press information bureau
website.
  • लाइसेंस : कोई ज्ञात लाइसेंस नहीं
  • संस्करण : 1.3.0
  • विभाजन :
विभाजित करना उदाहरण
'train' 21148
  • विशेषताएँ :
{
    "translation": {
        "languages": [
            "te",
            "ur"
        ],
        "id": null,
        "_type": "Translation"
    }
}

या-पा

इस डेटासेट को TFDS में लोड करने के लिए निम्नलिखित कमांड का उपयोग करें:

ds = tfds.load('huggingface:pib/or-pa')
  • विवरण :
Sentence aligned parallel corpus between 11 Indian Languages, crawled and extracted from the press information bureau
website.
  • लाइसेंस : कोई ज्ञात लाइसेंस नहीं
  • संस्करण : 1.3.0
  • विभाजन :
विभाजित करना उदाहरण
'train' 43159
  • विशेषताएँ :
{
    "translation": {
        "languages": [
            "or",
            "pa"
        ],
        "id": null,
        "_type": "Translation"
    }
}

गु-एमएल

इस डेटासेट को TFDS में लोड करने के लिए निम्नलिखित कमांड का उपयोग करें:

ds = tfds.load('huggingface:pib/gu-ml')
  • विवरण :
Sentence aligned parallel corpus between 11 Indian Languages, crawled and extracted from the press information bureau
website.
  • लाइसेंस : कोई ज्ञात लाइसेंस नहीं
  • संस्करण : 1.3.0
  • विभाजन :
विभाजित करना उदाहरण
'train' 18252
  • विशेषताएँ :
{
    "translation": {
        "languages": [
            "gu",
            "ml"
        ],
        "id": null,
        "_type": "Translation"
    }
}

गु-पा

इस डेटासेट को TFDS में लोड करने के लिए निम्नलिखित कमांड का उपयोग करें:

ds = tfds.load('huggingface:pib/gu-pa')
  • विवरण :
Sentence aligned parallel corpus between 11 Indian Languages, crawled and extracted from the press information bureau
website.
  • लाइसेंस : कोई ज्ञात लाइसेंस नहीं
  • संस्करण : 1.3.0
  • विभाजन :
विभाजित करना उदाहरण
'train' 35566
  • विशेषताएँ :
{
    "translation": {
        "languages": [
            "gu",
            "pa"
        ],
        "id": null,
        "_type": "Translation"
    }
}

उच्च ते

इस डेटासेट को TFDS में लोड करने के लिए निम्नलिखित कमांड का उपयोग करें:

ds = tfds.load('huggingface:pib/hi-te')
  • विवरण :
Sentence aligned parallel corpus between 11 Indian Languages, crawled and extracted from the press information bureau
website.
  • लाइसेंस : कोई ज्ञात लाइसेंस नहीं
  • संस्करण : 1.3.0
  • विभाजन :
विभाजित करना उदाहरण
'train' 28569
  • विशेषताएँ :
{
    "translation": {
        "languages": [
            "hi",
            "te"
        ],
        "id": null,
        "_type": "Translation"
    }
}

एन-ते

इस डेटासेट को TFDS में लोड करने के लिए निम्नलिखित कमांड का उपयोग करें:

ds = tfds.load('huggingface:pib/en-te')
  • विवरण :
Sentence aligned parallel corpus between 11 Indian Languages, crawled and extracted from the press information bureau
website.
  • लाइसेंस : कोई ज्ञात लाइसेंस नहीं
  • संस्करण : 1.3.0
  • विभाजन :
विभाजित करना उदाहरण
'train' 44888
  • विशेषताएँ :
{
    "translation": {
        "languages": [
            "en",
            "te"
        ],
        "id": null,
        "_type": "Translation"
    }
}

एमएल-टी

इस डेटासेट को TFDS में लोड करने के लिए निम्नलिखित कमांड का उपयोग करें:

ds = tfds.load('huggingface:pib/ml-te')
  • विवरण :
Sentence aligned parallel corpus between 11 Indian Languages, crawled and extracted from the press information bureau
website.
  • लाइसेंस : कोई ज्ञात लाइसेंस नहीं
  • संस्करण : 1.3.0
  • विभाजन :
विभाजित करना उदाहरण
'train' 10480
  • विशेषताएँ :
{
    "translation": {
        "languages": [
            "ml",
            "te"
        ],
        "id": null,
        "_type": "Translation"
    }
}

पा-उर

इस डेटासेट को TFDS में लोड करने के लिए निम्नलिखित कमांड का उपयोग करें:

ds = tfds.load('huggingface:pib/pa-ur')
  • विवरण :
Sentence aligned parallel corpus between 11 Indian Languages, crawled and extracted from the press information bureau
website.
  • लाइसेंस : कोई ज्ञात लाइसेंस नहीं
  • संस्करण : 1.3.0
  • विभाजन :
विभाजित करना उदाहरण
'train' 51831
  • विशेषताएँ :
{
    "translation": {
        "languages": [
            "pa",
            "ur"
        ],
        "id": null,
        "_type": "Translation"
    }
}

हाय-उर

इस डेटासेट को TFDS में लोड करने के लिए निम्नलिखित कमांड का उपयोग करें:

ds = tfds.load('huggingface:pib/hi-ur')
  • विवरण :
Sentence aligned parallel corpus between 11 Indian Languages, crawled and extracted from the press information bureau
website.
  • लाइसेंस : कोई ज्ञात लाइसेंस नहीं
  • संस्करण : 1.3.0
  • विभाजन :
विभाजित करना उदाहरण
'train' 109951
  • विशेषताएँ :
{
    "translation": {
        "languages": [
            "hi",
            "ur"
        ],
        "id": null,
        "_type": "Translation"
    }
}

श्रीमान-या

इस डेटासेट को TFDS में लोड करने के लिए निम्नलिखित कमांड का उपयोग करें:

ds = tfds.load('huggingface:pib/mr-or')
  • विवरण :
Sentence aligned parallel corpus between 11 Indian Languages, crawled and extracted from the press information bureau
website.
  • लाइसेंस : कोई ज्ञात लाइसेंस नहीं
  • संस्करण : 1.3.0
  • विभाजन :
विभाजित करना उदाहरण
'train' 47001
  • विशेषताएँ :
{
    "translation": {
        "languages": [
            "mr",
            "or"
        ],
        "id": null,
        "_type": "Translation"
    }
}

एन यू.आर.

इस डेटासेट को TFDS में लोड करने के लिए निम्नलिखित कमांड का उपयोग करें:

ds = tfds.load('huggingface:pib/en-ur')
  • विवरण :
Sentence aligned parallel corpus between 11 Indian Languages, crawled and extracted from the press information bureau
website.
  • लाइसेंस : कोई ज्ञात लाइसेंस नहीं
  • संस्करण : 1.3.0
  • विभाजन :
विभाजित करना उदाहरण
'train' 202578
  • विशेषताएँ :
{
    "translation": {
        "languages": [
            "en",
            "ur"
        ],
        "id": null,
        "_type": "Translation"
    }
}

एमएल-उर

इस डेटासेट को TFDS में लोड करने के लिए निम्नलिखित कमांड का उपयोग करें:

ds = tfds.load('huggingface:pib/ml-ur')
  • विवरण :
Sentence aligned parallel corpus between 11 Indian Languages, crawled and extracted from the press information bureau
website.
  • लाइसेंस : कोई ज्ञात लाइसेंस नहीं
  • संस्करण : 1.3.0
  • विभाजन :
विभाजित करना उदाहरण
'train' 20913
  • विशेषताएँ :
{
    "translation": {
        "languages": [
            "ml",
            "ur"
        ],
        "id": null,
        "_type": "Translation"
    }
}

बीएन-श्रीमान

इस डेटासेट को TFDS में लोड करने के लिए निम्नलिखित कमांड का उपयोग करें:

ds = tfds.load('huggingface:pib/bn-mr')
  • विवरण :
Sentence aligned parallel corpus between 11 Indian Languages, crawled and extracted from the press information bureau
website.
  • लाइसेंस : कोई ज्ञात लाइसेंस नहीं
  • संस्करण : 1.3.0
  • विभाजन :
विभाजित करना उदाहरण
'train' 34043
  • विशेषताएँ :
{
    "translation": {
        "languages": [
            "bn",
            "mr"
        ],
        "id": null,
        "_type": "Translation"
    }
}

गु-ता

इस डेटासेट को TFDS में लोड करने के लिए निम्नलिखित कमांड का उपयोग करें:

ds = tfds.load('huggingface:pib/gu-ta')
  • विवरण :
Sentence aligned parallel corpus between 11 Indian Languages, crawled and extracted from the press information bureau
website.
  • लाइसेंस : कोई ज्ञात लाइसेंस नहीं
  • संस्करण : 1.3.0
  • विभाजन :
विभाजित करना उदाहरण
'train' 29187
  • विशेषताएँ :
{
    "translation": {
        "languages": [
            "gu",
            "ta"
        ],
        "id": null,
        "_type": "Translation"
    }
}

पा-ते

इस डेटासेट को TFDS में लोड करने के लिए निम्नलिखित कमांड का उपयोग करें:

ds = tfds.load('huggingface:pib/pa-te')
  • विवरण :
Sentence aligned parallel corpus between 11 Indian Languages, crawled and extracted from the press information bureau
website.
  • लाइसेंस : कोई ज्ञात लाइसेंस नहीं
  • संस्करण : 1.3.0
  • विभाजन :
विभाजित करना उदाहरण
'train' 25684
  • विशेषताएँ :
{
    "translation": {
        "languages": [
            "pa",
            "te"
        ],
        "id": null,
        "_type": "Translation"
    }
}

बीएन-गु

इस डेटासेट को TFDS में लोड करने के लिए निम्नलिखित कमांड का उपयोग करें:

ds = tfds.load('huggingface:pib/bn-gu')
  • विवरण :
Sentence aligned parallel corpus between 11 Indian Languages, crawled and extracted from the press information bureau
website.
  • लाइसेंस : कोई ज्ञात लाइसेंस नहीं
  • संस्करण : 1.3.0
  • विभाजन :
विभाजित करना उदाहरण
'train' 25166
  • विशेषताएँ :
{
    "translation": {
        "languages": [
            "bn",
            "gu"
        ],
        "id": null,
        "_type": "Translation"
    }
}

बीएन-उर

इस डेटासेट को TFDS में लोड करने के लिए निम्नलिखित कमांड का उपयोग करें:

ds = tfds.load('huggingface:pib/bn-ur')
  • विवरण :
Sentence aligned parallel corpus between 11 Indian Languages, crawled and extracted from the press information bureau
website.
  • लाइसेंस : कोई ज्ञात लाइसेंस नहीं
  • संस्करण : 1.3.0
  • विभाजन :
विभाजित करना उदाहरण
'train' 39290
  • विशेषताएँ :
{
    "translation": {
        "languages": [
            "bn",
            "ur"
        ],
        "id": null,
        "_type": "Translation"
    }
}

एमएल-श्री

इस डेटासेट को TFDS में लोड करने के लिए निम्नलिखित कमांड का उपयोग करें:

ds = tfds.load('huggingface:pib/ml-mr')
  • विवरण :
Sentence aligned parallel corpus between 11 Indian Languages, crawled and extracted from the press information bureau
website.
  • लाइसेंस : कोई ज्ञात लाइसेंस नहीं
  • संस्करण : 1.3.0
  • विभाजन :
विभाजित करना उदाहरण
'train' 22796
  • विशेषताएँ :
{
    "translation": {
        "languages": [
            "ml",
            "mr"
        ],
        "id": null,
        "_type": "Translation"
    }
}

या-ता

इस डेटासेट को TFDS में लोड करने के लिए निम्नलिखित कमांड का उपयोग करें:

ds = tfds.load('huggingface:pib/or-ta')
  • विवरण :
Sentence aligned parallel corpus between 11 Indian Languages, crawled and extracted from the press information bureau
website.
  • लाइसेंस : कोई ज्ञात लाइसेंस नहीं
  • संस्करण : 1.3.0
  • विभाजन :
विभाजित करना उदाहरण
'train' 44035
  • विशेषताएँ :
{
    "translation": {
        "languages": [
            "or",
            "ta"
        ],
        "id": null,
        "_type": "Translation"
    }
}

ता-ते

इस डेटासेट को TFDS में लोड करने के लिए निम्नलिखित कमांड का उपयोग करें:

ds = tfds.load('huggingface:pib/ta-te')
  • विवरण :
Sentence aligned parallel corpus between 11 Indian Languages, crawled and extracted from the press information bureau
website.
  • लाइसेंस : कोई ज्ञात लाइसेंस नहीं
  • संस्करण : 1.3.0
  • विभाजन :
विभाजित करना उदाहरण
'train' 17359
  • विशेषताएँ :
{
    "translation": {
        "languages": [
            "ta",
            "te"
        ],
        "id": null,
        "_type": "Translation"
    }
}

गु-या

इस डेटासेट को TFDS में लोड करने के लिए निम्नलिखित कमांड का उपयोग करें:

ds = tfds.load('huggingface:pib/gu-or')
  • विवरण :
Sentence aligned parallel corpus between 11 Indian Languages, crawled and extracted from the press information bureau
website.
  • लाइसेंस : कोई ज्ञात लाइसेंस नहीं
  • संस्करण : 1.3.0
  • विभाजन :
विभाजित करना उदाहरण
'train' 27162
  • विशेषताएँ :
{
    "translation": {
        "languages": [
            "gu",
            "or"
        ],
        "id": null,
        "_type": "Translation"
    }
}

एन-गु

इस डेटासेट को TFDS में लोड करने के लिए निम्नलिखित कमांड का उपयोग करें:

ds = tfds.load('huggingface:pib/en-gu')
  • विवरण :
Sentence aligned parallel corpus between 11 Indian Languages, crawled and extracted from the press information bureau
website.
  • लाइसेंस : कोई ज्ञात लाइसेंस नहीं
  • संस्करण : 1.3.0
  • विभाजन :
विभाजित करना उदाहरण
'train' 59739
  • विशेषताएँ :
{
    "translation": {
        "languages": [
            "en",
            "gu"
        ],
        "id": null,
        "_type": "Translation"
    }
}

हाय श्री

इस डेटासेट को TFDS में लोड करने के लिए निम्नलिखित कमांड का उपयोग करें:

ds = tfds.load('huggingface:pib/hi-mr')
  • विवरण :
Sentence aligned parallel corpus between 11 Indian Languages, crawled and extracted from the press information bureau
website.
  • लाइसेंस : कोई ज्ञात लाइसेंस नहीं
  • संस्करण : 1.3.0
  • विभाजन :
विभाजित करना उदाहरण
'train' 69186
  • विशेषताएँ :
{
    "translation": {
        "languages": [
            "hi",
            "mr"
        ],
        "id": null,
        "_type": "Translation"
    }
}

श्री-ता

इस डेटासेट को TFDS में लोड करने के लिए निम्नलिखित कमांड का उपयोग करें:

ds = tfds.load('huggingface:pib/mr-ta')
  • विवरण :
Sentence aligned parallel corpus between 11 Indian Languages, crawled and extracted from the press information bureau
website.
  • लाइसेंस : कोई ज्ञात लाइसेंस नहीं
  • संस्करण : 1.3.0
  • विभाजन :
विभाजित करना उदाहरण
'train' 48535
  • विशेषताएँ :
{
    "translation": {
        "languages": [
            "mr",
            "ta"
        ],
        "id": null,
        "_type": "Translation"
    }
}

एन-श्रीमान

इस डेटासेट को TFDS में लोड करने के लिए निम्नलिखित कमांड का उपयोग करें:

ds = tfds.load('huggingface:pib/en-mr')
  • विवरण :
Sentence aligned parallel corpus between 11 Indian Languages, crawled and extracted from the press information bureau
website.
  • लाइसेंस : कोई ज्ञात लाइसेंस नहीं
  • संस्करण : 1.3.0
  • विभाजन :
विभाजित करना उदाहरण
'train' 117199
  • विशेषताएँ :
{
    "translation": {
        "languages": [
            "en",
            "mr"
        ],
        "id": null,
        "_type": "Translation"
    }
}