pattes-x

Les références:

fr

Utilisez la commande suivante pour charger cet ensemble de données dans TFDS :

ds = tfds.load('huggingface:paws-x/en')
  • Description :
PAWS-X, a multilingual version of PAWS (Paraphrase Adversaries from Word Scrambling) for six languages.

This dataset contains 23,659 human translated PAWS evaluation pairs and 296,406 machine
translated training pairs in six typologically distinct languages: French, Spanish, German,
Chinese, Japanese, and Korean. English language is available by default. All translated
pairs are sourced from examples in PAWS-Wiki.

For further details, see the accompanying paper: PAWS-X: A Cross-lingual Adversarial Dataset
for Paraphrase Identification (https://arxiv.org/abs/1908.11828)

Note: There might be some missing or wrong labels in the dataset and we have replaced them with -1.
  • Licence : L'ensemble de données peut être utilisé librement à toutes fins, bien que la mention de Google LLC ("Google") comme source de données serait appréciée. L'ensemble de données est fourni « TEL QUEL » sans aucune garantie, expresse ou implicite. Google décline toute responsabilité pour tout dommage, direct ou indirect, résultant de l'utilisation de l'ensemble de données.
  • Version : 1.1.0
  • Divisions :
Diviser Exemples
'test' 2000
'train' 49401
'validation' 2000
  • Caractéristiques :
{
    "id": {
        "dtype": "int32",
        "id": null,
        "_type": "Value"
    },
    "sentence1": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    },
    "sentence2": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    },
    "label": {
        "num_classes": 2,
        "names": [
            "0",
            "1"
        ],
        "names_file": null,
        "id": null,
        "_type": "ClassLabel"
    }
}

de

Utilisez la commande suivante pour charger cet ensemble de données dans TFDS :

ds = tfds.load('huggingface:paws-x/de')
  • Description :
PAWS-X, a multilingual version of PAWS (Paraphrase Adversaries from Word Scrambling) for six languages.

This dataset contains 23,659 human translated PAWS evaluation pairs and 296,406 machine
translated training pairs in six typologically distinct languages: French, Spanish, German,
Chinese, Japanese, and Korean. English language is available by default. All translated
pairs are sourced from examples in PAWS-Wiki.

For further details, see the accompanying paper: PAWS-X: A Cross-lingual Adversarial Dataset
for Paraphrase Identification (https://arxiv.org/abs/1908.11828)

Note: There might be some missing or wrong labels in the dataset and we have replaced them with -1.
  • Licence : L'ensemble de données peut être utilisé librement à toutes fins, bien que la mention de Google LLC ("Google") comme source de données serait appréciée. L'ensemble de données est fourni « TEL QUEL » sans aucune garantie, expresse ou implicite. Google décline toute responsabilité pour tout dommage, direct ou indirect, résultant de l'utilisation de l'ensemble de données.
  • Version : 1.1.0
  • Divisions :
Diviser Exemples
'test' 2000
'train' 49401
'validation' 2000
  • Caractéristiques :
{
    "id": {
        "dtype": "int32",
        "id": null,
        "_type": "Value"
    },
    "sentence1": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    },
    "sentence2": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    },
    "label": {
        "num_classes": 2,
        "names": [
            "0",
            "1"
        ],
        "names_file": null,
        "id": null,
        "_type": "ClassLabel"
    }
}

es

Utilisez la commande suivante pour charger cet ensemble de données dans TFDS :

ds = tfds.load('huggingface:paws-x/es')
  • Description :
PAWS-X, a multilingual version of PAWS (Paraphrase Adversaries from Word Scrambling) for six languages.

This dataset contains 23,659 human translated PAWS evaluation pairs and 296,406 machine
translated training pairs in six typologically distinct languages: French, Spanish, German,
Chinese, Japanese, and Korean. English language is available by default. All translated
pairs are sourced from examples in PAWS-Wiki.

For further details, see the accompanying paper: PAWS-X: A Cross-lingual Adversarial Dataset
for Paraphrase Identification (https://arxiv.org/abs/1908.11828)

Note: There might be some missing or wrong labels in the dataset and we have replaced them with -1.
  • Licence : L'ensemble de données peut être utilisé librement à toutes fins, bien que la mention de Google LLC ("Google") comme source de données serait appréciée. L'ensemble de données est fourni « TEL QUEL » sans aucune garantie, expresse ou implicite. Google décline toute responsabilité pour tout dommage, direct ou indirect, résultant de l'utilisation de l'ensemble de données.
  • Version : 1.1.0
  • Divisions :
Diviser Exemples
'test' 2000
'train' 49401
'validation' 2000
  • Caractéristiques :
{
    "id": {
        "dtype": "int32",
        "id": null,
        "_type": "Value"
    },
    "sentence1": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    },
    "sentence2": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    },
    "label": {
        "num_classes": 2,
        "names": [
            "0",
            "1"
        ],
        "names_file": null,
        "id": null,
        "_type": "ClassLabel"
    }
}

fr

Utilisez la commande suivante pour charger cet ensemble de données dans TFDS :

ds = tfds.load('huggingface:paws-x/fr')
  • Description :
PAWS-X, a multilingual version of PAWS (Paraphrase Adversaries from Word Scrambling) for six languages.

This dataset contains 23,659 human translated PAWS evaluation pairs and 296,406 machine
translated training pairs in six typologically distinct languages: French, Spanish, German,
Chinese, Japanese, and Korean. English language is available by default. All translated
pairs are sourced from examples in PAWS-Wiki.

For further details, see the accompanying paper: PAWS-X: A Cross-lingual Adversarial Dataset
for Paraphrase Identification (https://arxiv.org/abs/1908.11828)

Note: There might be some missing or wrong labels in the dataset and we have replaced them with -1.
  • Licence : L'ensemble de données peut être utilisé librement à toutes fins, bien que la mention de Google LLC ("Google") comme source de données serait appréciée. L'ensemble de données est fourni « TEL QUEL » sans aucune garantie, expresse ou implicite. Google décline toute responsabilité pour tout dommage, direct ou indirect, résultant de l'utilisation de l'ensemble de données.
  • Version : 1.1.0
  • Divisions :
Diviser Exemples
'test' 2000
'train' 49401
'validation' 2000
  • Caractéristiques :
{
    "id": {
        "dtype": "int32",
        "id": null,
        "_type": "Value"
    },
    "sentence1": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    },
    "sentence2": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    },
    "label": {
        "num_classes": 2,
        "names": [
            "0",
            "1"
        ],
        "names_file": null,
        "id": null,
        "_type": "ClassLabel"
    }
}

oui

Utilisez la commande suivante pour charger cet ensemble de données dans TFDS :

ds = tfds.load('huggingface:paws-x/ja')
  • Description :
PAWS-X, a multilingual version of PAWS (Paraphrase Adversaries from Word Scrambling) for six languages.

This dataset contains 23,659 human translated PAWS evaluation pairs and 296,406 machine
translated training pairs in six typologically distinct languages: French, Spanish, German,
Chinese, Japanese, and Korean. English language is available by default. All translated
pairs are sourced from examples in PAWS-Wiki.

For further details, see the accompanying paper: PAWS-X: A Cross-lingual Adversarial Dataset
for Paraphrase Identification (https://arxiv.org/abs/1908.11828)

Note: There might be some missing or wrong labels in the dataset and we have replaced them with -1.
  • Licence : L'ensemble de données peut être utilisé librement à toutes fins, bien que la mention de Google LLC ("Google") comme source de données serait appréciée. L'ensemble de données est fourni « TEL QUEL » sans aucune garantie, expresse ou implicite. Google décline toute responsabilité pour tout dommage, direct ou indirect, résultant de l'utilisation de l'ensemble de données.
  • Version : 1.1.0
  • Divisions :
Diviser Exemples
'test' 2000
'train' 49401
'validation' 2000
  • Caractéristiques :
{
    "id": {
        "dtype": "int32",
        "id": null,
        "_type": "Value"
    },
    "sentence1": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    },
    "sentence2": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    },
    "label": {
        "num_classes": 2,
        "names": [
            "0",
            "1"
        ],
        "names_file": null,
        "id": null,
        "_type": "ClassLabel"
    }
}

ko

Utilisez la commande suivante pour charger cet ensemble de données dans TFDS :

ds = tfds.load('huggingface:paws-x/ko')
  • Description :
PAWS-X, a multilingual version of PAWS (Paraphrase Adversaries from Word Scrambling) for six languages.

This dataset contains 23,659 human translated PAWS evaluation pairs and 296,406 machine
translated training pairs in six typologically distinct languages: French, Spanish, German,
Chinese, Japanese, and Korean. English language is available by default. All translated
pairs are sourced from examples in PAWS-Wiki.

For further details, see the accompanying paper: PAWS-X: A Cross-lingual Adversarial Dataset
for Paraphrase Identification (https://arxiv.org/abs/1908.11828)

Note: There might be some missing or wrong labels in the dataset and we have replaced them with -1.
  • Licence : L'ensemble de données peut être utilisé librement à toutes fins, bien que la mention de Google LLC ("Google") comme source de données serait appréciée. L'ensemble de données est fourni « TEL QUEL » sans aucune garantie, expresse ou implicite. Google décline toute responsabilité pour tout dommage, direct ou indirect, résultant de l'utilisation de l'ensemble de données.
  • Version : 1.1.0
  • Divisions :
Diviser Exemples
'test' 2000
'train' 49401
'validation' 2000
  • Caractéristiques :
{
    "id": {
        "dtype": "int32",
        "id": null,
        "_type": "Value"
    },
    "sentence1": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    },
    "sentence2": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    },
    "label": {
        "num_classes": 2,
        "names": [
            "0",
            "1"
        ],
        "names_file": null,
        "id": null,
        "_type": "ClassLabel"
    }
}

zh

Utilisez la commande suivante pour charger cet ensemble de données dans TFDS :

ds = tfds.load('huggingface:paws-x/zh')
  • Description :
PAWS-X, a multilingual version of PAWS (Paraphrase Adversaries from Word Scrambling) for six languages.

This dataset contains 23,659 human translated PAWS evaluation pairs and 296,406 machine
translated training pairs in six typologically distinct languages: French, Spanish, German,
Chinese, Japanese, and Korean. English language is available by default. All translated
pairs are sourced from examples in PAWS-Wiki.

For further details, see the accompanying paper: PAWS-X: A Cross-lingual Adversarial Dataset
for Paraphrase Identification (https://arxiv.org/abs/1908.11828)

Note: There might be some missing or wrong labels in the dataset and we have replaced them with -1.
  • Licence : L'ensemble de données peut être utilisé librement à toutes fins, bien que la mention de Google LLC ("Google") comme source de données serait appréciée. L'ensemble de données est fourni « TEL QUEL » sans aucune garantie, expresse ou implicite. Google décline toute responsabilité pour tout dommage, direct ou indirect, résultant de l'utilisation de l'ensemble de données.
  • Version : 1.1.0
  • Divisions :
Diviser Exemples
'test' 2000
'train' 49401
'validation' 2000
  • Caractéristiques :
{
    "id": {
        "dtype": "int32",
        "id": null,
        "_type": "Value"
    },
    "sentence1": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    },
    "sentence2": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    },
    "label": {
        "num_classes": 2,
        "names": [
            "0",
            "1"
        ],
        "names_file": null,
        "id": null,
        "_type": "ClassLabel"
    }
}