tweet_eval

مراجع:

ایموجی

برای بارگذاری این مجموعه داده در TFDS از دستور زیر استفاده کنید:

ds = tfds.load('huggingface:tweet_eval/emoji')
  • توضیحات :
TweetEval consists of seven heterogenous tasks in Twitter, all framed as multi-class tweet classification. All tasks have been unified into the same benchmark, with each dataset presented in the same format and with fixed training, validation and test splits.
  • مجوز : مجوز شناخته شده ای وجود ندارد
  • نسخه : 1.1.0
  • تقسیمات :
تقسیم کنید نمونه ها
'test' 50000
'train' 45000
'validation' 5000
  • ویژگی ها :
{
    "text": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    },
    "label": {
        "num_classes": 20,
        "names": [
            "\u2764",
            "\ud83d\ude0d",
            "\ud83d\ude02",
            "\ud83d\udc95",
            "\ud83d\udd25",
            "\ud83d\ude0a",
            "\ud83d\ude0e",
            "\u2728",
            "\ud83d\udc99",
            "\ud83d\ude18",
            "\ud83d\udcf7",
            "\ud83c\uddfa\ud83c\uddf8",
            "\u2600",
            "\ud83d\udc9c",
            "\ud83d\ude09",
            "\ud83d\udcaf",
            "\ud83d\ude01",
            "\ud83c\udf84",
            "\ud83d\udcf8",
            "\ud83d\ude1c"
        ],
        "names_file": null,
        "id": null,
        "_type": "ClassLabel"
    }
}

احساس

برای بارگذاری این مجموعه داده در TFDS از دستور زیر استفاده کنید:

ds = tfds.load('huggingface:tweet_eval/emotion')
  • توضیحات :
TweetEval consists of seven heterogenous tasks in Twitter, all framed as multi-class tweet classification. All tasks have been unified into the same benchmark, with each dataset presented in the same format and with fixed training, validation and test splits.
  • مجوز : مجوز شناخته شده ای وجود ندارد
  • نسخه : 1.1.0
  • تقسیمات :
تقسیم کنید نمونه ها
'test' 1421
'train' 3257
'validation' 374
  • ویژگی ها :
{
    "text": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    },
    "label": {
        "num_classes": 4,
        "names": [
            "anger",
            "joy",
            "optimism",
            "sadness"
        ],
        "names_file": null,
        "id": null,
        "_type": "ClassLabel"
    }
}

نفرت

برای بارگذاری این مجموعه داده در TFDS از دستور زیر استفاده کنید:

ds = tfds.load('huggingface:tweet_eval/hate')
  • توضیحات :
TweetEval consists of seven heterogenous tasks in Twitter, all framed as multi-class tweet classification. All tasks have been unified into the same benchmark, with each dataset presented in the same format and with fixed training, validation and test splits.
  • مجوز : مجوز شناخته شده ای وجود ندارد
  • نسخه : 1.1.0
  • تقسیمات :
تقسیم کنید نمونه ها
'test' 2970
'train' 9000
'validation' 1000
  • ویژگی ها :
{
    "text": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    },
    "label": {
        "num_classes": 2,
        "names": [
            "non-hate",
            "hate"
        ],
        "names_file": null,
        "id": null,
        "_type": "ClassLabel"
    }
}

کنایه

برای بارگذاری این مجموعه داده در TFDS از دستور زیر استفاده کنید:

ds = tfds.load('huggingface:tweet_eval/irony')
  • توضیحات :
TweetEval consists of seven heterogenous tasks in Twitter, all framed as multi-class tweet classification. All tasks have been unified into the same benchmark, with each dataset presented in the same format and with fixed training, validation and test splits.
  • مجوز : مجوز شناخته شده ای وجود ندارد
  • نسخه : 1.1.0
  • تقسیمات :
تقسیم کنید نمونه ها
'test' 784
'train' 2862
'validation' 955
  • ویژگی ها :
{
    "text": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    },
    "label": {
        "num_classes": 2,
        "names": [
            "non_irony",
            "irony"
        ],
        "names_file": null,
        "id": null,
        "_type": "ClassLabel"
    }
}

توهین آمیز

برای بارگذاری این مجموعه داده در TFDS از دستور زیر استفاده کنید:

ds = tfds.load('huggingface:tweet_eval/offensive')
  • توضیحات :
TweetEval consists of seven heterogenous tasks in Twitter, all framed as multi-class tweet classification. All tasks have been unified into the same benchmark, with each dataset presented in the same format and with fixed training, validation and test splits.
  • مجوز : مجوز شناخته شده ای وجود ندارد
  • نسخه : 1.1.0
  • تقسیمات :
تقسیم کنید نمونه ها
'test' 860
'train' 11916
'validation' 1324
  • ویژگی ها :
{
    "text": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    },
    "label": {
        "num_classes": 2,
        "names": [
            "non-offensive",
            "offensive"
        ],
        "names_file": null,
        "id": null,
        "_type": "ClassLabel"
    }
}

احساس

برای بارگذاری این مجموعه داده در TFDS از دستور زیر استفاده کنید:

ds = tfds.load('huggingface:tweet_eval/sentiment')
  • توضیحات :
TweetEval consists of seven heterogenous tasks in Twitter, all framed as multi-class tweet classification. All tasks have been unified into the same benchmark, with each dataset presented in the same format and with fixed training, validation and test splits.
  • مجوز : مجوز شناخته شده ای وجود ندارد
  • نسخه : 1.1.0
  • تقسیمات :
تقسیم کنید نمونه ها
'test' 12284
'train' 45615
'validation' 2000
  • ویژگی ها :
{
    "text": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    },
    "label": {
        "num_classes": 3,
        "names": [
            "negative",
            "neutral",
            "positive"
        ],
        "names_file": null,
        "id": null,
        "_type": "ClassLabel"
    }
}

موضع_سقط جنین

برای بارگذاری این مجموعه داده در TFDS از دستور زیر استفاده کنید:

ds = tfds.load('huggingface:tweet_eval/stance_abortion')
  • توضیحات :
TweetEval consists of seven heterogenous tasks in Twitter, all framed as multi-class tweet classification. All tasks have been unified into the same benchmark, with each dataset presented in the same format and with fixed training, validation and test splits.
  • مجوز : مجوز شناخته شده ای وجود ندارد
  • نسخه : 1.1.0
  • تقسیمات :
تقسیم کنید نمونه ها
'test' 280
'train' 587
'validation' 66
  • ویژگی ها :
{
    "text": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    },
    "label": {
        "num_classes": 3,
        "names": [
            "none",
            "against",
            "favor"
        ],
        "names_file": null,
        "id": null,
        "_type": "ClassLabel"
    }
}

موضع_بی دینی

برای بارگذاری این مجموعه داده در TFDS از دستور زیر استفاده کنید:

ds = tfds.load('huggingface:tweet_eval/stance_atheism')
  • توضیحات :
TweetEval consists of seven heterogenous tasks in Twitter, all framed as multi-class tweet classification. All tasks have been unified into the same benchmark, with each dataset presented in the same format and with fixed training, validation and test splits.
  • مجوز : مجوز شناخته شده ای وجود ندارد
  • نسخه : 1.1.0
  • تقسیمات :
تقسیم کنید نمونه ها
'test' 220
'train' 461
'validation' 52
  • ویژگی ها :
{
    "text": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    },
    "label": {
        "num_classes": 3,
        "names": [
            "none",
            "against",
            "favor"
        ],
        "names_file": null,
        "id": null,
        "_type": "ClassLabel"
    }
}

موضع_اقلیم

برای بارگذاری این مجموعه داده در TFDS از دستور زیر استفاده کنید:

ds = tfds.load('huggingface:tweet_eval/stance_climate')
  • توضیحات :
TweetEval consists of seven heterogenous tasks in Twitter, all framed as multi-class tweet classification. All tasks have been unified into the same benchmark, with each dataset presented in the same format and with fixed training, validation and test splits.
  • مجوز : مجوز شناخته شده ای وجود ندارد
  • نسخه : 1.1.0
  • تقسیمات :
تقسیم کنید نمونه ها
'test' 169
'train' 355
'validation' 40
  • ویژگی ها :
{
    "text": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    },
    "label": {
        "num_classes": 3,
        "names": [
            "none",
            "against",
            "favor"
        ],
        "names_file": null,
        "id": null,
        "_type": "ClassLabel"
    }
}

موضع_فمینیستی

برای بارگذاری این مجموعه داده در TFDS از دستور زیر استفاده کنید:

ds = tfds.load('huggingface:tweet_eval/stance_feminist')
  • توضیحات :
TweetEval consists of seven heterogenous tasks in Twitter, all framed as multi-class tweet classification. All tasks have been unified into the same benchmark, with each dataset presented in the same format and with fixed training, validation and test splits.
  • مجوز : مجوز شناخته شده ای وجود ندارد
  • نسخه : 1.1.0
  • تقسیمات :
تقسیم کنید نمونه ها
'test' 285
'train' 597
'validation' 67
  • ویژگی ها :
{
    "text": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    },
    "label": {
        "num_classes": 3,
        "names": [
            "none",
            "against",
            "favor"
        ],
        "names_file": null,
        "id": null,
        "_type": "ClassLabel"
    }
}

stance_hillary

برای بارگذاری این مجموعه داده در TFDS از دستور زیر استفاده کنید:

ds = tfds.load('huggingface:tweet_eval/stance_hillary')
  • توضیحات :
TweetEval consists of seven heterogenous tasks in Twitter, all framed as multi-class tweet classification. All tasks have been unified into the same benchmark, with each dataset presented in the same format and with fixed training, validation and test splits.
  • مجوز : مجوز شناخته شده ای وجود ندارد
  • نسخه : 1.1.0
  • تقسیمات :
تقسیم کنید نمونه ها
'test' 295
'train' 620
'validation' 69
  • ویژگی ها :
{
    "text": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    },
    "label": {
        "num_classes": 3,
        "names": [
            "none",
            "against",
            "favor"
        ],
        "names_file": null,
        "id": null,
        "_type": "ClassLabel"
    }
}