tweet_eval

参考文献:

絵文字

次のコマンドを使用して、このデータセットを TFDS にロードします。

ds = tfds.load('huggingface:tweet_eval/emoji')
  • 説明
TweetEval consists of seven heterogenous tasks in Twitter, all framed as multi-class tweet classification. All tasks have been unified into the same benchmark, with each dataset presented in the same format and with fixed training, validation and test splits.
  • ライセンス: 不明なライセンス
  • バージョン: 1.1.0
  • 分割:
スプリット
'test' 50000
'train' 45000
'validation' 5000
  • 特徴
{
    "text": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    },
    "label": {
        "num_classes": 20,
        "names": [
            "\u2764",
            "\ud83d\ude0d",
            "\ud83d\ude02",
            "\ud83d\udc95",
            "\ud83d\udd25",
            "\ud83d\ude0a",
            "\ud83d\ude0e",
            "\u2728",
            "\ud83d\udc99",
            "\ud83d\ude18",
            "\ud83d\udcf7",
            "\ud83c\uddfa\ud83c\uddf8",
            "\u2600",
            "\ud83d\udc9c",
            "\ud83d\ude09",
            "\ud83d\udcaf",
            "\ud83d\ude01",
            "\ud83c\udf84",
            "\ud83d\udcf8",
            "\ud83d\ude1c"
        ],
        "names_file": null,
        "id": null,
        "_type": "ClassLabel"
    }
}

感情

次のコマンドを使用して、このデータセットを TFDS にロードします。

ds = tfds.load('huggingface:tweet_eval/emotion')
  • 説明
TweetEval consists of seven heterogenous tasks in Twitter, all framed as multi-class tweet classification. All tasks have been unified into the same benchmark, with each dataset presented in the same format and with fixed training, validation and test splits.
  • ライセンス: 不明なライセンス
  • バージョン: 1.1.0
  • 分割:
スプリット
'test' 1421
'train' 3257
'validation' 374
  • 特徴
{
    "text": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    },
    "label": {
        "num_classes": 4,
        "names": [
            "anger",
            "joy",
            "optimism",
            "sadness"
        ],
        "names_file": null,
        "id": null,
        "_type": "ClassLabel"
    }
}

嫌い

次のコマンドを使用して、このデータセットを TFDS にロードします。

ds = tfds.load('huggingface:tweet_eval/hate')
  • 説明
TweetEval consists of seven heterogenous tasks in Twitter, all framed as multi-class tweet classification. All tasks have been unified into the same benchmark, with each dataset presented in the same format and with fixed training, validation and test splits.
  • ライセンス: 不明なライセンス
  • バージョン: 1.1.0
  • 分割:
スプリット
'test' 2970
'train' 9000
'validation' 1000
  • 特徴
{
    "text": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    },
    "label": {
        "num_classes": 2,
        "names": [
            "non-hate",
            "hate"
        ],
        "names_file": null,
        "id": null,
        "_type": "ClassLabel"
    }
}

アイロニー

次のコマンドを使用して、このデータセットを TFDS にロードします。

ds = tfds.load('huggingface:tweet_eval/irony')
  • 説明
TweetEval consists of seven heterogenous tasks in Twitter, all framed as multi-class tweet classification. All tasks have been unified into the same benchmark, with each dataset presented in the same format and with fixed training, validation and test splits.
  • ライセンス: 不明なライセンス
  • バージョン: 1.1.0
  • 分割:
スプリット
'test' 784
'train' 2862
'validation' 955
  • 特徴
{
    "text": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    },
    "label": {
        "num_classes": 2,
        "names": [
            "non_irony",
            "irony"
        ],
        "names_file": null,
        "id": null,
        "_type": "ClassLabel"
    }
}

攻撃

次のコマンドを使用して、このデータセットを TFDS にロードします。

ds = tfds.load('huggingface:tweet_eval/offensive')
  • 説明
TweetEval consists of seven heterogenous tasks in Twitter, all framed as multi-class tweet classification. All tasks have been unified into the same benchmark, with each dataset presented in the same format and with fixed training, validation and test splits.
  • ライセンス: 不明なライセンス
  • バージョン: 1.1.0
  • 分割:
スプリット
'test' 860
'train' 11916
'validation' 1324
  • 特徴
{
    "text": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    },
    "label": {
        "num_classes": 2,
        "names": [
            "non-offensive",
            "offensive"
        ],
        "names_file": null,
        "id": null,
        "_type": "ClassLabel"
    }
}

感情

次のコマンドを使用して、このデータセットを TFDS にロードします。

ds = tfds.load('huggingface:tweet_eval/sentiment')
  • 説明
TweetEval consists of seven heterogenous tasks in Twitter, all framed as multi-class tweet classification. All tasks have been unified into the same benchmark, with each dataset presented in the same format and with fixed training, validation and test splits.
  • ライセンス: 不明なライセンス
  • バージョン: 1.1.0
  • 分割:
スプリット
'test' 12284
'train' 45615
'validation' 2000年
  • 特徴
{
    "text": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    },
    "label": {
        "num_classes": 3,
        "names": [
            "negative",
            "neutral",
            "positive"
        ],
        "names_file": null,
        "id": null,
        "_type": "ClassLabel"
    }
}

スタンス_中絶

次のコマンドを使用して、このデータセットを TFDS にロードします。

ds = tfds.load('huggingface:tweet_eval/stance_abortion')
  • 説明
TweetEval consists of seven heterogenous tasks in Twitter, all framed as multi-class tweet classification. All tasks have been unified into the same benchmark, with each dataset presented in the same format and with fixed training, validation and test splits.
  • ライセンス: 不明なライセンス
  • バージョン: 1.1.0
  • 分割:
スプリット
'test' 280
'train' 587
'validation' 66
  • 特徴
{
    "text": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    },
    "label": {
        "num_classes": 3,
        "names": [
            "none",
            "against",
            "favor"
        ],
        "names_file": null,
        "id": null,
        "_type": "ClassLabel"
    }
}

スタンス_無神論

次のコマンドを使用して、このデータセットを TFDS にロードします。

ds = tfds.load('huggingface:tweet_eval/stance_atheism')
  • 説明
TweetEval consists of seven heterogenous tasks in Twitter, all framed as multi-class tweet classification. All tasks have been unified into the same benchmark, with each dataset presented in the same format and with fixed training, validation and test splits.
  • ライセンス: 不明なライセンス
  • バージョン: 1.1.0
  • 分割:
スプリット
'test' 220
'train' 461
'validation' 52
  • 特徴
{
    "text": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    },
    "label": {
        "num_classes": 3,
        "names": [
            "none",
            "against",
            "favor"
        ],
        "names_file": null,
        "id": null,
        "_type": "ClassLabel"
    }
}

スタンス_気候

次のコマンドを使用して、このデータセットを TFDS にロードします。

ds = tfds.load('huggingface:tweet_eval/stance_climate')
  • 説明
TweetEval consists of seven heterogenous tasks in Twitter, all framed as multi-class tweet classification. All tasks have been unified into the same benchmark, with each dataset presented in the same format and with fixed training, validation and test splits.
  • ライセンス: 不明なライセンス
  • バージョン: 1.1.0
  • 分割:
スプリット
'test' 169
'train' 355
'validation' 40
  • 特徴
{
    "text": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    },
    "label": {
        "num_classes": 3,
        "names": [
            "none",
            "against",
            "favor"
        ],
        "names_file": null,
        "id": null,
        "_type": "ClassLabel"
    }
}

スタンスフェミニスト

次のコマンドを使用して、このデータセットを TFDS にロードします。

ds = tfds.load('huggingface:tweet_eval/stance_feminist')
  • 説明
TweetEval consists of seven heterogenous tasks in Twitter, all framed as multi-class tweet classification. All tasks have been unified into the same benchmark, with each dataset presented in the same format and with fixed training, validation and test splits.
  • ライセンス: 不明なライセンス
  • バージョン: 1.1.0
  • 分割:
スプリット
'test' 285
'train' 597
'validation' 67
  • 特徴
{
    "text": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    },
    "label": {
        "num_classes": 3,
        "names": [
            "none",
            "against",
            "favor"
        ],
        "names_file": null,
        "id": null,
        "_type": "ClassLabel"
    }
}

スタンスヒラリー

次のコマンドを使用して、このデータセットを TFDS にロードします。

ds = tfds.load('huggingface:tweet_eval/stance_hillary')
  • 説明
TweetEval consists of seven heterogenous tasks in Twitter, all framed as multi-class tweet classification. All tasks have been unified into the same benchmark, with each dataset presented in the same format and with fixed training, validation and test splits.
  • ライセンス: 不明なライセンス
  • バージョン: 1.1.0
  • 分割:
スプリット
'test' 295
'train' 620
'validation' 69
  • 特徴
{
    "text": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    },
    "label": {
        "num_classes": 3,
        "names": [
            "none",
            "against",
            "favor"
        ],
        "names_file": null,
        "id": null,
        "_type": "ClassLabel"
    }
}