trivia_qa

Người giới thiệu:

rc

Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:

ds = tfds.load('huggingface:trivia_qa/rc')
  • Sự miêu tả :
TriviaqQA is a reading comprehension dataset containing over 650K
question-answer-evidence triples. TriviaqQA includes 95K question-answer
pairs authored by trivia enthusiasts and independently gathered evidence
documents, six per question on average, that provide high quality distant
supervision for answering the questions.
  • Giấy phép : Không có giấy phép được biết đến
  • Phiên bản : 1.2.0
  • Chia tách :
Tách ra Ví dụ
'test' 17210
'train' 138384
'validation' 17944
  • Đặc trưng :
{
    "question": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    },
    "question_id": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    },
    "question_source": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    },
    "entity_pages": {
        "feature": {
            "doc_source": {
                "dtype": "string",
                "id": null,
                "_type": "Value"
            },
            "filename": {
                "dtype": "string",
                "id": null,
                "_type": "Value"
            },
            "title": {
                "dtype": "string",
                "id": null,
                "_type": "Value"
            },
            "wiki_context": {
                "dtype": "string",
                "id": null,
                "_type": "Value"
            }
        },
        "length": -1,
        "id": null,
        "_type": "Sequence"
    },
    "search_results": {
        "feature": {
            "description": {
                "dtype": "string",
                "id": null,
                "_type": "Value"
            },
            "filename": {
                "dtype": "string",
                "id": null,
                "_type": "Value"
            },
            "rank": {
                "dtype": "int32",
                "id": null,
                "_type": "Value"
            },
            "title": {
                "dtype": "string",
                "id": null,
                "_type": "Value"
            },
            "url": {
                "dtype": "string",
                "id": null,
                "_type": "Value"
            },
            "search_context": {
                "dtype": "string",
                "id": null,
                "_type": "Value"
            }
        },
        "length": -1,
        "id": null,
        "_type": "Sequence"
    },
    "answer": {
        "aliases": {
            "feature": {
                "dtype": "string",
                "id": null,
                "_type": "Value"
            },
            "length": -1,
            "id": null,
            "_type": "Sequence"
        },
        "normalized_aliases": {
            "feature": {
                "dtype": "string",
                "id": null,
                "_type": "Value"
            },
            "length": -1,
            "id": null,
            "_type": "Sequence"
        },
        "matched_wiki_entity_name": {
            "dtype": "string",
            "id": null,
            "_type": "Value"
        },
        "normalized_matched_wiki_entity_name": {
            "dtype": "string",
            "id": null,
            "_type": "Value"
        },
        "normalized_value": {
            "dtype": "string",
            "id": null,
            "_type": "Value"
        },
        "type": {
            "dtype": "string",
            "id": null,
            "_type": "Value"
        },
        "value": {
            "dtype": "string",
            "id": null,
            "_type": "Value"
        }
    }
}

rc.nocontext

Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:

ds = tfds.load('huggingface:trivia_qa/rc.nocontext')
  • Sự miêu tả :
TriviaqQA is a reading comprehension dataset containing over 650K
question-answer-evidence triples. TriviaqQA includes 95K question-answer
pairs authored by trivia enthusiasts and independently gathered evidence
documents, six per question on average, that provide high quality distant
supervision for answering the questions.
  • Giấy phép : Không có giấy phép được biết đến
  • Phiên bản : 1.2.0
  • Chia tách :
Tách ra Ví dụ
'test' 17210
'train' 138384
'validation' 17944
  • Đặc trưng :
{
    "question": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    },
    "question_id": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    },
    "question_source": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    },
    "entity_pages": {
        "feature": {
            "doc_source": {
                "dtype": "string",
                "id": null,
                "_type": "Value"
            },
            "filename": {
                "dtype": "string",
                "id": null,
                "_type": "Value"
            },
            "title": {
                "dtype": "string",
                "id": null,
                "_type": "Value"
            },
            "wiki_context": {
                "dtype": "string",
                "id": null,
                "_type": "Value"
            }
        },
        "length": -1,
        "id": null,
        "_type": "Sequence"
    },
    "search_results": {
        "feature": {
            "description": {
                "dtype": "string",
                "id": null,
                "_type": "Value"
            },
            "filename": {
                "dtype": "string",
                "id": null,
                "_type": "Value"
            },
            "rank": {
                "dtype": "int32",
                "id": null,
                "_type": "Value"
            },
            "title": {
                "dtype": "string",
                "id": null,
                "_type": "Value"
            },
            "url": {
                "dtype": "string",
                "id": null,
                "_type": "Value"
            },
            "search_context": {
                "dtype": "string",
                "id": null,
                "_type": "Value"
            }
        },
        "length": -1,
        "id": null,
        "_type": "Sequence"
    },
    "answer": {
        "aliases": {
            "feature": {
                "dtype": "string",
                "id": null,
                "_type": "Value"
            },
            "length": -1,
            "id": null,
            "_type": "Sequence"
        },
        "normalized_aliases": {
            "feature": {
                "dtype": "string",
                "id": null,
                "_type": "Value"
            },
            "length": -1,
            "id": null,
            "_type": "Sequence"
        },
        "matched_wiki_entity_name": {
            "dtype": "string",
            "id": null,
            "_type": "Value"
        },
        "normalized_matched_wiki_entity_name": {
            "dtype": "string",
            "id": null,
            "_type": "Value"
        },
        "normalized_value": {
            "dtype": "string",
            "id": null,
            "_type": "Value"
        },
        "type": {
            "dtype": "string",
            "id": null,
            "_type": "Value"
        },
        "value": {
            "dtype": "string",
            "id": null,
            "_type": "Value"
        }
    }
}

chưa được lọc

Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:

ds = tfds.load('huggingface:trivia_qa/unfiltered')
  • Sự miêu tả :
TriviaqQA is a reading comprehension dataset containing over 650K
question-answer-evidence triples. TriviaqQA includes 95K question-answer
pairs authored by trivia enthusiasts and independently gathered evidence
documents, six per question on average, that provide high quality distant
supervision for answering the questions.
  • Giấy phép : Không có giấy phép được biết đến
  • Phiên bản : 1.2.0
  • Chia tách :
Tách ra Ví dụ
'test' 10832
'train' 87622
'validation' 11313
  • Đặc trưng :
{
    "question": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    },
    "question_id": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    },
    "question_source": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    },
    "entity_pages": {
        "feature": {
            "doc_source": {
                "dtype": "string",
                "id": null,
                "_type": "Value"
            },
            "filename": {
                "dtype": "string",
                "id": null,
                "_type": "Value"
            },
            "title": {
                "dtype": "string",
                "id": null,
                "_type": "Value"
            },
            "wiki_context": {
                "dtype": "string",
                "id": null,
                "_type": "Value"
            }
        },
        "length": -1,
        "id": null,
        "_type": "Sequence"
    },
    "search_results": {
        "feature": {
            "description": {
                "dtype": "string",
                "id": null,
                "_type": "Value"
            },
            "filename": {
                "dtype": "string",
                "id": null,
                "_type": "Value"
            },
            "rank": {
                "dtype": "int32",
                "id": null,
                "_type": "Value"
            },
            "title": {
                "dtype": "string",
                "id": null,
                "_type": "Value"
            },
            "url": {
                "dtype": "string",
                "id": null,
                "_type": "Value"
            },
            "search_context": {
                "dtype": "string",
                "id": null,
                "_type": "Value"
            }
        },
        "length": -1,
        "id": null,
        "_type": "Sequence"
    },
    "answer": {
        "aliases": {
            "feature": {
                "dtype": "string",
                "id": null,
                "_type": "Value"
            },
            "length": -1,
            "id": null,
            "_type": "Sequence"
        },
        "normalized_aliases": {
            "feature": {
                "dtype": "string",
                "id": null,
                "_type": "Value"
            },
            "length": -1,
            "id": null,
            "_type": "Sequence"
        },
        "matched_wiki_entity_name": {
            "dtype": "string",
            "id": null,
            "_type": "Value"
        },
        "normalized_matched_wiki_entity_name": {
            "dtype": "string",
            "id": null,
            "_type": "Value"
        },
        "normalized_value": {
            "dtype": "string",
            "id": null,
            "_type": "Value"
        },
        "type": {
            "dtype": "string",
            "id": null,
            "_type": "Value"
        },
        "value": {
            "dtype": "string",
            "id": null,
            "_type": "Value"
        }
    }
}

unfiltered.nocontext

Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:

ds = tfds.load('huggingface:trivia_qa/unfiltered.nocontext')
  • Sự miêu tả :
TriviaqQA is a reading comprehension dataset containing over 650K
question-answer-evidence triples. TriviaqQA includes 95K question-answer
pairs authored by trivia enthusiasts and independently gathered evidence
documents, six per question on average, that provide high quality distant
supervision for answering the questions.
  • Giấy phép : Không có giấy phép được biết đến
  • Phiên bản : 1.2.0
  • Chia tách :
Tách ra Ví dụ
'test' 10832
'train' 87622
'validation' 11313
  • Đặc trưng :
{
    "question": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    },
    "question_id": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    },
    "question_source": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    },
    "entity_pages": {
        "feature": {
            "doc_source": {
                "dtype": "string",
                "id": null,
                "_type": "Value"
            },
            "filename": {
                "dtype": "string",
                "id": null,
                "_type": "Value"
            },
            "title": {
                "dtype": "string",
                "id": null,
                "_type": "Value"
            },
            "wiki_context": {
                "dtype": "string",
                "id": null,
                "_type": "Value"
            }
        },
        "length": -1,
        "id": null,
        "_type": "Sequence"
    },
    "search_results": {
        "feature": {
            "description": {
                "dtype": "string",
                "id": null,
                "_type": "Value"
            },
            "filename": {
                "dtype": "string",
                "id": null,
                "_type": "Value"
            },
            "rank": {
                "dtype": "int32",
                "id": null,
                "_type": "Value"
            },
            "title": {
                "dtype": "string",
                "id": null,
                "_type": "Value"
            },
            "url": {
                "dtype": "string",
                "id": null,
                "_type": "Value"
            },
            "search_context": {
                "dtype": "string",
                "id": null,
                "_type": "Value"
            }
        },
        "length": -1,
        "id": null,
        "_type": "Sequence"
    },
    "answer": {
        "aliases": {
            "feature": {
                "dtype": "string",
                "id": null,
                "_type": "Value"
            },
            "length": -1,
            "id": null,
            "_type": "Sequence"
        },
        "normalized_aliases": {
            "feature": {
                "dtype": "string",
                "id": null,
                "_type": "Value"
            },
            "length": -1,
            "id": null,
            "_type": "Sequence"
        },
        "matched_wiki_entity_name": {
            "dtype": "string",
            "id": null,
            "_type": "Value"
        },
        "normalized_matched_wiki_entity_name": {
            "dtype": "string",
            "id": null,
            "_type": "Value"
        },
        "normalized_value": {
            "dtype": "string",
            "id": null,
            "_type": "Value"
        },
        "type": {
            "dtype": "string",
            "id": null,
            "_type": "Value"
        },
        "value": {
            "dtype": "string",
            "id": null,
            "_type": "Value"
        }
    }
}

rc.web

Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:

ds = tfds.load('huggingface:trivia_qa/rc.web')
  • Sự miêu tả :
TriviaqQA is a reading comprehension dataset containing over 650K
question-answer-evidence triples. TriviaqQA includes 95K question-answer
pairs authored by trivia enthusiasts and independently gathered evidence
documents, six per question on average, that provide high quality distant
supervision for answering the questions.
  • Giấy phép : Không có giấy phép được biết đến
  • Phiên bản : 1.2.0
  • Chia tách :
Tách ra Ví dụ
'test' 9509
'train' 76496
'validation' 9951
  • Đặc trưng :
{
    "question": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    },
    "question_id": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    },
    "question_source": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    },
    "entity_pages": {
        "feature": {
            "doc_source": {
                "dtype": "string",
                "id": null,
                "_type": "Value"
            },
            "filename": {
                "dtype": "string",
                "id": null,
                "_type": "Value"
            },
            "title": {
                "dtype": "string",
                "id": null,
                "_type": "Value"
            },
            "wiki_context": {
                "dtype": "string",
                "id": null,
                "_type": "Value"
            }
        },
        "length": -1,
        "id": null,
        "_type": "Sequence"
    },
    "search_results": {
        "feature": {
            "description": {
                "dtype": "string",
                "id": null,
                "_type": "Value"
            },
            "filename": {
                "dtype": "string",
                "id": null,
                "_type": "Value"
            },
            "rank": {
                "dtype": "int32",
                "id": null,
                "_type": "Value"
            },
            "title": {
                "dtype": "string",
                "id": null,
                "_type": "Value"
            },
            "url": {
                "dtype": "string",
                "id": null,
                "_type": "Value"
            },
            "search_context": {
                "dtype": "string",
                "id": null,
                "_type": "Value"
            }
        },
        "length": -1,
        "id": null,
        "_type": "Sequence"
    },
    "answer": {
        "aliases": {
            "feature": {
                "dtype": "string",
                "id": null,
                "_type": "Value"
            },
            "length": -1,
            "id": null,
            "_type": "Sequence"
        },
        "normalized_aliases": {
            "feature": {
                "dtype": "string",
                "id": null,
                "_type": "Value"
            },
            "length": -1,
            "id": null,
            "_type": "Sequence"
        },
        "matched_wiki_entity_name": {
            "dtype": "string",
            "id": null,
            "_type": "Value"
        },
        "normalized_matched_wiki_entity_name": {
            "dtype": "string",
            "id": null,
            "_type": "Value"
        },
        "normalized_value": {
            "dtype": "string",
            "id": null,
            "_type": "Value"
        },
        "type": {
            "dtype": "string",
            "id": null,
            "_type": "Value"
        },
        "value": {
            "dtype": "string",
            "id": null,
            "_type": "Value"
        }
    }
}

RC.web.nocontext

Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:

ds = tfds.load('huggingface:trivia_qa/rc.web.nocontext')
  • Sự miêu tả :
TriviaqQA is a reading comprehension dataset containing over 650K
question-answer-evidence triples. TriviaqQA includes 95K question-answer
pairs authored by trivia enthusiasts and independently gathered evidence
documents, six per question on average, that provide high quality distant
supervision for answering the questions.
  • Giấy phép : Không có giấy phép được biết đến
  • Phiên bản : 1.2.0
  • Chia tách :
Tách ra Ví dụ
'test' 9509
'train' 76496
'validation' 9951
  • Đặc trưng :
{
    "question": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    },
    "question_id": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    },
    "question_source": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    },
    "entity_pages": {
        "feature": {
            "doc_source": {
                "dtype": "string",
                "id": null,
                "_type": "Value"
            },
            "filename": {
                "dtype": "string",
                "id": null,
                "_type": "Value"
            },
            "title": {
                "dtype": "string",
                "id": null,
                "_type": "Value"
            },
            "wiki_context": {
                "dtype": "string",
                "id": null,
                "_type": "Value"
            }
        },
        "length": -1,
        "id": null,
        "_type": "Sequence"
    },
    "search_results": {
        "feature": {
            "description": {
                "dtype": "string",
                "id": null,
                "_type": "Value"
            },
            "filename": {
                "dtype": "string",
                "id": null,
                "_type": "Value"
            },
            "rank": {
                "dtype": "int32",
                "id": null,
                "_type": "Value"
            },
            "title": {
                "dtype": "string",
                "id": null,
                "_type": "Value"
            },
            "url": {
                "dtype": "string",
                "id": null,
                "_type": "Value"
            },
            "search_context": {
                "dtype": "string",
                "id": null,
                "_type": "Value"
            }
        },
        "length": -1,
        "id": null,
        "_type": "Sequence"
    },
    "answer": {
        "aliases": {
            "feature": {
                "dtype": "string",
                "id": null,
                "_type": "Value"
            },
            "length": -1,
            "id": null,
            "_type": "Sequence"
        },
        "normalized_aliases": {
            "feature": {
                "dtype": "string",
                "id": null,
                "_type": "Value"
            },
            "length": -1,
            "id": null,
            "_type": "Sequence"
        },
        "matched_wiki_entity_name": {
            "dtype": "string",
            "id": null,
            "_type": "Value"
        },
        "normalized_matched_wiki_entity_name": {
            "dtype": "string",
            "id": null,
            "_type": "Value"
        },
        "normalized_value": {
            "dtype": "string",
            "id": null,
            "_type": "Value"
        },
        "type": {
            "dtype": "string",
            "id": null,
            "_type": "Value"
        },
        "value": {
            "dtype": "string",
            "id": null,
            "_type": "Value"
        }
    }
}

unfiltered.web

Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:

ds = tfds.load('huggingface:trivia_qa/unfiltered.web')
  • Sự miêu tả :
TriviaqQA is a reading comprehension dataset containing over 650K
question-answer-evidence triples. TriviaqQA includes 95K question-answer
pairs authored by trivia enthusiasts and independently gathered evidence
documents, six per question on average, that provide high quality distant
supervision for answering the questions.
  • Giấy phép : Không có giấy phép được biết đến
  • Phiên bản : 1.2.0
  • Chia tách :
Tách ra Ví dụ
'test' 0
'train' 0
'validation' 0
  • Đặc trưng :
{
    "question": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    },
    "question_id": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    },
    "question_source": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    },
    "entity_pages": {
        "feature": {
            "doc_source": {
                "dtype": "string",
                "id": null,
                "_type": "Value"
            },
            "filename": {
                "dtype": "string",
                "id": null,
                "_type": "Value"
            },
            "title": {
                "dtype": "string",
                "id": null,
                "_type": "Value"
            },
            "wiki_context": {
                "dtype": "string",
                "id": null,
                "_type": "Value"
            }
        },
        "length": -1,
        "id": null,
        "_type": "Sequence"
    },
    "search_results": {
        "feature": {
            "description": {
                "dtype": "string",
                "id": null,
                "_type": "Value"
            },
            "filename": {
                "dtype": "string",
                "id": null,
                "_type": "Value"
            },
            "rank": {
                "dtype": "int32",
                "id": null,
                "_type": "Value"
            },
            "title": {
                "dtype": "string",
                "id": null,
                "_type": "Value"
            },
            "url": {
                "dtype": "string",
                "id": null,
                "_type": "Value"
            },
            "search_context": {
                "dtype": "string",
                "id": null,
                "_type": "Value"
            }
        },
        "length": -1,
        "id": null,
        "_type": "Sequence"
    },
    "answer": {
        "aliases": {
            "feature": {
                "dtype": "string",
                "id": null,
                "_type": "Value"
            },
            "length": -1,
            "id": null,
            "_type": "Sequence"
        },
        "normalized_aliases": {
            "feature": {
                "dtype": "string",
                "id": null,
                "_type": "Value"
            },
            "length": -1,
            "id": null,
            "_type": "Sequence"
        },
        "matched_wiki_entity_name": {
            "dtype": "string",
            "id": null,
            "_type": "Value"
        },
        "normalized_matched_wiki_entity_name": {
            "dtype": "string",
            "id": null,
            "_type": "Value"
        },
        "normalized_value": {
            "dtype": "string",
            "id": null,
            "_type": "Value"
        },
        "type": {
            "dtype": "string",
            "id": null,
            "_type": "Value"
        },
        "value": {
            "dtype": "string",
            "id": null,
            "_type": "Value"
        }
    }
}

unfiltered.web.nocontext

Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:

ds = tfds.load('huggingface:trivia_qa/unfiltered.web.nocontext')
  • Sự miêu tả :
TriviaqQA is a reading comprehension dataset containing over 650K
question-answer-evidence triples. TriviaqQA includes 95K question-answer
pairs authored by trivia enthusiasts and independently gathered evidence
documents, six per question on average, that provide high quality distant
supervision for answering the questions.
  • Giấy phép : Không có giấy phép được biết đến
  • Phiên bản : 1.2.0
  • Chia tách :
Tách ra Ví dụ
'test' 0
'train' 0
'validation' 0
  • Đặc trưng :
{
    "question": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    },
    "question_id": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    },
    "question_source": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    },
    "entity_pages": {
        "feature": {
            "doc_source": {
                "dtype": "string",
                "id": null,
                "_type": "Value"
            },
            "filename": {
                "dtype": "string",
                "id": null,
                "_type": "Value"
            },
            "title": {
                "dtype": "string",
                "id": null,
                "_type": "Value"
            },
            "wiki_context": {
                "dtype": "string",
                "id": null,
                "_type": "Value"
            }
        },
        "length": -1,
        "id": null,
        "_type": "Sequence"
    },
    "search_results": {
        "feature": {
            "description": {
                "dtype": "string",
                "id": null,
                "_type": "Value"
            },
            "filename": {
                "dtype": "string",
                "id": null,
                "_type": "Value"
            },
            "rank": {
                "dtype": "int32",
                "id": null,
                "_type": "Value"
            },
            "title": {
                "dtype": "string",
                "id": null,
                "_type": "Value"
            },
            "url": {
                "dtype": "string",
                "id": null,
                "_type": "Value"
            },
            "search_context": {
                "dtype": "string",
                "id": null,
                "_type": "Value"
            }
        },
        "length": -1,
        "id": null,
        "_type": "Sequence"
    },
    "answer": {
        "aliases": {
            "feature": {
                "dtype": "string",
                "id": null,
                "_type": "Value"
            },
            "length": -1,
            "id": null,
            "_type": "Sequence"
        },
        "normalized_aliases": {
            "feature": {
                "dtype": "string",
                "id": null,
                "_type": "Value"
            },
            "length": -1,
            "id": null,
            "_type": "Sequence"
        },
        "matched_wiki_entity_name": {
            "dtype": "string",
            "id": null,
            "_type": "Value"
        },
        "normalized_matched_wiki_entity_name": {
            "dtype": "string",
            "id": null,
            "_type": "Value"
        },
        "normalized_value": {
            "dtype": "string",
            "id": null,
            "_type": "Value"
        },
        "type": {
            "dtype": "string",
            "id": null,
            "_type": "Value"
        },
        "value": {
            "dtype": "string",
            "id": null,
            "_type": "Value"
        }
    }
}

rc.wikipedia

Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:

ds = tfds.load('huggingface:trivia_qa/rc.wikipedia')
  • Sự miêu tả :
TriviaqQA is a reading comprehension dataset containing over 650K
question-answer-evidence triples. TriviaqQA includes 95K question-answer
pairs authored by trivia enthusiasts and independently gathered evidence
documents, six per question on average, that provide high quality distant
supervision for answering the questions.
  • Giấy phép : Không có giấy phép được biết đến
  • Phiên bản : 1.2.0
  • Chia tách :
Tách ra Ví dụ
'test' 7701
'train' 61888
'validation' 7993
  • Đặc trưng :
{
    "question": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    },
    "question_id": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    },
    "question_source": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    },
    "entity_pages": {
        "feature": {
            "doc_source": {
                "dtype": "string",
                "id": null,
                "_type": "Value"
            },
            "filename": {
                "dtype": "string",
                "id": null,
                "_type": "Value"
            },
            "title": {
                "dtype": "string",
                "id": null,
                "_type": "Value"
            },
            "wiki_context": {
                "dtype": "string",
                "id": null,
                "_type": "Value"
            }
        },
        "length": -1,
        "id": null,
        "_type": "Sequence"
    },
    "search_results": {
        "feature": {
            "description": {
                "dtype": "string",
                "id": null,
                "_type": "Value"
            },
            "filename": {
                "dtype": "string",
                "id": null,
                "_type": "Value"
            },
            "rank": {
                "dtype": "int32",
                "id": null,
                "_type": "Value"
            },
            "title": {
                "dtype": "string",
                "id": null,
                "_type": "Value"
            },
            "url": {
                "dtype": "string",
                "id": null,
                "_type": "Value"
            },
            "search_context": {
                "dtype": "string",
                "id": null,
                "_type": "Value"
            }
        },
        "length": -1,
        "id": null,
        "_type": "Sequence"
    },
    "answer": {
        "aliases": {
            "feature": {
                "dtype": "string",
                "id": null,
                "_type": "Value"
            },
            "length": -1,
            "id": null,
            "_type": "Sequence"
        },
        "normalized_aliases": {
            "feature": {
                "dtype": "string",
                "id": null,
                "_type": "Value"
            },
            "length": -1,
            "id": null,
            "_type": "Sequence"
        },
        "matched_wiki_entity_name": {
            "dtype": "string",
            "id": null,
            "_type": "Value"
        },
        "normalized_matched_wiki_entity_name": {
            "dtype": "string",
            "id": null,
            "_type": "Value"
        },
        "normalized_value": {
            "dtype": "string",
            "id": null,
            "_type": "Value"
        },
        "type": {
            "dtype": "string",
            "id": null,
            "_type": "Value"
        },
        "value": {
            "dtype": "string",
            "id": null,
            "_type": "Value"
        }
    }
}

RC.wikipedia.nocontext

Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:

ds = tfds.load('huggingface:trivia_qa/rc.wikipedia.nocontext')
  • Sự miêu tả :
TriviaqQA is a reading comprehension dataset containing over 650K
question-answer-evidence triples. TriviaqQA includes 95K question-answer
pairs authored by trivia enthusiasts and independently gathered evidence
documents, six per question on average, that provide high quality distant
supervision for answering the questions.
  • Giấy phép : Không có giấy phép được biết đến
  • Phiên bản : 1.2.0
  • Chia tách :
Tách ra Ví dụ
'test' 7701
'train' 61888
'validation' 7993
  • Đặc trưng :
{
    "question": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    },
    "question_id": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    },
    "question_source": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    },
    "entity_pages": {
        "feature": {
            "doc_source": {
                "dtype": "string",
                "id": null,
                "_type": "Value"
            },
            "filename": {
                "dtype": "string",
                "id": null,
                "_type": "Value"
            },
            "title": {
                "dtype": "string",
                "id": null,
                "_type": "Value"
            },
            "wiki_context": {
                "dtype": "string",
                "id": null,
                "_type": "Value"
            }
        },
        "length": -1,
        "id": null,
        "_type": "Sequence"
    },
    "search_results": {
        "feature": {
            "description": {
                "dtype": "string",
                "id": null,
                "_type": "Value"
            },
            "filename": {
                "dtype": "string",
                "id": null,
                "_type": "Value"
            },
            "rank": {
                "dtype": "int32",
                "id": null,
                "_type": "Value"
            },
            "title": {
                "dtype": "string",
                "id": null,
                "_type": "Value"
            },
            "url": {
                "dtype": "string",
                "id": null,
                "_type": "Value"
            },
            "search_context": {
                "dtype": "string",
                "id": null,
                "_type": "Value"
            }
        },
        "length": -1,
        "id": null,
        "_type": "Sequence"
    },
    "answer": {
        "aliases": {
            "feature": {
                "dtype": "string",
                "id": null,
                "_type": "Value"
            },
            "length": -1,
            "id": null,
            "_type": "Sequence"
        },
        "normalized_aliases": {
            "feature": {
                "dtype": "string",
                "id": null,
                "_type": "Value"
            },
            "length": -1,
            "id": null,
            "_type": "Sequence"
        },
        "matched_wiki_entity_name": {
            "dtype": "string",
            "id": null,
            "_type": "Value"
        },
        "normalized_matched_wiki_entity_name": {
            "dtype": "string",
            "id": null,
            "_type": "Value"
        },
        "normalized_value": {
            "dtype": "string",
            "id": null,
            "_type": "Value"
        },
        "type": {
            "dtype": "string",
            "id": null,
            "_type": "Value"
        },
        "value": {
            "dtype": "string",
            "id": null,
            "_type": "Value"
        }
    }
}

chưa lọc.wikipedia

Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:

ds = tfds.load('huggingface:trivia_qa/unfiltered.wikipedia')
  • Sự miêu tả :
TriviaqQA is a reading comprehension dataset containing over 650K
question-answer-evidence triples. TriviaqQA includes 95K question-answer
pairs authored by trivia enthusiasts and independently gathered evidence
documents, six per question on average, that provide high quality distant
supervision for answering the questions.
  • Giấy phép : Không có giấy phép được biết đến
  • Phiên bản : 1.2.0
  • Chia tách :
Tách ra Ví dụ
'test' 0
'train' 0
'validation' 0
  • Đặc trưng :
{
    "question": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    },
    "question_id": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    },
    "question_source": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    },
    "entity_pages": {
        "feature": {
            "doc_source": {
                "dtype": "string",
                "id": null,
                "_type": "Value"
            },
            "filename": {
                "dtype": "string",
                "id": null,
                "_type": "Value"
            },
            "title": {
                "dtype": "string",
                "id": null,
                "_type": "Value"
            },
            "wiki_context": {
                "dtype": "string",
                "id": null,
                "_type": "Value"
            }
        },
        "length": -1,
        "id": null,
        "_type": "Sequence"
    },
    "search_results": {
        "feature": {
            "description": {
                "dtype": "string",
                "id": null,
                "_type": "Value"
            },
            "filename": {
                "dtype": "string",
                "id": null,
                "_type": "Value"
            },
            "rank": {
                "dtype": "int32",
                "id": null,
                "_type": "Value"
            },
            "title": {
                "dtype": "string",
                "id": null,
                "_type": "Value"
            },
            "url": {
                "dtype": "string",
                "id": null,
                "_type": "Value"
            },
            "search_context": {
                "dtype": "string",
                "id": null,
                "_type": "Value"
            }
        },
        "length": -1,
        "id": null,
        "_type": "Sequence"
    },
    "answer": {
        "aliases": {
            "feature": {
                "dtype": "string",
                "id": null,
                "_type": "Value"
            },
            "length": -1,
            "id": null,
            "_type": "Sequence"
        },
        "normalized_aliases": {
            "feature": {
                "dtype": "string",
                "id": null,
                "_type": "Value"
            },
            "length": -1,
            "id": null,
            "_type": "Sequence"
        },
        "matched_wiki_entity_name": {
            "dtype": "string",
            "id": null,
            "_type": "Value"
        },
        "normalized_matched_wiki_entity_name": {
            "dtype": "string",
            "id": null,
            "_type": "Value"
        },
        "normalized_value": {
            "dtype": "string",
            "id": null,
            "_type": "Value"
        },
        "type": {
            "dtype": "string",
            "id": null,
            "_type": "Value"
        },
        "value": {
            "dtype": "string",
            "id": null,
            "_type": "Value"
        }
    }
}

unfiltered.wikipedia.nocontext

Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:

ds = tfds.load('huggingface:trivia_qa/unfiltered.wikipedia.nocontext')
  • Sự miêu tả :
TriviaqQA is a reading comprehension dataset containing over 650K
question-answer-evidence triples. TriviaqQA includes 95K question-answer
pairs authored by trivia enthusiasts and independently gathered evidence
documents, six per question on average, that provide high quality distant
supervision for answering the questions.
  • Giấy phép : Không có giấy phép được biết đến
  • Phiên bản : 1.2.0
  • Chia tách :
Tách ra Ví dụ
'test' 0
'train' 0
'validation' 0
  • Đặc trưng :
{
    "question": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    },
    "question_id": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    },
    "question_source": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    },
    "entity_pages": {
        "feature": {
            "doc_source": {
                "dtype": "string",
                "id": null,
                "_type": "Value"
            },
            "filename": {
                "dtype": "string",
                "id": null,
                "_type": "Value"
            },
            "title": {
                "dtype": "string",
                "id": null,
                "_type": "Value"
            },
            "wiki_context": {
                "dtype": "string",
                "id": null,
                "_type": "Value"
            }
        },
        "length": -1,
        "id": null,
        "_type": "Sequence"
    },
    "search_results": {
        "feature": {
            "description": {
                "dtype": "string",
                "id": null,
                "_type": "Value"
            },
            "filename": {
                "dtype": "string",
                "id": null,
                "_type": "Value"
            },
            "rank": {
                "dtype": "int32",
                "id": null,
                "_type": "Value"
            },
            "title": {
                "dtype": "string",
                "id": null,
                "_type": "Value"
            },
            "url": {
                "dtype": "string",
                "id": null,
                "_type": "Value"
            },
            "search_context": {
                "dtype": "string",
                "id": null,
                "_type": "Value"
            }
        },
        "length": -1,
        "id": null,
        "_type": "Sequence"
    },
    "answer": {
        "aliases": {
            "feature": {
                "dtype": "string",
                "id": null,
                "_type": "Value"
            },
            "length": -1,
            "id": null,
            "_type": "Sequence"
        },
        "normalized_aliases": {
            "feature": {
                "dtype": "string",
                "id": null,
                "_type": "Value"
            },
            "length": -1,
            "id": null,
            "_type": "Sequence"
        },
        "matched_wiki_entity_name": {
            "dtype": "string",
            "id": null,
            "_type": "Value"
        },
        "normalized_matched_wiki_entity_name": {
            "dtype": "string",
            "id": null,
            "_type": "Value"
        },
        "normalized_value": {
            "dtype": "string",
            "id": null,
            "_type": "Value"
        },
        "type": {
            "dtype": "string",
            "id": null,
            "_type": "Value"
        },
        "value": {
            "dtype": "string",
            "id": null,
            "_type": "Value"
        }
    }
}