Aprenda o que há de mais recente em aprendizado de máquina, IA generativa e muito mais no WiML Symposium 2023 Registre-se

Esta página foi traduzida pela API Cloud Translation.

unified_qa

Descrição :

O benchmark UnifiedQA consiste em 20 conjuntos de dados de resposta a perguntas principais (QA) (cada um pode ter várias versões) que visam diferentes formatos, bem como vários fenômenos linguísticos complexos. Esses conjuntos de dados são agrupados em vários formatos/categorias, incluindo: controle de qualidade extrativo, controle de qualidade abstrato, controle de qualidade de múltipla escolha e controle de qualidade sim/não. Além disso, conjuntos de contraste são usados para vários conjuntos de dados (indicados com " conjuntos de contraste"). Esses conjuntos de avaliação são perturbações geradas por especialistas que se desviam dos padrões comuns no conjunto de dados original. Para vários conjuntos de dados que não vêm com parágrafos de evidência, duas variantes são incluídas: uma em que os conjuntos de dados são usados como estão e outra que usa parágrafos obtidos por meio de um sistema de recuperação de informações como evidência adicional, indicada com tags "_ir".

Mais informações podem ser encontradas em: https://github.com/allenai/unifiedqa

Página inicial : https://github.com/allenai/unifiedqa
Código -fonte: tfds.text.unifiedqa.UnifiedQA
Versões :
- 1.0.0 (padrão): versão inicial.
Estrutura de recursos :

FeaturesDict({
    'input': string,
    'output': string,
})

Documentação do recurso:

Característica	Classe	Tipo D
	RecursosDict
entrada	tensor	corda
resultado	tensor	corda

Chaves supervisionadas (Consulte as_supervised doc ): None
Figura ( tfds.show_examples ): Não suportado.

unified_qa/ai2_science_elementary (configuração padrão)

Descrição da configuração : o conjunto de dados AI2 Science Questions consiste em perguntas usadas em avaliações de alunos nos Estados Unidos nos níveis de ensino fundamental e médio. Cada pergunta é um formato de múltipla escolha de 4 vias e pode ou não incluir um elemento de diagrama. Este conjunto consiste em perguntas usadas para os níveis do ensino fundamental.
Tamanho do download : 345.59 KiB
Tamanho do conjunto de dados : 390.02 KiB
Cache automático ( documentação ): Sim
Divisões :

Dividir	Exemplos
`'test'`	542
`'train'`	623
`'validation'`	123

Exemplos ( tfds.as_dataframe ):

Citação :

http://data.allenai.org/ai2-science-questions

@inproceedings{khashabi-etal-2020-unifiedqa,
    title = "{UNIFIEDQA}: Crossing Format Boundaries with a Single {QA} System",
    author = "Khashabi, Daniel  and
      Min, Sewon  and
      Khot, Tushar  and
      Sabharwal, Ashish  and
      Tafjord, Oyvind  and
      Clark, Peter  and
      Hajishirzi, Hannaneh",
    booktitle = "Findings of the Association for Computational Linguistics: EMNLP 2020",
    month = nov,
    year = "2020",
    address = "Online",
    publisher = "Association for Computational Linguistics",
    url = "https://aclanthology.org/2020.findings-emnlp.171",
    doi = "10.18653/v1/2020.findings-emnlp.171",
    pages = "1896--1907",
}

Note that each UnifiedQA dataset has its own citation. Please see the source to
see the correct citation for each contained dataset."

unified_qa/ai2_science_middle

Descrição da configuração : o conjunto de dados AI2 Science Questions consiste em perguntas usadas em avaliações de alunos nos Estados Unidos nos níveis de ensino fundamental e médio. Cada pergunta é um formato de múltipla escolha de 4 vias e pode ou não incluir um elemento de diagrama. Este conjunto consiste em perguntas usadas para os níveis do ensino médio.
Tamanho do download : 428.41 KiB
Tamanho do conjunto de dados : 477.40 KiB
Cache automático ( documentação ): Sim
Divisões :

Dividir	Exemplos
`'test'`	679
`'train'`	605
`'validation'`	125

Exemplos ( tfds.as_dataframe ):

Citação :

http://data.allenai.org/ai2-science-questions

@inproceedings{khashabi-etal-2020-unifiedqa,
    title = "{UNIFIEDQA}: Crossing Format Boundaries with a Single {QA} System",
    author = "Khashabi, Daniel  and
      Min, Sewon  and
      Khot, Tushar  and
      Sabharwal, Ashish  and
      Tafjord, Oyvind  and
      Clark, Peter  and
      Hajishirzi, Hannaneh",
    booktitle = "Findings of the Association for Computational Linguistics: EMNLP 2020",
    month = nov,
    year = "2020",
    address = "Online",
    publisher = "Association for Computational Linguistics",
    url = "https://aclanthology.org/2020.findings-emnlp.171",
    doi = "10.18653/v1/2020.findings-emnlp.171",
    pages = "1896--1907",
}

Note that each UnifiedQA dataset has its own citation. Please see the source to
see the correct citation for each contained dataset."

unified_qa/ambigqa

Descrição da configuração : AmbigQA é uma tarefa de resposta a perguntas de domínio aberto que envolve encontrar todas as respostas plausíveis e, em seguida, reescrever a pergunta para cada uma para resolver a ambiguidade.
Tamanho do download : 2.27 MiB
Tamanho do conjunto de dados : 3.04 MiB
Cache automático ( documentação ): Sim
Divisões :

Dividir	Exemplos
`'train'`	19.806
`'validation'`	5.674

Exemplos ( tfds.as_dataframe ):

Citação :

@inproceedings{min-etal-2020-ambigqa,
    title = "{A}mbig{QA}: Answering Ambiguous Open-domain Questions",
    author = "Min, Sewon  and
      Michael, Julian  and
      Hajishirzi, Hannaneh  and
      Zettlemoyer, Luke",
    booktitle = "Proceedings of the 2020 Conference on Empirical Methods in Natural Language Processing (EMNLP)",
    month = nov,
    year = "2020",
    address = "Online",
    publisher = "Association for Computational Linguistics",
    url = "https://aclanthology.org/2020.emnlp-main.466",
    doi = "10.18653/v1/2020.emnlp-main.466",
    pages = "5783--5797",
}

@inproceedings{khashabi-etal-2020-unifiedqa,
    title = "{UNIFIEDQA}: Crossing Format Boundaries with a Single {QA} System",
    author = "Khashabi, Daniel  and
      Min, Sewon  and
      Khot, Tushar  and
      Sabharwal, Ashish  and
      Tafjord, Oyvind  and
      Clark, Peter  and
      Hajishirzi, Hannaneh",
    booktitle = "Findings of the Association for Computational Linguistics: EMNLP 2020",
    month = nov,
    year = "2020",
    address = "Online",
    publisher = "Association for Computational Linguistics",
    url = "https://aclanthology.org/2020.findings-emnlp.171",
    doi = "10.18653/v1/2020.findings-emnlp.171",
    pages = "1896--1907",
}

Note that each UnifiedQA dataset has its own citation. Please see the source to
see the correct citation for each contained dataset."

unified_qa/arc_easy

Descrição da configuração : este conjunto de dados consiste em perguntas científicas de múltipla escolha, de nível escolar, reunidas para incentivar a pesquisa em respostas avançadas a perguntas. O conjunto de dados é particionado em um conjunto de desafio e um conjunto fácil, onde o primeiro contém apenas perguntas respondidas incorretamente por um algoritmo baseado em recuperação e um algoritmo de co-ocorrência de palavras. Este conjunto consiste em perguntas "fáceis".
Tamanho do download : 1.24 MiB
Tamanho do conjunto de dados : 1.42 MiB
Cache automático ( documentação ): Sim
Divisões :

Dividir	Exemplos
`'test'`	2.376
`'train'`	2.251
`'validation'`	570

Exemplos ( tfds.as_dataframe ):

Citação :

@article{clark2018think,
    title={Think you have solved question answering? try arc, the ai2 reasoning challenge},
    author={Clark, Peter and Cowhey, Isaac and Etzioni, Oren and Khot, Tushar and Sabharwal, Ashish and Schoenick, Carissa and Tafjord, Oyvind},
    journal={arXiv preprint arXiv:1803.05457},
    year={2018}
}

@inproceedings{khashabi-etal-2020-unifiedqa,
    title = "{UNIFIEDQA}: Crossing Format Boundaries with a Single {QA} System",
    author = "Khashabi, Daniel  and
      Min, Sewon  and
      Khot, Tushar  and
      Sabharwal, Ashish  and
      Tafjord, Oyvind  and
      Clark, Peter  and
      Hajishirzi, Hannaneh",
    booktitle = "Findings of the Association for Computational Linguistics: EMNLP 2020",
    month = nov,
    year = "2020",
    address = "Online",
    publisher = "Association for Computational Linguistics",
    url = "https://aclanthology.org/2020.findings-emnlp.171",
    doi = "10.18653/v1/2020.findings-emnlp.171",
    pages = "1896--1907",
}

Note that each UnifiedQA dataset has its own citation. Please see the source to
see the correct citation for each contained dataset."

unified_qa/arc_easy_dev

Descrição da configuração : este conjunto de dados consiste em perguntas científicas de múltipla escolha, de nível escolar, reunidas para incentivar a pesquisa em respostas avançadas a perguntas. O conjunto de dados é particionado em um conjunto de desafio e um conjunto fácil, onde o primeiro contém apenas perguntas respondidas incorretamente por um algoritmo baseado em recuperação e um algoritmo de co-ocorrência de palavra. Este conjunto consiste em perguntas "fáceis".
Tamanho do download : 1.24 MiB
Tamanho do conjunto de dados : 1.42 MiB
Cache automático ( documentação ): Sim
Divisões :

Dividir	Exemplos
`'test'`	2.376
`'train'`	2.251
`'validation'`	570

Exemplos ( tfds.as_dataframe ):

Citação :

@article{clark2018think,
    title={Think you have solved question answering? try arc, the ai2 reasoning challenge},
    author={Clark, Peter and Cowhey, Isaac and Etzioni, Oren and Khot, Tushar and Sabharwal, Ashish and Schoenick, Carissa and Tafjord, Oyvind},
    journal={arXiv preprint arXiv:1803.05457},
    year={2018}
}

@inproceedings{khashabi-etal-2020-unifiedqa,
    title = "{UNIFIEDQA}: Crossing Format Boundaries with a Single {QA} System",
    author = "Khashabi, Daniel  and
      Min, Sewon  and
      Khot, Tushar  and
      Sabharwal, Ashish  and
      Tafjord, Oyvind  and
      Clark, Peter  and
      Hajishirzi, Hannaneh",
    booktitle = "Findings of the Association for Computational Linguistics: EMNLP 2020",
    month = nov,
    year = "2020",
    address = "Online",
    publisher = "Association for Computational Linguistics",
    url = "https://aclanthology.org/2020.findings-emnlp.171",
    doi = "10.18653/v1/2020.findings-emnlp.171",
    pages = "1896--1907",
}

Note that each UnifiedQA dataset has its own citation. Please see the source to
see the correct citation for each contained dataset."

unified_qa/arc_easy_with_ir

Descrição da configuração : este conjunto de dados consiste em perguntas científicas de múltipla escolha, de nível escolar, reunidas para incentivar a pesquisa em respostas avançadas a perguntas. O conjunto de dados é particionado em um conjunto de desafio e um conjunto fácil, onde o primeiro contém apenas perguntas respondidas incorretamente por um algoritmo baseado em recuperação e um algoritmo de co-ocorrência de palavras. Este conjunto consiste em perguntas "fáceis". Esta versão inclui parágrafos obtidos por meio de um sistema de recuperação de informações como evidência adicional.
Tamanho do download : 7.00 MiB
Tamanho do conjunto de dados : 7.17 MiB
Cache automático ( documentação ): Sim
Divisões :

Dividir	Exemplos
`'test'`	2.376
`'train'`	2.251
`'validation'`	570

Exemplos ( tfds.as_dataframe ):

Citação :

@article{clark2018think,
    title={Think you have solved question answering? try arc, the ai2 reasoning challenge},
    author={Clark, Peter and Cowhey, Isaac and Etzioni, Oren and Khot, Tushar and Sabharwal, Ashish and Schoenick, Carissa and Tafjord, Oyvind},
    journal={arXiv preprint arXiv:1803.05457},
    year={2018}
}

@inproceedings{khashabi-etal-2020-unifiedqa,
    title = "{UNIFIEDQA}: Crossing Format Boundaries with a Single {QA} System",
    author = "Khashabi, Daniel  and
      Min, Sewon  and
      Khot, Tushar  and
      Sabharwal, Ashish  and
      Tafjord, Oyvind  and
      Clark, Peter  and
      Hajishirzi, Hannaneh",
    booktitle = "Findings of the Association for Computational Linguistics: EMNLP 2020",
    month = nov,
    year = "2020",
    address = "Online",
    publisher = "Association for Computational Linguistics",
    url = "https://aclanthology.org/2020.findings-emnlp.171",
    doi = "10.18653/v1/2020.findings-emnlp.171",
    pages = "1896--1907",
}

Note that each UnifiedQA dataset has its own citation. Please see the source to
see the correct citation for each contained dataset."

unified_qa/arc_easy_with_ir_dev

Descrição da configuração : este conjunto de dados consiste em perguntas científicas de múltipla escolha, de nível escolar, reunidas para incentivar a pesquisa em respostas avançadas a perguntas. O conjunto de dados é particionado em um conjunto de desafio e um conjunto fácil, onde o primeiro contém apenas perguntas respondidas incorretamente por um algoritmo baseado em recuperação e um algoritmo de co-ocorrência de palavra. Este conjunto consiste em perguntas "fáceis". Esta versão inclui parágrafos obtidos por meio de um sistema de recuperação de informações como evidência adicional.
Tamanho do download : 7.00 MiB
Tamanho do conjunto de dados : 7.17 MiB
Cache automático ( documentação ): Sim
Divisões :

Dividir	Exemplos
`'test'`	2.376
`'train'`	2.251
`'validation'`	570

Exemplos ( tfds.as_dataframe ):

Citação :

@article{clark2018think,
    title={Think you have solved question answering? try arc, the ai2 reasoning challenge},
    author={Clark, Peter and Cowhey, Isaac and Etzioni, Oren and Khot, Tushar and Sabharwal, Ashish and Schoenick, Carissa and Tafjord, Oyvind},
    journal={arXiv preprint arXiv:1803.05457},
    year={2018}
}

@inproceedings{khashabi-etal-2020-unifiedqa,
    title = "{UNIFIEDQA}: Crossing Format Boundaries with a Single {QA} System",
    author = "Khashabi, Daniel  and
      Min, Sewon  and
      Khot, Tushar  and
      Sabharwal, Ashish  and
      Tafjord, Oyvind  and
      Clark, Peter  and
      Hajishirzi, Hannaneh",
    booktitle = "Findings of the Association for Computational Linguistics: EMNLP 2020",
    month = nov,
    year = "2020",
    address = "Online",
    publisher = "Association for Computational Linguistics",
    url = "https://aclanthology.org/2020.findings-emnlp.171",
    doi = "10.18653/v1/2020.findings-emnlp.171",
    pages = "1896--1907",
}

Note that each UnifiedQA dataset has its own citation. Please see the source to
see the correct citation for each contained dataset."

unified_qa/arc_hard

Descrição da configuração : este conjunto de dados consiste em perguntas científicas de múltipla escolha, de nível escolar, reunidas para incentivar a pesquisa em respostas avançadas a perguntas. O conjunto de dados é particionado em um conjunto de desafio e um conjunto fácil, onde o primeiro contém apenas perguntas respondidas incorretamente por um algoritmo baseado em recuperação e um algoritmo de co-ocorrência de palavra. Este conjunto consiste em perguntas "difíceis".
Tamanho do download : 758.03 KiB
Tamanho do conjunto de dados : 848.28 KiB
Cache automático ( documentação ): Sim
Divisões :

Dividir	Exemplos
`'test'`	1.172
`'train'`	1.119
`'validation'`	299

Exemplos ( tfds.as_dataframe ):

Citação :

@article{clark2018think,
    title={Think you have solved question answering? try arc, the ai2 reasoning challenge},
    author={Clark, Peter and Cowhey, Isaac and Etzioni, Oren and Khot, Tushar and Sabharwal, Ashish and Schoenick, Carissa and Tafjord, Oyvind},
    journal={arXiv preprint arXiv:1803.05457},
    year={2018}
}

@inproceedings{khashabi-etal-2020-unifiedqa,
    title = "{UNIFIEDQA}: Crossing Format Boundaries with a Single {QA} System",
    author = "Khashabi, Daniel  and
      Min, Sewon  and
      Khot, Tushar  and
      Sabharwal, Ashish  and
      Tafjord, Oyvind  and
      Clark, Peter  and
      Hajishirzi, Hannaneh",
    booktitle = "Findings of the Association for Computational Linguistics: EMNLP 2020",
    month = nov,
    year = "2020",
    address = "Online",
    publisher = "Association for Computational Linguistics",
    url = "https://aclanthology.org/2020.findings-emnlp.171",
    doi = "10.18653/v1/2020.findings-emnlp.171",
    pages = "1896--1907",
}

Note that each UnifiedQA dataset has its own citation. Please see the source to
see the correct citation for each contained dataset."

unified_qa/arc_hard_dev

Descrição da configuração : este conjunto de dados consiste em perguntas científicas de múltipla escolha, de nível escolar, reunidas para incentivar a pesquisa em respostas avançadas a perguntas. O conjunto de dados é particionado em um conjunto de desafio e um conjunto fácil, onde o primeiro contém apenas perguntas respondidas incorretamente por um algoritmo baseado em recuperação e um algoritmo de co-ocorrência de palavra. Este conjunto consiste em perguntas "difíceis".
Tamanho do download : 758.03 KiB
Tamanho do conjunto de dados : 848.28 KiB
Cache automático ( documentação ): Sim
Divisões :

Dividir	Exemplos
`'test'`	1.172
`'train'`	1.119
`'validation'`	299

Exemplos ( tfds.as_dataframe ):

Citação :

@article{clark2018think,
    title={Think you have solved question answering? try arc, the ai2 reasoning challenge},
    author={Clark, Peter and Cowhey, Isaac and Etzioni, Oren and Khot, Tushar and Sabharwal, Ashish and Schoenick, Carissa and Tafjord, Oyvind},
    journal={arXiv preprint arXiv:1803.05457},
    year={2018}
}

@inproceedings{khashabi-etal-2020-unifiedqa,
    title = "{UNIFIEDQA}: Crossing Format Boundaries with a Single {QA} System",
    author = "Khashabi, Daniel  and
      Min, Sewon  and
      Khot, Tushar  and
      Sabharwal, Ashish  and
      Tafjord, Oyvind  and
      Clark, Peter  and
      Hajishirzi, Hannaneh",
    booktitle = "Findings of the Association for Computational Linguistics: EMNLP 2020",
    month = nov,
    year = "2020",
    address = "Online",
    publisher = "Association for Computational Linguistics",
    url = "https://aclanthology.org/2020.findings-emnlp.171",
    doi = "10.18653/v1/2020.findings-emnlp.171",
    pages = "1896--1907",
}

Note that each UnifiedQA dataset has its own citation. Please see the source to
see the correct citation for each contained dataset."

unified_qa/arc_hard_with_ir

Descrição da configuração : este conjunto de dados consiste em perguntas científicas de múltipla escolha, de nível escolar, reunidas para incentivar a pesquisa em respostas avançadas a perguntas. O conjunto de dados é particionado em um conjunto de desafio e um conjunto fácil, onde o primeiro contém apenas perguntas respondidas incorretamente por um algoritmo baseado em recuperação e um algoritmo de co-ocorrência de palavra. Este conjunto consiste em perguntas "difíceis". Esta versão inclui parágrafos obtidos por meio de um sistema de recuperação de informações como evidência adicional.
Tamanho do download : 3.53 MiB
Tamanho do conjunto de dados : 3.62 MiB
Cache automático ( documentação ): Sim
Divisões :

Dividir	Exemplos
`'test'`	1.172
`'train'`	1.119
`'validation'`	299

Exemplos ( tfds.as_dataframe ):

Citação :

@article{clark2018think,
    title={Think you have solved question answering? try arc, the ai2 reasoning challenge},
    author={Clark, Peter and Cowhey, Isaac and Etzioni, Oren and Khot, Tushar and Sabharwal, Ashish and Schoenick, Carissa and Tafjord, Oyvind},
    journal={arXiv preprint arXiv:1803.05457},
    year={2018}
}

@inproceedings{khashabi-etal-2020-unifiedqa,
    title = "{UNIFIEDQA}: Crossing Format Boundaries with a Single {QA} System",
    author = "Khashabi, Daniel  and
      Min, Sewon  and
      Khot, Tushar  and
      Sabharwal, Ashish  and
      Tafjord, Oyvind  and
      Clark, Peter  and
      Hajishirzi, Hannaneh",
    booktitle = "Findings of the Association for Computational Linguistics: EMNLP 2020",
    month = nov,
    year = "2020",
    address = "Online",
    publisher = "Association for Computational Linguistics",
    url = "https://aclanthology.org/2020.findings-emnlp.171",
    doi = "10.18653/v1/2020.findings-emnlp.171",
    pages = "1896--1907",
}

Note that each UnifiedQA dataset has its own citation. Please see the source to
see the correct citation for each contained dataset."

unified_qa/arc_hard_with_ir_dev

Descrição da configuração : este conjunto de dados consiste em perguntas científicas de múltipla escolha, de nível escolar, reunidas para incentivar a pesquisa em respostas avançadas a perguntas. O conjunto de dados é particionado em um conjunto de desafio e um conjunto fácil, onde o primeiro contém apenas perguntas respondidas incorretamente por um algoritmo baseado em recuperação e um algoritmo de co-ocorrência de palavra. Este conjunto consiste em perguntas "difíceis". Esta versão inclui parágrafos obtidos por meio de um sistema de recuperação de informações como evidência adicional.
Tamanho do download : 3.53 MiB
Tamanho do conjunto de dados : 3.62 MiB
Cache automático ( documentação ): Sim
Divisões :

Dividir	Exemplos
`'test'`	1.172
`'train'`	1.119
`'validation'`	299

Exemplos ( tfds.as_dataframe ):

Citação :

@article{clark2018think,
    title={Think you have solved question answering? try arc, the ai2 reasoning challenge},
    author={Clark, Peter and Cowhey, Isaac and Etzioni, Oren and Khot, Tushar and Sabharwal, Ashish and Schoenick, Carissa and Tafjord, Oyvind},
    journal={arXiv preprint arXiv:1803.05457},
    year={2018}
}

@inproceedings{khashabi-etal-2020-unifiedqa,
    title = "{UNIFIEDQA}: Crossing Format Boundaries with a Single {QA} System",
    author = "Khashabi, Daniel  and
      Min, Sewon  and
      Khot, Tushar  and
      Sabharwal, Ashish  and
      Tafjord, Oyvind  and
      Clark, Peter  and
      Hajishirzi, Hannaneh",
    booktitle = "Findings of the Association for Computational Linguistics: EMNLP 2020",
    month = nov,
    year = "2020",
    address = "Online",
    publisher = "Association for Computational Linguistics",
    url = "https://aclanthology.org/2020.findings-emnlp.171",
    doi = "10.18653/v1/2020.findings-emnlp.171",
    pages = "1896--1907",
}

Note that each UnifiedQA dataset has its own citation. Please see the source to
see the correct citation for each contained dataset."

unified_qa/boolq

Descrição da configuração : BoolQ é um conjunto de dados de resposta a perguntas para perguntas sim/não. Essas perguntas ocorrem naturalmente --- elas são geradas em ambientes não solicitados e sem restrições. Cada exemplo é um trio de (pergunta, passagem, resposta), com o título da página como contexto adicional opcional. A configuração de classificação de pares de texto é semelhante às tarefas de inferência de linguagem natural existentes.
Tamanho do download : 7.77 MiB
Tamanho do conjunto de dados : 8.20 MiB
Cache automático ( documentação ): Sim
Divisões :

Dividir	Exemplos
`'train'`	9.427
`'validation'`	3.270

Exemplos ( tfds.as_dataframe ):

Citação :

@inproceedings{clark-etal-2019-boolq,
    title = "{B}ool{Q}: Exploring the Surprising Difficulty of Natural Yes/No Questions",
    author = "Clark, Christopher  and
      Lee, Kenton  and
      Chang, Ming-Wei  and
      Kwiatkowski, Tom  and
      Collins, Michael  and
      Toutanova, Kristina",
    booktitle = "Proceedings of the 2019 Conference of the North {A}merican Chapter of the Association for Computational Linguistics: Human Language Technologies, Volume 1 (Long and Short Papers)",
    month = jun,
    year = "2019",
    address = "Minneapolis, Minnesota",
    publisher = "Association for Computational Linguistics",
    url = "https://aclanthology.org/N19-1300",
    doi = "10.18653/v1/N19-1300",
    pages = "2924--2936",
}

@inproceedings{khashabi-etal-2020-unifiedqa,
    title = "{UNIFIEDQA}: Crossing Format Boundaries with a Single {QA} System",
    author = "Khashabi, Daniel  and
      Min, Sewon  and
      Khot, Tushar  and
      Sabharwal, Ashish  and
      Tafjord, Oyvind  and
      Clark, Peter  and
      Hajishirzi, Hannaneh",
    booktitle = "Findings of the Association for Computational Linguistics: EMNLP 2020",
    month = nov,
    year = "2020",
    address = "Online",
    publisher = "Association for Computational Linguistics",
    url = "https://aclanthology.org/2020.findings-emnlp.171",
    doi = "10.18653/v1/2020.findings-emnlp.171",
    pages = "1896--1907",
}

Note that each UnifiedQA dataset has its own citation. Please see the source to
see the correct citation for each contained dataset."

unified_qa/boolq_np

Descrição da configuração : BoolQ é um conjunto de dados de resposta a perguntas para perguntas sim/não. Essas perguntas ocorrem naturalmente --- elas são geradas em ambientes não solicitados e sem restrições. Cada exemplo é um trio de (pergunta, passagem, resposta), com o título da página como contexto adicional opcional. A configuração de classificação de pares de texto é semelhante às tarefas de inferência de linguagem natural existentes. Esta versão adiciona perturbações naturais à versão original.
Tamanho do download : 10.80 MiB
Tamanho do conjunto de dados : 11.40 MiB
Cache automático ( documentação ): Sim
Divisões :

Dividir	Exemplos
`'train'`	9.727
`'validation'`	7.596

Exemplos ( tfds.as_dataframe ):

Citação :

@inproceedings{khashabi-etal-2020-bang,
    title = "More Bang for Your Buck: Natural Perturbation for Robust Question Answering",
    author = "Khashabi, Daniel  and
      Khot, Tushar  and
      Sabharwal, Ashish",
    booktitle = "Proceedings of the 2020 Conference on Empirical Methods in Natural Language Processing (EMNLP)",
    month = nov,
    year = "2020",
    address = "Online",
    publisher = "Association for Computational Linguistics",
    url = "https://aclanthology.org/2020.emnlp-main.12",
    doi = "10.18653/v1/2020.emnlp-main.12",
    pages = "163--170",
}

@inproceedings{khashabi-etal-2020-unifiedqa,
    title = "{UNIFIEDQA}: Crossing Format Boundaries with a Single {QA} System",
    author = "Khashabi, Daniel  and
      Min, Sewon  and
      Khot, Tushar  and
      Sabharwal, Ashish  and
      Tafjord, Oyvind  and
      Clark, Peter  and
      Hajishirzi, Hannaneh",
    booktitle = "Findings of the Association for Computational Linguistics: EMNLP 2020",
    month = nov,
    year = "2020",
    address = "Online",
    publisher = "Association for Computational Linguistics",
    url = "https://aclanthology.org/2020.findings-emnlp.171",
    doi = "10.18653/v1/2020.findings-emnlp.171",
    pages = "1896--1907",
}

Note that each UnifiedQA dataset has its own citation. Please see the source to
see the correct citation for each contained dataset."

unified_qa/commonsenseqa

Descrição da configuração : CommonsenseQA é um novo conjunto de dados de resposta a perguntas de múltipla escolha que requer diferentes tipos de conhecimento de senso comum para prever as respostas corretas. Contém perguntas com uma resposta correta e quatro respostas distrativas.
Tamanho do download : 1.79 MiB
Tamanho do conjunto de dados : 2.19 MiB
Cache automático ( documentação ): Sim
Divisões :

Dividir	Exemplos
`'test'`	1.140
`'train'`	9.741
`'validation'`	1.221

Exemplos ( tfds.as_dataframe ):

Citação :

@inproceedings{talmor-etal-2019-commonsenseqa,
    title = "{C}ommonsense{QA}: A Question Answering Challenge Targeting Commonsense Knowledge",
    author = "Talmor, Alon  and
      Herzig, Jonathan  and
      Lourie, Nicholas  and
      Berant, Jonathan",
    booktitle = "Proceedings of the 2019 Conference of the North {A}merican Chapter of the Association for Computational Linguistics: Human Language Technologies, Volume 1 (Long and Short Papers)",
    month = jun,
    year = "2019",
    address = "Minneapolis, Minnesota",
    publisher = "Association for Computational Linguistics",
    url = "https://aclanthology.org/N19-1421",
    doi = "10.18653/v1/N19-1421",
    pages = "4149--4158",
}

@inproceedings{khashabi-etal-2020-unifiedqa,
    title = "{UNIFIEDQA}: Crossing Format Boundaries with a Single {QA} System",
    author = "Khashabi, Daniel  and
      Min, Sewon  and
      Khot, Tushar  and
      Sabharwal, Ashish  and
      Tafjord, Oyvind  and
      Clark, Peter  and
      Hajishirzi, Hannaneh",
    booktitle = "Findings of the Association for Computational Linguistics: EMNLP 2020",
    month = nov,
    year = "2020",
    address = "Online",
    publisher = "Association for Computational Linguistics",
    url = "https://aclanthology.org/2020.findings-emnlp.171",
    doi = "10.18653/v1/2020.findings-emnlp.171",
    pages = "1896--1907",
}

Note that each UnifiedQA dataset has its own citation. Please see the source to
see the correct citation for each contained dataset."

unified_qa/commonsenseqa_test

Descrição da configuração : CommonsenseQA é um novo conjunto de dados de resposta a perguntas de múltipla escolha que requer diferentes tipos de conhecimento de senso comum para prever as respostas corretas. Contém perguntas com uma resposta correta e quatro respostas distrativas.
Tamanho do download : 1.79 MiB
Tamanho do conjunto de dados : 2.19 MiB
Cache automático ( documentação ): Sim
Divisões :

Dividir	Exemplos
`'test'`	1.140
`'train'`	9.741
`'validation'`	1.221

Exemplos ( tfds.as_dataframe ):

Citação :

@inproceedings{talmor-etal-2019-commonsenseqa,
    title = "{C}ommonsense{QA}: A Question Answering Challenge Targeting Commonsense Knowledge",
    author = "Talmor, Alon  and
      Herzig, Jonathan  and
      Lourie, Nicholas  and
      Berant, Jonathan",
    booktitle = "Proceedings of the 2019 Conference of the North {A}merican Chapter of the Association for Computational Linguistics: Human Language Technologies, Volume 1 (Long and Short Papers)",
    month = jun,
    year = "2019",
    address = "Minneapolis, Minnesota",
    publisher = "Association for Computational Linguistics",
    url = "https://aclanthology.org/N19-1421",
    doi = "10.18653/v1/N19-1421",
    pages = "4149--4158",
}

@inproceedings{khashabi-etal-2020-unifiedqa,
    title = "{UNIFIEDQA}: Crossing Format Boundaries with a Single {QA} System",
    author = "Khashabi, Daniel  and
      Min, Sewon  and
      Khot, Tushar  and
      Sabharwal, Ashish  and
      Tafjord, Oyvind  and
      Clark, Peter  and
      Hajishirzi, Hannaneh",
    booktitle = "Findings of the Association for Computational Linguistics: EMNLP 2020",
    month = nov,
    year = "2020",
    address = "Online",
    publisher = "Association for Computational Linguistics",
    url = "https://aclanthology.org/2020.findings-emnlp.171",
    doi = "10.18653/v1/2020.findings-emnlp.171",
    pages = "1896--1907",
}

Note that each UnifiedQA dataset has its own citation. Please see the source to
see the correct citation for each contained dataset."

unified_qa/contrast_sets_boolq

Descrição da configuração : BoolQ é um conjunto de dados de resposta a perguntas para perguntas sim/não. Essas perguntas ocorrem naturalmente --- elas são geradas em ambientes não solicitados e sem restrições. Cada exemplo é um trio de (pergunta, passagem, resposta), com o título da página como contexto adicional opcional. A configuração de classificação de pares de texto é semelhante às tarefas de inferência de linguagem natural existentes. Esta versão usa conjuntos de contraste. Esses conjuntos de avaliação são perturbações geradas por especialistas que se desviam dos padrões comuns no conjunto de dados original.
Tamanho do download : 438.51 KiB
Tamanho do conjunto de dados : 462.35 KiB
Cache automático ( documentação ): Sim
Divisões :

Dividir	Exemplos
`'train'`	340
`'validation'`	340

Exemplos ( tfds.as_dataframe ):

Citação :

@inproceedings{clark-etal-2019-boolq,
    title = "{B}ool{Q}: Exploring the Surprising Difficulty of Natural Yes/No Questions",
    author = "Clark, Christopher  and
      Lee, Kenton  and
      Chang, Ming-Wei  and
      Kwiatkowski, Tom  and
      Collins, Michael  and
      Toutanova, Kristina",
    booktitle = "Proceedings of the 2019 Conference of the North {A}merican Chapter of the Association for Computational Linguistics: Human Language Technologies, Volume 1 (Long and Short Papers)",
    month = jun,
    year = "2019",
    address = "Minneapolis, Minnesota",
    publisher = "Association for Computational Linguistics",
    url = "https://aclanthology.org/N19-1300",
    doi = "10.18653/v1/N19-1300",
    pages = "2924--2936",
}

@inproceedings{khashabi-etal-2020-unifiedqa,
    title = "{UNIFIEDQA}: Crossing Format Boundaries with a Single {QA} System",
    author = "Khashabi, Daniel  and
      Min, Sewon  and
      Khot, Tushar  and
      Sabharwal, Ashish  and
      Tafjord, Oyvind  and
      Clark, Peter  and
      Hajishirzi, Hannaneh",
    booktitle = "Findings of the Association for Computational Linguistics: EMNLP 2020",
    month = nov,
    year = "2020",
    address = "Online",
    publisher = "Association for Computational Linguistics",
    url = "https://aclanthology.org/2020.findings-emnlp.171",
    doi = "10.18653/v1/2020.findings-emnlp.171",
    pages = "1896--1907",
}

Note that each UnifiedQA dataset has its own citation. Please see the source to
see the correct citation for each contained dataset."

unified_qa/contrast_sets_drop

Descrição da configuração : DROP é um benchmark de QA de crowdsourcing criado contrariamente, no qual um sistema deve resolver referências em uma pergunta, talvez para várias posições de entrada, e executar operações discretas sobre elas (como adição, contagem ou classificação). Essas operações exigem uma compreensão muito mais abrangente do conteúdo dos parágrafos do que o necessário para conjuntos de dados anteriores. Esta versão usa conjuntos de contraste. Esses conjuntos de avaliação são perturbações geradas por especialistas que se desviam dos padrões comuns no conjunto de dados original.
Tamanho do download : 2.20 MiB
Tamanho do conjunto de dados : 2.26 MiB
Cache automático ( documentação ): Sim
Divisões :

Dividir	Exemplos
`'train'`	947
`'validation'`	947

Exemplos ( tfds.as_dataframe ):

Citação :

@inproceedings{dua-etal-2019-drop,
    title = "{DROP}: A Reading Comprehension Benchmark Requiring Discrete Reasoning Over Paragraphs",
    author = "Dua, Dheeru  and
      Wang, Yizhong  and
      Dasigi, Pradeep  and
      Stanovsky, Gabriel  and
      Singh, Sameer  and
      Gardner, Matt",
    booktitle = "Proceedings of the 2019 Conference of the North {A}merican Chapter of the Association for Computational Linguistics: Human Language Technologies, Volume 1 (Long and Short Papers)",
    month = jun,
    year = "2019",
    address = "Minneapolis, Minnesota",
    publisher = "Association for Computational Linguistics",
    url = "https://aclanthology.org/N19-1246",
    doi = "10.18653/v1/N19-1246",
    pages = "2368--2378",
}

@inproceedings{khashabi-etal-2020-unifiedqa,
    title = "{UNIFIEDQA}: Crossing Format Boundaries with a Single {QA} System",
    author = "Khashabi, Daniel  and
      Min, Sewon  and
      Khot, Tushar  and
      Sabharwal, Ashish  and
      Tafjord, Oyvind  and
      Clark, Peter  and
      Hajishirzi, Hannaneh",
    booktitle = "Findings of the Association for Computational Linguistics: EMNLP 2020",
    month = nov,
    year = "2020",
    address = "Online",
    publisher = "Association for Computational Linguistics",
    url = "https://aclanthology.org/2020.findings-emnlp.171",
    doi = "10.18653/v1/2020.findings-emnlp.171",
    pages = "1896--1907",
}

Note that each UnifiedQA dataset has its own citation. Please see the source to
see the correct citation for each contained dataset."

unified_qa/contrast_sets_quoref

Descrição da configuração : Este conjunto de dados testa a capacidade de raciocínio correferencial dos sistemas de compreensão de leitura. Neste benchmark de seleção de extensão contendo perguntas sobre parágrafos da Wikipédia, um sistema deve resolver correferências rígidas antes de selecionar a(s) extensão(ões) apropriada(s) nos parágrafos para responder às perguntas. Esta versão usa conjuntos de contraste. Esses conjuntos de avaliação são perturbações geradas por especialistas que se desviam dos padrões comuns no conjunto de dados original.
Tamanho do download : 2.60 MiB
Tamanho do conjunto de dados : 2.65 MiB
Cache automático ( documentação ): Sim
Divisões :

Dividir	Exemplos
`'train'`	700
`'validation'`	700

Exemplos ( tfds.as_dataframe ):

Citação :

@inproceedings{dasigi-etal-2019-quoref,
    title = "{Q}uoref: A Reading Comprehension Dataset with Questions Requiring Coreferential Reasoning",
    author = "Dasigi, Pradeep  and
      Liu, Nelson F.  and
      Marasovi{'c}, Ana  and
      Smith, Noah A.  and
      Gardner, Matt",
    booktitle = "Proceedings of the 2019 Conference on Empirical Methods in Natural Language Processing and the 9th International Joint Conference on Natural Language Processing (EMNLP-IJCNLP)",
    month = nov,
    year = "2019",
    address = "Hong Kong, China",
    publisher = "Association for Computational Linguistics",
    url = "https://aclanthology.org/D19-1606",
    doi = "10.18653/v1/D19-1606",
    pages = "5925--5932",
}

@inproceedings{khashabi-etal-2020-unifiedqa,
    title = "{UNIFIEDQA}: Crossing Format Boundaries with a Single {QA} System",
    author = "Khashabi, Daniel  and
      Min, Sewon  and
      Khot, Tushar  and
      Sabharwal, Ashish  and
      Tafjord, Oyvind  and
      Clark, Peter  and
      Hajishirzi, Hannaneh",
    booktitle = "Findings of the Association for Computational Linguistics: EMNLP 2020",
    month = nov,
    year = "2020",
    address = "Online",
    publisher = "Association for Computational Linguistics",
    url = "https://aclanthology.org/2020.findings-emnlp.171",
    doi = "10.18653/v1/2020.findings-emnlp.171",
    pages = "1896--1907",
}

Note that each UnifiedQA dataset has its own citation. Please see the source to
see the correct citation for each contained dataset."

unified_qa/contrast_sets_ropes

Descrição da configuração : esse conjunto de dados testa a capacidade de um sistema de aplicar o conhecimento de uma passagem de texto a uma nova situação. A um sistema é apresentada uma passagem de fundo contendo uma relação causal ou qualitativa (por exemplo, "animais polinizadores aumentam a eficiência da fertilização em flores"), uma situação nova que usa esse pano de fundo e questões que requerem raciocínio sobre os efeitos das relações em a passagem de fundo no contexto da situação. Esta versão usa conjuntos de contraste. Esses conjuntos de avaliação são perturbações geradas por especialistas que se desviam dos padrões comuns no conjunto de dados original.
Tamanho do download : 1.97 MiB
Tamanho do conjunto de dados : 2.04 MiB
Cache automático ( documentação ): Sim
Divisões :

Dividir	Exemplos
`'train'`	974
`'validation'`	974

Exemplos ( tfds.as_dataframe ):

Citação :

@inproceedings{lin-etal-2019-reasoning,
    title = "Reasoning Over Paragraph Effects in Situations",
    author = "Lin, Kevin  and
      Tafjord, Oyvind  and
      Clark, Peter  and
      Gardner, Matt",
    booktitle = "Proceedings of the 2nd Workshop on Machine Reading for Question Answering",
    month = nov,
    year = "2019",
    address = "Hong Kong, China",
    publisher = "Association for Computational Linguistics",
    url = "https://aclanthology.org/D19-5808",
    doi = "10.18653/v1/D19-5808",
    pages = "58--62",
}

@inproceedings{khashabi-etal-2020-unifiedqa,
    title = "{UNIFIEDQA}: Crossing Format Boundaries with a Single {QA} System",
    author = "Khashabi, Daniel  and
      Min, Sewon  and
      Khot, Tushar  and
      Sabharwal, Ashish  and
      Tafjord, Oyvind  and
      Clark, Peter  and
      Hajishirzi, Hannaneh",
    booktitle = "Findings of the Association for Computational Linguistics: EMNLP 2020",
    month = nov,
    year = "2020",
    address = "Online",
    publisher = "Association for Computational Linguistics",
    url = "https://aclanthology.org/2020.findings-emnlp.171",
    doi = "10.18653/v1/2020.findings-emnlp.171",
    pages = "1896--1907",
}

Note that each UnifiedQA dataset has its own citation. Please see the source to
see the correct citation for each contained dataset."

unified_qa/drop

Descrição da configuração : DROP é um benchmark de QA de crowdsourcing criado contrariamente, no qual um sistema deve resolver referências em uma pergunta, talvez para várias posições de entrada, e executar operações discretas sobre elas (como adição, contagem ou classificação). Essas operações exigem uma compreensão muito mais abrangente do conteúdo dos parágrafos do que o necessário para conjuntos de dados anteriores.
Tamanho do download : 105.18 MiB
Tamanho do conjunto de dados : 108.16 MiB
Cache automático ( documentação ): Sim
Divisões :

Dividir	Exemplos
`'train'`	77.399
`'validation'`	9.536

Exemplos ( tfds.as_dataframe ):

Citação :

@inproceedings{dua-etal-2019-drop,
    title = "{DROP}: A Reading Comprehension Benchmark Requiring Discrete Reasoning Over Paragraphs",
    author = "Dua, Dheeru  and
      Wang, Yizhong  and
      Dasigi, Pradeep  and
      Stanovsky, Gabriel  and
      Singh, Sameer  and
      Gardner, Matt",
    booktitle = "Proceedings of the 2019 Conference of the North {A}merican Chapter of the Association for Computational Linguistics: Human Language Technologies, Volume 1 (Long and Short Papers)",
    month = jun,
    year = "2019",
    address = "Minneapolis, Minnesota",
    publisher = "Association for Computational Linguistics",
    url = "https://aclanthology.org/N19-1246",
    doi = "10.18653/v1/N19-1246",
    pages = "2368--2378",
}

@inproceedings{khashabi-etal-2020-unifiedqa,
    title = "{UNIFIEDQA}: Crossing Format Boundaries with a Single {QA} System",
    author = "Khashabi, Daniel  and
      Min, Sewon  and
      Khot, Tushar  and
      Sabharwal, Ashish  and
      Tafjord, Oyvind  and
      Clark, Peter  and
      Hajishirzi, Hannaneh",
    booktitle = "Findings of the Association for Computational Linguistics: EMNLP 2020",
    month = nov,
    year = "2020",
    address = "Online",
    publisher = "Association for Computational Linguistics",
    url = "https://aclanthology.org/2020.findings-emnlp.171",
    doi = "10.18653/v1/2020.findings-emnlp.171",
    pages = "1896--1907",
}

Note that each UnifiedQA dataset has its own citation. Please see the source to
see the correct citation for each contained dataset."

unified_qa/mctest

Descrição da configuração : o MCTest exige que as máquinas respondam a perguntas de compreensão de leitura de múltipla escolha sobre histórias fictícias, abordando diretamente o objetivo de alto nível da compreensão de máquina de domínio aberto. A compreensão da leitura pode testar habilidades avançadas, como raciocínio causal e compreensão do mundo, mas, por ser de múltipla escolha, ainda fornece uma métrica clara. Por ser ficcional, a resposta normalmente pode ser encontrada apenas na própria história. As histórias e perguntas também são cuidadosamente limitadas àquelas que uma criança entenderia, reduzindo o conhecimento de mundo necessário para a tarefa.
Tamanho do download : 2.14 MiB
Tamanho do conjunto de dados : 2.20 MiB
Cache automático ( documentação ): Sim
Divisões :

Dividir	Exemplos
`'train'`	1.480
`'validation'`	320

Exemplos ( tfds.as_dataframe ):

Citação :

@inproceedings{richardson-etal-2013-mctest,
    title = "{MCT}est: A Challenge Dataset for the Open-Domain Machine Comprehension of Text",
    author = "Richardson, Matthew  and
      Burges, Christopher J.C.  and
      Renshaw, Erin",
    booktitle = "Proceedings of the 2013 Conference on Empirical Methods in Natural Language Processing",
    month = oct,
    year = "2013",
    address = "Seattle, Washington, USA",
    publisher = "Association for Computational Linguistics",
    url = "https://aclanthology.org/D13-1020",
    pages = "193--203",
}

@inproceedings{khashabi-etal-2020-unifiedqa,
    title = "{UNIFIEDQA}: Crossing Format Boundaries with a Single {QA} System",
    author = "Khashabi, Daniel  and
      Min, Sewon  and
      Khot, Tushar  and
      Sabharwal, Ashish  and
      Tafjord, Oyvind  and
      Clark, Peter  and
      Hajishirzi, Hannaneh",
    booktitle = "Findings of the Association for Computational Linguistics: EMNLP 2020",
    month = nov,
    year = "2020",
    address = "Online",
    publisher = "Association for Computational Linguistics",
    url = "https://aclanthology.org/2020.findings-emnlp.171",
    doi = "10.18653/v1/2020.findings-emnlp.171",
    pages = "1896--1907",
}

Note that each UnifiedQA dataset has its own citation. Please see the source to
see the correct citation for each contained dataset."

unified_qa/mctest_corricted_the_separator

Descrição da configuração : o MCTest exige que as máquinas respondam a perguntas de compreensão de leitura de múltipla escolha sobre histórias fictícias, abordando diretamente o objetivo de alto nível da compreensão de máquina de domínio aberto. A compreensão da leitura pode testar habilidades avançadas, como raciocínio causal e compreensão do mundo, mas, por ser de múltipla escolha, ainda fornece uma métrica clara. Por ser ficcional, a resposta normalmente pode ser encontrada apenas na própria história. As histórias e perguntas também são cuidadosamente limitadas àquelas que uma criança entenderia, reduzindo o conhecimento de mundo necessário para a tarefa.
Tamanho do download : 2.15 MiB
Tamanho do conjunto de dados : 2.21 MiB
Cache automático ( documentação ): Sim
Divisões :

Dividir	Exemplos
`'train'`	1.480
`'validation'`	320

Exemplos ( tfds.as_dataframe ):

Citação :

@inproceedings{richardson-etal-2013-mctest,
    title = "{MCT}est: A Challenge Dataset for the Open-Domain Machine Comprehension of Text",
    author = "Richardson, Matthew  and
      Burges, Christopher J.C.  and
      Renshaw, Erin",
    booktitle = "Proceedings of the 2013 Conference on Empirical Methods in Natural Language Processing",
    month = oct,
    year = "2013",
    address = "Seattle, Washington, USA",
    publisher = "Association for Computational Linguistics",
    url = "https://aclanthology.org/D13-1020",
    pages = "193--203",
}

@inproceedings{khashabi-etal-2020-unifiedqa,
    title = "{UNIFIEDQA}: Crossing Format Boundaries with a Single {QA} System",
    author = "Khashabi, Daniel  and
      Min, Sewon  and
      Khot, Tushar  and
      Sabharwal, Ashish  and
      Tafjord, Oyvind  and
      Clark, Peter  and
      Hajishirzi, Hannaneh",
    booktitle = "Findings of the Association for Computational Linguistics: EMNLP 2020",
    month = nov,
    year = "2020",
    address = "Online",
    publisher = "Association for Computational Linguistics",
    url = "https://aclanthology.org/2020.findings-emnlp.171",
    doi = "10.18653/v1/2020.findings-emnlp.171",
    pages = "1896--1907",
}

Note that each UnifiedQA dataset has its own citation. Please see the source to
see the correct citation for each contained dataset."

unified_qa/multirc

Descrição da configuração : MultiRC é um desafio de compreensão de leitura em que as perguntas só podem ser respondidas levando em conta as informações de várias frases. Perguntas e respostas para este desafio foram solicitadas e verificadas por meio de um experimento de crowdsourcing de 4 etapas. O conjunto de dados contém perguntas para parágrafos em 7 domínios diferentes (ciências do ensino fundamental, notícias, guias de viagem, histórias de ficção, etc.) trazendo diversidade linguística para os textos e para as formulações das perguntas.
Tamanho do download : 897.09 KiB
Tamanho do conjunto de dados : 918.42 KiB
Cache automático ( documentação ): Sim
Divisões :

Dividir	Exemplos
`'train'`	312
`'validation'`	312

Exemplos ( tfds.as_dataframe ):

Citação :

@inproceedings{khashabi-etal-2018-looking,
    title = "Looking Beyond the Surface: A Challenge Set for Reading Comprehension over Multiple Sentences",
    author = "Khashabi, Daniel  and
      Chaturvedi, Snigdha  and
      Roth, Michael  and
      Upadhyay, Shyam  and
      Roth, Dan",
    booktitle = "Proceedings of the 2018 Conference of the North {A}merican Chapter of the Association for Computational Linguistics: Human Language Technologies, Volume 1 (Long Papers)",
    month = jun,
    year = "2018",
    address = "New Orleans, Louisiana",
    publisher = "Association for Computational Linguistics",
    url = "https://aclanthology.org/N18-1023",
    doi = "10.18653/v1/N18-1023",
    pages = "252--262",
}

@inproceedings{khashabi-etal-2020-unifiedqa,
    title = "{UNIFIEDQA}: Crossing Format Boundaries with a Single {QA} System",
    author = "Khashabi, Daniel  and
      Min, Sewon  and
      Khot, Tushar  and
      Sabharwal, Ashish  and
      Tafjord, Oyvind  and
      Clark, Peter  and
      Hajishirzi, Hannaneh",
    booktitle = "Findings of the Association for Computational Linguistics: EMNLP 2020",
    month = nov,
    year = "2020",
    address = "Online",
    publisher = "Association for Computational Linguistics",
    url = "https://aclanthology.org/2020.findings-emnlp.171",
    doi = "10.18653/v1/2020.findings-emnlp.171",
    pages = "1896--1907",
}

Note that each UnifiedQA dataset has its own citation. Please see the source to
see the correct citation for each contained dataset."

unified_qa/narrativeqa

Descrição da configuração : NarrativeQA é um conjunto de dados em inglês de histórias e perguntas correspondentes projetadas para testar a compreensão de leitura, especialmente em documentos longos.
Tamanho do download : 308.28 MiB
Tamanho do conjunto de dados : 311.22 MiB
Armazenado em cache automaticamente ( documentação ): Não
Divisões :

Dividir	Exemplos
`'test'`	21.114
`'train'`	65.494
`'validation'`	6.922

Exemplos ( tfds.as_dataframe ):

Citação :

@article{kocisky-etal-2018-narrativeqa,
    title = "The {N}arrative{QA} Reading Comprehension Challenge",
    author = "Ko{
{c} }isk{'y}, Tom{'a}{
{s} }  and
      Schwarz, Jonathan  and
      Blunsom, Phil  and
      Dyer, Chris  and
      Hermann, Karl Moritz  and
      Melis, G{'a}bor  and
      Grefenstette, Edward",
    journal = "Transactions of the Association for Computational Linguistics",
    volume = "6",
    year = "2018",
    address = "Cambridge, MA",
    publisher = "MIT Press",
    url = "https://aclanthology.org/Q18-1023",
    doi = "10.1162/tacl_a_00023",
    pages = "317--328",
}

@inproceedings{khashabi-etal-2020-unifiedqa,
    title = "{UNIFIEDQA}: Crossing Format Boundaries with a Single {QA} System",
    author = "Khashabi, Daniel  and
      Min, Sewon  and
      Khot, Tushar  and
      Sabharwal, Ashish  and
      Tafjord, Oyvind  and
      Clark, Peter  and
      Hajishirzi, Hannaneh",
    booktitle = "Findings of the Association for Computational Linguistics: EMNLP 2020",
    month = nov,
    year = "2020",
    address = "Online",
    publisher = "Association for Computational Linguistics",
    url = "https://aclanthology.org/2020.findings-emnlp.171",
    doi = "10.18653/v1/2020.findings-emnlp.171",
    pages = "1896--1907",
}

Note that each UnifiedQA dataset has its own citation. Please see the source to
see the correct citation for each contained dataset."

unified_qa/narrativeqa_dev

Descrição da configuração : NarrativeQA é um conjunto de dados em inglês de histórias e perguntas correspondentes projetadas para testar a compreensão de leitura, especialmente em documentos longos.
Tamanho do download : 308.28 MiB
Tamanho do conjunto de dados : 311.22 MiB
Armazenado em cache automaticamente ( documentação ): Não
Divisões :

Dividir	Exemplos
`'test'`	21.114
`'train'`	65.494
`'validation'`	6.922

Exemplos ( tfds.as_dataframe ):

Citação :

@article{kocisky-etal-2018-narrativeqa,
    title = "The {N}arrative{QA} Reading Comprehension Challenge",
    author = "Ko{
{c} }isk{'y}, Tom{'a}{
{s} }  and
      Schwarz, Jonathan  and
      Blunsom, Phil  and
      Dyer, Chris  and
      Hermann, Karl Moritz  and
      Melis, G{'a}bor  and
      Grefenstette, Edward",
    journal = "Transactions of the Association for Computational Linguistics",
    volume = "6",
    year = "2018",
    address = "Cambridge, MA",
    publisher = "MIT Press",
    url = "https://aclanthology.org/Q18-1023",
    doi = "10.1162/tacl_a_00023",
    pages = "317--328",
}

@inproceedings{khashabi-etal-2020-unifiedqa,
    title = "{UNIFIEDQA}: Crossing Format Boundaries with a Single {QA} System",
    author = "Khashabi, Daniel  and
      Min, Sewon  and
      Khot, Tushar  and
      Sabharwal, Ashish  and
      Tafjord, Oyvind  and
      Clark, Peter  and
      Hajishirzi, Hannaneh",
    booktitle = "Findings of the Association for Computational Linguistics: EMNLP 2020",
    month = nov,
    year = "2020",
    address = "Online",
    publisher = "Association for Computational Linguistics",
    url = "https://aclanthology.org/2020.findings-emnlp.171",
    doi = "10.18653/v1/2020.findings-emnlp.171",
    pages = "1896--1907",
}

Note that each UnifiedQA dataset has its own citation. Please see the source to
see the correct citation for each contained dataset."

unified_qa/natural_questions

Descrição da configuração : O corpus NQ contém perguntas de usuários reais e exige que os sistemas de controle de qualidade leiam e compreendam um artigo inteiro da Wikipédia que pode ou não conter a resposta para a pergunta. A inclusão de perguntas reais do usuário e a exigência de que as soluções devem ler uma página inteira para encontrar a resposta fazem com que o NQ seja uma tarefa mais realista e desafiadora do que os conjuntos de dados de QA anteriores.
Tamanho do download : 6.95 MiB
Tamanho do conjunto de dados : 9.88 MiB
Cache automático ( documentação ): Sim
Divisões :

Dividir	Exemplos
`'train'`	96.075
`'validation'`	2.295

Exemplos ( tfds.as_dataframe ):

Citação :

@article{kwiatkowski-etal-2019-natural,
    title = "Natural Questions: A Benchmark for Question Answering Research",
    author = "Kwiatkowski, Tom  and
      Palomaki, Jennimaria  and
      Redfield, Olivia  and
      Collins, Michael  and
      Parikh, Ankur  and
      Alberti, Chris  and
      Epstein, Danielle  and
      Polosukhin, Illia  and
      Devlin, Jacob  and
      Lee, Kenton  and
      Toutanova, Kristina  and
      Jones, Llion  and
      Kelcey, Matthew  and
      Chang, Ming-Wei  and
      Dai, Andrew M.  and
      Uszkoreit, Jakob  and
      Le, Quoc  and
      Petrov, Slav",
    journal = "Transactions of the Association for Computational Linguistics",
    volume = "7",
    year = "2019",
    address = "Cambridge, MA",
    publisher = "MIT Press",
    url = "https://aclanthology.org/Q19-1026",
    doi = "10.1162/tacl_a_00276",
    pages = "452--466",
}

@inproceedings{khashabi-etal-2020-unifiedqa,
    title = "{UNIFIEDQA}: Crossing Format Boundaries with a Single {QA} System",
    author = "Khashabi, Daniel  and
      Min, Sewon  and
      Khot, Tushar  and
      Sabharwal, Ashish  and
      Tafjord, Oyvind  and
      Clark, Peter  and
      Hajishirzi, Hannaneh",
    booktitle = "Findings of the Association for Computational Linguistics: EMNLP 2020",
    month = nov,
    year = "2020",
    address = "Online",
    publisher = "Association for Computational Linguistics",
    url = "https://aclanthology.org/2020.findings-emnlp.171",
    doi = "10.18653/v1/2020.findings-emnlp.171",
    pages = "1896--1907",
}

Note that each UnifiedQA dataset has its own citation. Please see the source to
see the correct citation for each contained dataset."

unified_qa/natural_questions_direct_ans

Descrição da configuração : O corpus NQ contém perguntas de usuários reais e exige que os sistemas de controle de qualidade leiam e compreendam um artigo inteiro da Wikipédia que pode ou não conter a resposta para a pergunta. A inclusão de perguntas reais do usuário e a exigência de que as soluções devem ler uma página inteira para encontrar a resposta fazem com que o NQ seja uma tarefa mais realista e desafiadora do que os conjuntos de dados de QA anteriores. Esta versão consiste em perguntas de resposta direta.
Tamanho do download : 6.82 MiB
Tamanho do conjunto de dados : 10.19 MiB
Cache automático ( documentação ): Sim
Divisões :

Dividir	Exemplos
`'test'`	6.468
`'train'`	96.676
`'validation'`	10.693

Exemplos ( tfds.as_dataframe ):

Citação :

@article{kwiatkowski-etal-2019-natural,
    title = "Natural Questions: A Benchmark for Question Answering Research",
    author = "Kwiatkowski, Tom  and
      Palomaki, Jennimaria  and
      Redfield, Olivia  and
      Collins, Michael  and
      Parikh, Ankur  and
      Alberti, Chris  and
      Epstein, Danielle  and
      Polosukhin, Illia  and
      Devlin, Jacob  and
      Lee, Kenton  and
      Toutanova, Kristina  and
      Jones, Llion  and
      Kelcey, Matthew  and
      Chang, Ming-Wei  and
      Dai, Andrew M.  and
      Uszkoreit, Jakob  and
      Le, Quoc  and
      Petrov, Slav",
    journal = "Transactions of the Association for Computational Linguistics",
    volume = "7",
    year = "2019",
    address = "Cambridge, MA",
    publisher = "MIT Press",
    url = "https://aclanthology.org/Q19-1026",
    doi = "10.1162/tacl_a_00276",
    pages = "452--466",
}

@inproceedings{khashabi-etal-2020-unifiedqa,
    title = "{UNIFIEDQA}: Crossing Format Boundaries with a Single {QA} System",
    author = "Khashabi, Daniel  and
      Min, Sewon  and
      Khot, Tushar  and
      Sabharwal, Ashish  and
      Tafjord, Oyvind  and
      Clark, Peter  and
      Hajishirzi, Hannaneh",
    booktitle = "Findings of the Association for Computational Linguistics: EMNLP 2020",
    month = nov,
    year = "2020",
    address = "Online",
    publisher = "Association for Computational Linguistics",
    url = "https://aclanthology.org/2020.findings-emnlp.171",
    doi = "10.18653/v1/2020.findings-emnlp.171",
    pages = "1896--1907",
}

Note that each UnifiedQA dataset has its own citation. Please see the source to
see the correct citation for each contained dataset."

unified_qa/natural_questions_direct_ans_test

Descrição da configuração : O corpus NQ contém perguntas de usuários reais e exige que os sistemas de controle de qualidade leiam e compreendam um artigo inteiro da Wikipédia que pode ou não conter a resposta para a pergunta. A inclusão de perguntas reais do usuário e a exigência de que as soluções devem ler uma página inteira para encontrar a resposta fazem com que o NQ seja uma tarefa mais realista e desafiadora do que os conjuntos de dados de QA anteriores. Esta versão consiste em perguntas de resposta direta.
Tamanho do download : 6.82 MiB
Tamanho do conjunto de dados : 10.19 MiB
Cache automático ( documentação ): Sim
Divisões :

Dividir	Exemplos
`'test'`	6.468
`'train'`	96.676
`'validation'`	10.693

Exemplos ( tfds.as_dataframe ):

Citação :

@article{kwiatkowski-etal-2019-natural,
    title = "Natural Questions: A Benchmark for Question Answering Research",
    author = "Kwiatkowski, Tom  and
      Palomaki, Jennimaria  and
      Redfield, Olivia  and
      Collins, Michael  and
      Parikh, Ankur  and
      Alberti, Chris  and
      Epstein, Danielle  and
      Polosukhin, Illia  and
      Devlin, Jacob  and
      Lee, Kenton  and
      Toutanova, Kristina  and
      Jones, Llion  and
      Kelcey, Matthew  and
      Chang, Ming-Wei  and
      Dai, Andrew M.  and
      Uszkoreit, Jakob  and
      Le, Quoc  and
      Petrov, Slav",
    journal = "Transactions of the Association for Computational Linguistics",
    volume = "7",
    year = "2019",
    address = "Cambridge, MA",
    publisher = "MIT Press",
    url = "https://aclanthology.org/Q19-1026",
    doi = "10.1162/tacl_a_00276",
    pages = "452--466",
}

@inproceedings{khashabi-etal-2020-unifiedqa,
    title = "{UNIFIEDQA}: Crossing Format Boundaries with a Single {QA} System",
    author = "Khashabi, Daniel  and
      Min, Sewon  and
      Khot, Tushar  and
      Sabharwal, Ashish  and
      Tafjord, Oyvind  and
      Clark, Peter  and
      Hajishirzi, Hannaneh",
    booktitle = "Findings of the Association for Computational Linguistics: EMNLP 2020",
    month = nov,
    year = "2020",
    address = "Online",
    publisher = "Association for Computational Linguistics",
    url = "https://aclanthology.org/2020.findings-emnlp.171",
    doi = "10.18653/v1/2020.findings-emnlp.171",
    pages = "1896--1907",
}

Note that each UnifiedQA dataset has its own citation. Please see the source to
see the correct citation for each contained dataset."

unified_qa/natural_questions_with_dpr_para

Descrição da configuração : O corpus NQ contém perguntas de usuários reais e exige que os sistemas de controle de qualidade leiam e compreendam um artigo inteiro da Wikipédia que pode ou não conter a resposta para a pergunta. A inclusão de perguntas reais do usuário e a exigência de que as soluções devem ler uma página inteira para encontrar a resposta fazem com que o NQ seja uma tarefa mais realista e desafiadora do que os conjuntos de dados de QA anteriores. Esta versão inclui parágrafos adicionais (obtidos usando o mecanismo de recuperação DPR) para aumentar cada pergunta.
Tamanho do download : 319.22 MiB
Tamanho do conjunto de dados : 322.91 MiB
Armazenado em cache automaticamente ( documentação ): Não
Divisões :

Dividir	Exemplos
`'train'`	96.676
`'validation'`	10.693

Exemplos ( tfds.as_dataframe ):

Citação :

@article{kwiatkowski-etal-2019-natural,
    title = "Natural Questions: A Benchmark for Question Answering Research",
    author = "Kwiatkowski, Tom  and
      Palomaki, Jennimaria  and
      Redfield, Olivia  and
      Collins, Michael  and
      Parikh, Ankur  and
      Alberti, Chris  and
      Epstein, Danielle  and
      Polosukhin, Illia  and
      Devlin, Jacob  and
      Lee, Kenton  and
      Toutanova, Kristina  and
      Jones, Llion  and
      Kelcey, Matthew  and
      Chang, Ming-Wei  and
      Dai, Andrew M.  and
      Uszkoreit, Jakob  and
      Le, Quoc  and
      Petrov, Slav",
    journal = "Transactions of the Association for Computational Linguistics",
    volume = "7",
    year = "2019",
    address = "Cambridge, MA",
    publisher = "MIT Press",
    url = "https://aclanthology.org/Q19-1026",
    doi = "10.1162/tacl_a_00276",
    pages = "452--466",
}

@inproceedings{khashabi-etal-2020-unifiedqa,
    title = "{UNIFIEDQA}: Crossing Format Boundaries with a Single {QA} System",
    author = "Khashabi, Daniel  and
      Min, Sewon  and
      Khot, Tushar  and
      Sabharwal, Ashish  and
      Tafjord, Oyvind  and
      Clark, Peter  and
      Hajishirzi, Hannaneh",
    booktitle = "Findings of the Association for Computational Linguistics: EMNLP 2020",
    month = nov,
    year = "2020",
    address = "Online",
    publisher = "Association for Computational Linguistics",
    url = "https://aclanthology.org/2020.findings-emnlp.171",
    doi = "10.18653/v1/2020.findings-emnlp.171",
    pages = "1896--1907",
}

Note that each UnifiedQA dataset has its own citation. Please see the source to
see the correct citation for each contained dataset."

unified_qa/natural_questions_with_dpr_para_test

Descrição da configuração : O corpus NQ contém perguntas de usuários reais e exige que os sistemas de controle de qualidade leiam e compreendam um artigo inteiro da Wikipédia que pode ou não conter a resposta para a pergunta. A inclusão de perguntas reais do usuário e a exigência de que as soluções devem ler uma página inteira para encontrar a resposta fazem com que o NQ seja uma tarefa mais realista e desafiadora do que os conjuntos de dados de QA anteriores. Esta versão inclui parágrafos adicionais (obtidos usando o mecanismo de recuperação DPR) para aumentar cada pergunta.
Tamanho do download : 306.94 MiB
Tamanho do conjunto de dados : 310.48 MiB
Armazenado em cache automaticamente ( documentação ): Não
Divisões :

Dividir	Exemplos
`'test'`	6.468
`'train'`	96.676

Exemplos ( tfds.as_dataframe ):

Citação :

@article{kwiatkowski-etal-2019-natural,
    title = "Natural Questions: A Benchmark for Question Answering Research",
    author = "Kwiatkowski, Tom  and
      Palomaki, Jennimaria  and
      Redfield, Olivia  and
      Collins, Michael  and
      Parikh, Ankur  and
      Alberti, Chris  and
      Epstein, Danielle  and
      Polosukhin, Illia  and
      Devlin, Jacob  and
      Lee, Kenton  and
      Toutanova, Kristina  and
      Jones, Llion  and
      Kelcey, Matthew  and
      Chang, Ming-Wei  and
      Dai, Andrew M.  and
      Uszkoreit, Jakob  and
      Le, Quoc  and
      Petrov, Slav",
    journal = "Transactions of the Association for Computational Linguistics",
    volume = "7",
    year = "2019",
    address = "Cambridge, MA",
    publisher = "MIT Press",
    url = "https://aclanthology.org/Q19-1026",
    doi = "10.1162/tacl_a_00276",
    pages = "452--466",
}

@inproceedings{khashabi-etal-2020-unifiedqa,
    title = "{UNIFIEDQA}: Crossing Format Boundaries with a Single {QA} System",
    author = "Khashabi, Daniel  and
      Min, Sewon  and
      Khot, Tushar  and
      Sabharwal, Ashish  and
      Tafjord, Oyvind  and
      Clark, Peter  and
      Hajishirzi, Hannaneh",
    booktitle = "Findings of the Association for Computational Linguistics: EMNLP 2020",
    month = nov,
    year = "2020",
    address = "Online",
    publisher = "Association for Computational Linguistics",
    url = "https://aclanthology.org/2020.findings-emnlp.171",
    doi = "10.18653/v1/2020.findings-emnlp.171",
    pages = "1896--1907",
}

Note that each UnifiedQA dataset has its own citation. Please see the source to
see the correct citation for each contained dataset."

unified_qa/newsqa

Descrição da configuração : NewsQA é um conjunto de dados de compreensão de máquina desafiador de pares de perguntas e respostas gerados por humanos. Crowdworkers fornecem perguntas e respostas com base em um conjunto de artigos de notícias da CNN, com respostas que consistem em trechos de texto dos artigos correspondentes.
Tamanho do download : 283.33 MiB
Tamanho do conjunto de dados : 285.94 MiB
Armazenado em cache automaticamente ( documentação ): Não
Divisões :

Dividir	Exemplos
`'train'`	75.882
`'validation'`	4.309

Exemplos ( tfds.as_dataframe ):

Citação :

@inproceedings{trischler-etal-2017-newsqa,
    title = "{N}ews{QA}: A Machine Comprehension Dataset",
    author = "Trischler, Adam  and
      Wang, Tong  and
      Yuan, Xingdi  and
      Harris, Justin  and
      Sordoni, Alessandro  and
      Bachman, Philip  and
      Suleman, Kaheer",
    booktitle = "Proceedings of the 2nd Workshop on Representation Learning for {NLP}",
    month = aug,
    year = "2017",
    address = "Vancouver, Canada",
    publisher = "Association for Computational Linguistics",
    url = "https://aclanthology.org/W17-2623",
    doi = "10.18653/v1/W17-2623",
    pages = "191--200",
}

@inproceedings{khashabi-etal-2020-unifiedqa,
    title = "{UNIFIEDQA}: Crossing Format Boundaries with a Single {QA} System",
    author = "Khashabi, Daniel  and
      Min, Sewon  and
      Khot, Tushar  and
      Sabharwal, Ashish  and
      Tafjord, Oyvind  and
      Clark, Peter  and
      Hajishirzi, Hannaneh",
    booktitle = "Findings of the Association for Computational Linguistics: EMNLP 2020",
    month = nov,
    year = "2020",
    address = "Online",
    publisher = "Association for Computational Linguistics",
    url = "https://aclanthology.org/2020.findings-emnlp.171",
    doi = "10.18653/v1/2020.findings-emnlp.171",
    pages = "1896--1907",
}

Note that each UnifiedQA dataset has its own citation. Please see the source to
see the correct citation for each contained dataset."

unified_qa/openbookqa

Descrição da configuração : O OpenBookQA visa promover a pesquisa em respostas avançadas a perguntas, sondando uma compreensão mais profunda do tópico (com fatos importantes resumidos como um livro aberto, também fornecido com o conjunto de dados) e da linguagem em que é expresso. contém perguntas que requerem raciocínio em várias etapas, uso de conhecimento adicional comum e de senso comum e compreensão de texto rico. O OpenBookQA é um novo tipo de conjunto de dados de resposta a perguntas modelado após exames de livro aberto para avaliar a compreensão humana de um assunto.
Tamanho do download : 942.34 KiB
Tamanho do conjunto de dados : 1.11 MiB
Cache automático ( documentação ): Sim
Divisões :

Dividir	Exemplos
`'test'`	500
`'train'`	4.957
`'validation'`	500

Exemplos ( tfds.as_dataframe ):

Citação :

@inproceedings{mihaylov-etal-2018-suit,
    title = "Can a Suit of Armor Conduct Electricity? A New Dataset for Open Book Question Answering",
    author = "Mihaylov, Todor  and
      Clark, Peter  and
      Khot, Tushar  and
      Sabharwal, Ashish",
    booktitle = "Proceedings of the 2018 Conference on Empirical Methods in Natural Language Processing",
    month = oct # "-" # nov,
    year = "2018",
    address = "Brussels, Belgium",
    publisher = "Association for Computational Linguistics",
    url = "https://aclanthology.org/D18-1260",
    doi = "10.18653/v1/D18-1260",
    pages = "2381--2391",
}

@inproceedings{khashabi-etal-2020-unifiedqa,
    title = "{UNIFIEDQA}: Crossing Format Boundaries with a Single {QA} System",
    author = "Khashabi, Daniel  and
      Min, Sewon  and
      Khot, Tushar  and
      Sabharwal, Ashish  and
      Tafjord, Oyvind  and
      Clark, Peter  and
      Hajishirzi, Hannaneh",
    booktitle = "Findings of the Association for Computational Linguistics: EMNLP 2020",
    month = nov,
    year = "2020",
    address = "Online",
    publisher = "Association for Computational Linguistics",
    url = "https://aclanthology.org/2020.findings-emnlp.171",
    doi = "10.18653/v1/2020.findings-emnlp.171",
    pages = "1896--1907",
}

Note that each UnifiedQA dataset has its own citation. Please see the source to
see the correct citation for each contained dataset."

unified_qa/openbookqa_dev

Descrição da configuração : O OpenBookQA visa promover a pesquisa em respostas avançadas a perguntas, sondando uma compreensão mais profunda do tópico (com fatos importantes resumidos como um livro aberto, também fornecido com o conjunto de dados) e da linguagem em que é expresso. contém perguntas que requerem raciocínio em várias etapas, uso de conhecimento adicional comum e de senso comum e compreensão de texto rico. O OpenBookQA é um novo tipo de conjunto de dados de resposta a perguntas modelado após exames de livro aberto para avaliar a compreensão humana de um assunto.
Tamanho do download : 942.34 KiB
Tamanho do conjunto de dados : 1.11 MiB
Cache automático ( documentação ): Sim
Divisões :

Dividir	Exemplos
`'test'`	500
`'train'`	4.957
`'validation'`	500

Exemplos ( tfds.as_dataframe ):

Citação :

@inproceedings{mihaylov-etal-2018-suit,
    title = "Can a Suit of Armor Conduct Electricity? A New Dataset for Open Book Question Answering",
    author = "Mihaylov, Todor  and
      Clark, Peter  and
      Khot, Tushar  and
      Sabharwal, Ashish",
    booktitle = "Proceedings of the 2018 Conference on Empirical Methods in Natural Language Processing",
    month = oct # "-" # nov,
    year = "2018",
    address = "Brussels, Belgium",
    publisher = "Association for Computational Linguistics",
    url = "https://aclanthology.org/D18-1260",
    doi = "10.18653/v1/D18-1260",
    pages = "2381--2391",
}

@inproceedings{khashabi-etal-2020-unifiedqa,
    title = "{UNIFIEDQA}: Crossing Format Boundaries with a Single {QA} System",
    author = "Khashabi, Daniel  and
      Min, Sewon  and
      Khot, Tushar  and
      Sabharwal, Ashish  and
      Tafjord, Oyvind  and
      Clark, Peter  and
      Hajishirzi, Hannaneh",
    booktitle = "Findings of the Association for Computational Linguistics: EMNLP 2020",
    month = nov,
    year = "2020",
    address = "Online",
    publisher = "Association for Computational Linguistics",
    url = "https://aclanthology.org/2020.findings-emnlp.171",
    doi = "10.18653/v1/2020.findings-emnlp.171",
    pages = "1896--1907",
}

Note that each UnifiedQA dataset has its own citation. Please see the source to
see the correct citation for each contained dataset."

unified_qa/openbookqa_with_ir

Descrição da configuração : O OpenBookQA visa promover a pesquisa em respostas avançadas a perguntas, sondando uma compreensão mais profunda do tópico (com fatos importantes resumidos como um livro aberto, também fornecido com o conjunto de dados) e da linguagem em que é expresso. contém perguntas que requerem raciocínio em várias etapas, uso de conhecimento adicional comum e de senso comum e compreensão de texto rico. O OpenBookQA é um novo tipo de conjunto de dados de resposta a perguntas modelado após exames de livro aberto para avaliar a compreensão humana de um assunto. Esta versão inclui parágrafos obtidos por meio de um sistema de recuperação de informações como evidência adicional.
Tamanho do download : 6.08 MiB
Tamanho do conjunto de dados : 6.28 MiB
Cache automático ( documentação ): Sim
Divisões :

Dividir	Exemplos
`'test'`	500
`'train'`	4.957
`'validation'`	500

Exemplos ( tfds.as_dataframe ):

Citação :

@inproceedings{mihaylov-etal-2018-suit,
    title = "Can a Suit of Armor Conduct Electricity? A New Dataset for Open Book Question Answering",
    author = "Mihaylov, Todor  and
      Clark, Peter  and
      Khot, Tushar  and
      Sabharwal, Ashish",
    booktitle = "Proceedings of the 2018 Conference on Empirical Methods in Natural Language Processing",
    month = oct # "-" # nov,
    year = "2018",
    address = "Brussels, Belgium",
    publisher = "Association for Computational Linguistics",
    url = "https://aclanthology.org/D18-1260",
    doi = "10.18653/v1/D18-1260",
    pages = "2381--2391",
}

@inproceedings{khashabi-etal-2020-unifiedqa,
    title = "{UNIFIEDQA}: Crossing Format Boundaries with a Single {QA} System",
    author = "Khashabi, Daniel  and
      Min, Sewon  and
      Khot, Tushar  and
      Sabharwal, Ashish  and
      Tafjord, Oyvind  and
      Clark, Peter  and
      Hajishirzi, Hannaneh",
    booktitle = "Findings of the Association for Computational Linguistics: EMNLP 2020",
    month = nov,
    year = "2020",
    address = "Online",
    publisher = "Association for Computational Linguistics",
    url = "https://aclanthology.org/2020.findings-emnlp.171",
    doi = "10.18653/v1/2020.findings-emnlp.171",
    pages = "1896--1907",
}

Note that each UnifiedQA dataset has its own citation. Please see the source to
see the correct citation for each contained dataset."

unified_qa/openbookqa_with_ir_dev

Descrição da configuração : O OpenBookQA visa promover a pesquisa em respostas avançadas a perguntas, sondando uma compreensão mais profunda do tópico (com fatos importantes resumidos como um livro aberto, também fornecido com o conjunto de dados) e da linguagem em que é expresso. contém perguntas que requerem raciocínio em várias etapas, uso de conhecimento adicional comum e de senso comum e compreensão de texto rico. O OpenBookQA é um novo tipo de conjunto de dados de resposta a perguntas modelado após exames de livro aberto para avaliar a compreensão humana de um assunto. Esta versão inclui parágrafos obtidos por meio de um sistema de recuperação de informações como evidência adicional.
Tamanho do download : 6.08 MiB
Tamanho do conjunto de dados : 6.28 MiB
Cache automático ( documentação ): Sim
Divisões :

Dividir	Exemplos
`'test'`	500
`'train'`	4.957
`'validation'`	500

Exemplos ( tfds.as_dataframe ):

Citação :

@inproceedings{mihaylov-etal-2018-suit,
    title = "Can a Suit of Armor Conduct Electricity? A New Dataset for Open Book Question Answering",
    author = "Mihaylov, Todor  and
      Clark, Peter  and
      Khot, Tushar  and
      Sabharwal, Ashish",
    booktitle = "Proceedings of the 2018 Conference on Empirical Methods in Natural Language Processing",
    month = oct # "-" # nov,
    year = "2018",
    address = "Brussels, Belgium",
    publisher = "Association for Computational Linguistics",
    url = "https://aclanthology.org/D18-1260",
    doi = "10.18653/v1/D18-1260",
    pages = "2381--2391",
}

@inproceedings{khashabi-etal-2020-unifiedqa,
    title = "{UNIFIEDQA}: Crossing Format Boundaries with a Single {QA} System",
    author = "Khashabi, Daniel  and
      Min, Sewon  and
      Khot, Tushar  and
      Sabharwal, Ashish  and
      Tafjord, Oyvind  and
      Clark, Peter  and
      Hajishirzi, Hannaneh",
    booktitle = "Findings of the Association for Computational Linguistics: EMNLP 2020",
    month = nov,
    year = "2020",
    address = "Online",
    publisher = "Association for Computational Linguistics",
    url = "https://aclanthology.org/2020.findings-emnlp.171",
    doi = "10.18653/v1/2020.findings-emnlp.171",
    pages = "1896--1907",
}

Note that each UnifiedQA dataset has its own citation. Please see the source to
see the correct citation for each contained dataset."

unified_qa/physical_iqa

Descrição da configuração : este é um conjunto de dados para avaliar o progresso no entendimento do senso comum físico. A tarefa subjacente é a resposta a perguntas de múltipla escolha: dada uma pergunta q e duas soluções possíveis s1, s2, um modelo ou um ser humano deve escolher a solução mais apropriada, da qual exatamente uma é a correta. O conjunto de dados se concentra em situações cotidianas com preferência por soluções atípicas. O conjunto de dados é inspirado em instructables.com, que fornece aos usuários instruções sobre como construir, criar, assar ou manipular objetos usando materiais do dia a dia. Os anotadores são solicitados a fornecer perturbações semânticas ou abordagens alternativas que sejam sintática e topicamente semelhantes para garantir que o conhecimento físico seja direcionado. O conjunto de dados é ainda mais limpo de artefatos básicos usando o algoritmo AFLite.
Tamanho do download : 6.01 MiB
Tamanho do conjunto de dados : 6.59 MiB
Cache automático ( documentação ): Sim
Divisões :

Dividir	Exemplos
`'train'`	16.113
`'validation'`	1.838

Exemplos ( tfds.as_dataframe ):

Citação :

@inproceedings{bisk2020piqa,
    title={Piqa: Reasoning about physical commonsense in natural language},
    author={Bisk, Yonatan and Zellers, Rowan and Gao, Jianfeng and Choi, Yejin and others},
    booktitle={Proceedings of the AAAI Conference on Artificial Intelligence},
    volume={34},
    number={05},
    pages={7432--7439},
    year={2020}
}

@inproceedings{khashabi-etal-2020-unifiedqa,
    title = "{UNIFIEDQA}: Crossing Format Boundaries with a Single {QA} System",
    author = "Khashabi, Daniel  and
      Min, Sewon  and
      Khot, Tushar  and
      Sabharwal, Ashish  and
      Tafjord, Oyvind  and
      Clark, Peter  and
      Hajishirzi, Hannaneh",
    booktitle = "Findings of the Association for Computational Linguistics: EMNLP 2020",
    month = nov,
    year = "2020",
    address = "Online",
    publisher = "Association for Computational Linguistics",
    url = "https://aclanthology.org/2020.findings-emnlp.171",
    doi = "10.18653/v1/2020.findings-emnlp.171",
    pages = "1896--1907",
}

Note that each UnifiedQA dataset has its own citation. Please see the source to
see the correct citation for each contained dataset."

unified_qa/qasc

Descrição da configuração : QASC é um conjunto de dados de resposta a perguntas com foco na composição de frases. Consiste em perguntas de múltipla escolha de 8 vias sobre ciências do ensino fundamental e vem com um corpus de 17 milhões de sentenças.
Tamanho do download : 1.75 MiB
Tamanho do conjunto de dados : 2.09 MiB
Cache automático ( documentação ): Sim
Divisões :

Dividir	Exemplos
`'test'`	920
`'train'`	8.134
`'validation'`	926

Exemplos ( tfds.as_dataframe ):

Citação :

@inproceedings{khot2020qasc,
    title={Qasc: A dataset for question answering via sentence composition},
    author={Khot, Tushar and Clark, Peter and Guerquin, Michal and Jansen, Peter and Sabharwal, Ashish},
    booktitle={Proceedings of the AAAI Conference on Artificial Intelligence},
    volume={34},
    number={05},
    pages={8082--8090},
    year={2020}
}

@inproceedings{khashabi-etal-2020-unifiedqa,
    title = "{UNIFIEDQA}: Crossing Format Boundaries with a Single {QA} System",
    author = "Khashabi, Daniel  and
      Min, Sewon  and
      Khot, Tushar  and
      Sabharwal, Ashish  and
      Tafjord, Oyvind  and
      Clark, Peter  and
      Hajishirzi, Hannaneh",
    booktitle = "Findings of the Association for Computational Linguistics: EMNLP 2020",
    month = nov,
    year = "2020",
    address = "Online",
    publisher = "Association for Computational Linguistics",
    url = "https://aclanthology.org/2020.findings-emnlp.171",
    doi = "10.18653/v1/2020.findings-emnlp.171",
    pages = "1896--1907",
}

Note that each UnifiedQA dataset has its own citation. Please see the source to
see the correct citation for each contained dataset."

unified_qa/qasc_test

Descrição da configuração : QASC é um conjunto de dados de resposta a perguntas com foco na composição de frases. Consiste em perguntas de múltipla escolha de 8 vias sobre ciências do ensino fundamental e vem com um corpus de 17 milhões de sentenças.
Tamanho do download : 1.75 MiB
Tamanho do conjunto de dados : 2.09 MiB
Cache automático ( documentação ): Sim
Divisões :

Dividir	Exemplos
`'test'`	920
`'train'`	8.134
`'validation'`	926

Exemplos ( tfds.as_dataframe ):

Citação :

@inproceedings{khot2020qasc,
    title={Qasc: A dataset for question answering via sentence composition},
    author={Khot, Tushar and Clark, Peter and Guerquin, Michal and Jansen, Peter and Sabharwal, Ashish},
    booktitle={Proceedings of the AAAI Conference on Artificial Intelligence},
    volume={34},
    number={05},
    pages={8082--8090},
    year={2020}
}

@inproceedings{khashabi-etal-2020-unifiedqa,
    title = "{UNIFIEDQA}: Crossing Format Boundaries with a Single {QA} System",
    author = "Khashabi, Daniel  and
      Min, Sewon  and
      Khot, Tushar  and
      Sabharwal, Ashish  and
      Tafjord, Oyvind  and
      Clark, Peter  and
      Hajishirzi, Hannaneh",
    booktitle = "Findings of the Association for Computational Linguistics: EMNLP 2020",
    month = nov,
    year = "2020",
    address = "Online",
    publisher = "Association for Computational Linguistics",
    url = "https://aclanthology.org/2020.findings-emnlp.171",
    doi = "10.18653/v1/2020.findings-emnlp.171",
    pages = "1896--1907",
}

Note that each UnifiedQA dataset has its own citation. Please see the source to
see the correct citation for each contained dataset."

unified_qa/qasc_with_ir

Descrição da configuração : QASC é um conjunto de dados de resposta a perguntas com foco na composição de frases. Consiste em perguntas de múltipla escolha de 8 vias sobre ciências do ensino fundamental e vem com um corpus de 17 milhões de sentenças. Esta versão inclui parágrafos obtidos por meio de um sistema de recuperação de informações como evidência adicional.
Tamanho do download : 16.95 MiB
Tamanho do conjunto de dados : 17.30 MiB
Cache automático ( documentação ): Sim
Divisões :

Dividir	Exemplos
`'test'`	920
`'train'`	8.134
`'validation'`	926

Exemplos ( tfds.as_dataframe ):

Citação :

@inproceedings{khot2020qasc,
    title={Qasc: A dataset for question answering via sentence composition},
    author={Khot, Tushar and Clark, Peter and Guerquin, Michal and Jansen, Peter and Sabharwal, Ashish},
    booktitle={Proceedings of the AAAI Conference on Artificial Intelligence},
    volume={34},
    number={05},
    pages={8082--8090},
    year={2020}
}

@inproceedings{khashabi-etal-2020-unifiedqa,
    title = "{UNIFIEDQA}: Crossing Format Boundaries with a Single {QA} System",
    author = "Khashabi, Daniel  and
      Min, Sewon  and
      Khot, Tushar  and
      Sabharwal, Ashish  and
      Tafjord, Oyvind  and
      Clark, Peter  and
      Hajishirzi, Hannaneh",
    booktitle = "Findings of the Association for Computational Linguistics: EMNLP 2020",
    month = nov,
    year = "2020",
    address = "Online",
    publisher = "Association for Computational Linguistics",
    url = "https://aclanthology.org/2020.findings-emnlp.171",
    doi = "10.18653/v1/2020.findings-emnlp.171",
    pages = "1896--1907",
}

Note that each UnifiedQA dataset has its own citation. Please see the source to
see the correct citation for each contained dataset."

unified_qa/qasc_with_ir_test

Descrição da configuração : QASC é um conjunto de dados de resposta a perguntas com foco na composição de frases. Consiste em perguntas de múltipla escolha de 8 vias sobre ciências do ensino fundamental e vem com um corpus de 17 milhões de sentenças. Esta versão inclui parágrafos obtidos por meio de um sistema de recuperação de informações como evidência adicional.
Tamanho do download : 16.95 MiB
Tamanho do conjunto de dados : 17.30 MiB
Cache automático ( documentação ): Sim
Divisões :

Dividir	Exemplos
`'test'`	920
`'train'`	8.134
`'validation'`	926

Exemplos ( tfds.as_dataframe ):

Citação :

@inproceedings{khot2020qasc,
    title={Qasc: A dataset for question answering via sentence composition},
    author={Khot, Tushar and Clark, Peter and Guerquin, Michal and Jansen, Peter and Sabharwal, Ashish},
    booktitle={Proceedings of the AAAI Conference on Artificial Intelligence},
    volume={34},
    number={05},
    pages={8082--8090},
    year={2020}
}

@inproceedings{khashabi-etal-2020-unifiedqa,
    title = "{UNIFIEDQA}: Crossing Format Boundaries with a Single {QA} System",
    author = "Khashabi, Daniel  and
      Min, Sewon  and
      Khot, Tushar  and
      Sabharwal, Ashish  and
      Tafjord, Oyvind  and
      Clark, Peter  and
      Hajishirzi, Hannaneh",
    booktitle = "Findings of the Association for Computational Linguistics: EMNLP 2020",
    month = nov,
    year = "2020",
    address = "Online",
    publisher = "Association for Computational Linguistics",
    url = "https://aclanthology.org/2020.findings-emnlp.171",
    doi = "10.18653/v1/2020.findings-emnlp.171",
    pages = "1896--1907",
}

Note that each UnifiedQA dataset has its own citation. Please see the source to
see the correct citation for each contained dataset."

unified_qa/quoref

Descrição da configuração : Este conjunto de dados testa a capacidade de raciocínio correferencial dos sistemas de compreensão de leitura. Neste benchmark de seleção de extensão contendo perguntas sobre parágrafos da Wikipédia, um sistema deve resolver correferências rígidas antes de selecionar a(s) extensão(ões) apropriada(s) nos parágrafos para responder às perguntas.
Tamanho do download : 51.43 MiB
Tamanho do conjunto de dados : 52.29 MiB
Cache automático ( documentação ): Sim
Divisões :

Dividir	Exemplos
`'train'`	22.265
`'validation'`	2.768

Exemplos ( tfds.as_dataframe ):

Citação :

@inproceedings{dasigi-etal-2019-quoref,
    title = "{Q}uoref: A Reading Comprehension Dataset with Questions Requiring Coreferential Reasoning",
    author = "Dasigi, Pradeep  and
      Liu, Nelson F.  and
      Marasovi{'c}, Ana  and
      Smith, Noah A.  and
      Gardner, Matt",
    booktitle = "Proceedings of the 2019 Conference on Empirical Methods in Natural Language Processing and the 9th International Joint Conference on Natural Language Processing (EMNLP-IJCNLP)",
    month = nov,
    year = "2019",
    address = "Hong Kong, China",
    publisher = "Association for Computational Linguistics",
    url = "https://aclanthology.org/D19-1606",
    doi = "10.18653/v1/D19-1606",
    pages = "5925--5932",
}

@inproceedings{khashabi-etal-2020-unifiedqa,
    title = "{UNIFIEDQA}: Crossing Format Boundaries with a Single {QA} System",
    author = "Khashabi, Daniel  and
      Min, Sewon  and
      Khot, Tushar  and
      Sabharwal, Ashish  and
      Tafjord, Oyvind  and
      Clark, Peter  and
      Hajishirzi, Hannaneh",
    booktitle = "Findings of the Association for Computational Linguistics: EMNLP 2020",
    month = nov,
    year = "2020",
    address = "Online",
    publisher = "Association for Computational Linguistics",
    url = "https://aclanthology.org/2020.findings-emnlp.171",
    doi = "10.18653/v1/2020.findings-emnlp.171",
    pages = "1896--1907",
}

Note that each UnifiedQA dataset has its own citation. Please see the source to
see the correct citation for each contained dataset."

unified_qa/race_string

Descrição da configuração : Race é um conjunto de dados de compreensão de leitura em grande escala. O conjunto de dados é coletado de exames de inglês na China, que são projetados para alunos do ensino fundamental e médio. O conjunto de dados pode ser servido como conjuntos de treinamento e teste para compreensão da máquina.
Tamanho do download : 167.97 MiB
Tamanho do conjunto de dados : 171.23 MiB
Cache automático ( documentação ): Sim (teste, validação), somente quando shuffle_files=False (train)
Divisões :

Dividir	Exemplos
`'test'`	4.934
`'train'`	87.863
`'validation'`	4.887

Exemplos ( tfds.as_dataframe ):

Citação :

@inproceedings{lai-etal-2017-race,
    title = "{RACE}: Large-scale {R}e{A}ding Comprehension Dataset From Examinations",
    author = "Lai, Guokun  and
      Xie, Qizhe  and
      Liu, Hanxiao  and
      Yang, Yiming  and
      Hovy, Eduard",
    booktitle = "Proceedings of the 2017 Conference on Empirical Methods in Natural Language Processing",
    month = sep,
    year = "2017",
    address = "Copenhagen, Denmark",
    publisher = "Association for Computational Linguistics",
    url = "https://aclanthology.org/D17-1082",
    doi = "10.18653/v1/D17-1082",
    pages = "785--794",
}

@inproceedings{khashabi-etal-2020-unifiedqa,
    title = "{UNIFIEDQA}: Crossing Format Boundaries with a Single {QA} System",
    author = "Khashabi, Daniel  and
      Min, Sewon  and
      Khot, Tushar  and
      Sabharwal, Ashish  and
      Tafjord, Oyvind  and
      Clark, Peter  and
      Hajishirzi, Hannaneh",
    booktitle = "Findings of the Association for Computational Linguistics: EMNLP 2020",
    month = nov,
    year = "2020",
    address = "Online",
    publisher = "Association for Computational Linguistics",
    url = "https://aclanthology.org/2020.findings-emnlp.171",
    doi = "10.18653/v1/2020.findings-emnlp.171",
    pages = "1896--1907",
}

Note that each UnifiedQA dataset has its own citation. Please see the source to
see the correct citation for each contained dataset."

unified_qa/race_string_dev

Descrição da configuração : Race é um conjunto de dados de compreensão de leitura em grande escala. O conjunto de dados é coletado de exames de inglês na China, que são projetados para alunos do ensino fundamental e médio. O conjunto de dados pode ser servido como conjuntos de treinamento e teste para compreensão da máquina.
Tamanho do download : 167.97 MiB
Tamanho do conjunto de dados : 171.23 MiB
Cache automático ( documentação ): Sim (teste, validação), somente quando shuffle_files=False (train)
Divisões :

Dividir	Exemplos
`'test'`	4.934
`'train'`	87.863
`'validation'`	4.887

Exemplos ( tfds.as_dataframe ):

Citação :

@inproceedings{lai-etal-2017-race,
    title = "{RACE}: Large-scale {R}e{A}ding Comprehension Dataset From Examinations",
    author = "Lai, Guokun  and
      Xie, Qizhe  and
      Liu, Hanxiao  and
      Yang, Yiming  and
      Hovy, Eduard",
    booktitle = "Proceedings of the 2017 Conference on Empirical Methods in Natural Language Processing",
    month = sep,
    year = "2017",
    address = "Copenhagen, Denmark",
    publisher = "Association for Computational Linguistics",
    url = "https://aclanthology.org/D17-1082",
    doi = "10.18653/v1/D17-1082",
    pages = "785--794",
}

@inproceedings{khashabi-etal-2020-unifiedqa,
    title = "{UNIFIEDQA}: Crossing Format Boundaries with a Single {QA} System",
    author = "Khashabi, Daniel  and
      Min, Sewon  and
      Khot, Tushar  and
      Sabharwal, Ashish  and
      Tafjord, Oyvind  and
      Clark, Peter  and
      Hajishirzi, Hannaneh",
    booktitle = "Findings of the Association for Computational Linguistics: EMNLP 2020",
    month = nov,
    year = "2020",
    address = "Online",
    publisher = "Association for Computational Linguistics",
    url = "https://aclanthology.org/2020.findings-emnlp.171",
    doi = "10.18653/v1/2020.findings-emnlp.171",
    pages = "1896--1907",
}

Note that each UnifiedQA dataset has its own citation. Please see the source to
see the correct citation for each contained dataset."

unified_qa/ropes

Descrição da configuração : esse conjunto de dados testa a capacidade de um sistema de aplicar o conhecimento de uma passagem de texto a uma nova situação. A um sistema é apresentada uma passagem de fundo contendo uma relação causal ou qualitativa (por exemplo, "animais polinizadores aumentam a eficiência da fertilização em flores"), uma situação nova que usa esse pano de fundo e questões que requerem raciocínio sobre os efeitos das relações em a passagem de fundo no contexto da situação.
Tamanho do download : 12.91 MiB
Tamanho do conjunto de dados : 13.35 MiB
Cache automático ( documentação ): Sim
Divisões :

Dividir	Exemplos
`'train'`	10.924
`'validation'`	1.688

Exemplos ( tfds.as_dataframe ):

Citação :

@inproceedings{lin-etal-2019-reasoning,
    title = "Reasoning Over Paragraph Effects in Situations",
    author = "Lin, Kevin  and
      Tafjord, Oyvind  and
      Clark, Peter  and
      Gardner, Matt",
    booktitle = "Proceedings of the 2nd Workshop on Machine Reading for Question Answering",
    month = nov,
    year = "2019",
    address = "Hong Kong, China",
    publisher = "Association for Computational Linguistics",
    url = "https://aclanthology.org/D19-5808",
    doi = "10.18653/v1/D19-5808",
    pages = "58--62",
}

@inproceedings{khashabi-etal-2020-unifiedqa,
    title = "{UNIFIEDQA}: Crossing Format Boundaries with a Single {QA} System",
    author = "Khashabi, Daniel  and
      Min, Sewon  and
      Khot, Tushar  and
      Sabharwal, Ashish  and
      Tafjord, Oyvind  and
      Clark, Peter  and
      Hajishirzi, Hannaneh",
    booktitle = "Findings of the Association for Computational Linguistics: EMNLP 2020",
    month = nov,
    year = "2020",
    address = "Online",
    publisher = "Association for Computational Linguistics",
    url = "https://aclanthology.org/2020.findings-emnlp.171",
    doi = "10.18653/v1/2020.findings-emnlp.171",
    pages = "1896--1907",
}

Note that each UnifiedQA dataset has its own citation. Please see the source to
see the correct citation for each contained dataset."

unified_qa/social_iqa

Descrição da configuração : Este é um benchmark em larga escala para raciocínio de bom senso sobre situações sociais. Social IQa contém perguntas de múltipla escolha para sondar a inteligência emocional e social em uma variedade de situações cotidianas. Por meio do crowdsourcing, são coletadas perguntas de senso comum, juntamente com respostas corretas e incorretas sobre interações sociais, usando uma nova estrutura que atenua artefatos estilísticos em respostas incorretas, pedindo aos trabalhadores que forneçam a resposta certa para uma pergunta diferente, mas relacionada.
Tamanho do download : 7.08 MiB
Tamanho do conjunto de dados : 8.22 MiB
Cache automático ( documentação ): Sim
Divisões :

Dividir	Exemplos
`'train'`	33.410
`'validation'`	1.954

Exemplos ( tfds.as_dataframe ):

Citação :

@inproceedings{sap-etal-2019-social,
    title = "Social {IQ}a: Commonsense Reasoning about Social Interactions",
    author = "Sap, Maarten  and
      Rashkin, Hannah  and
      Chen, Derek  and
      Le Bras, Ronan  and
      Choi, Yejin",
    booktitle = "Proceedings of the 2019 Conference on Empirical Methods in Natural Language Processing and the 9th International Joint Conference on Natural Language Processing (EMNLP-IJCNLP)",
    month = nov,
    year = "2019",
    address = "Hong Kong, China",
    publisher = "Association for Computational Linguistics",
    url = "https://aclanthology.org/D19-1454",
    doi = "10.18653/v1/D19-1454",
    pages = "4463--4473",
}

@inproceedings{khashabi-etal-2020-unifiedqa,
    title = "{UNIFIEDQA}: Crossing Format Boundaries with a Single {QA} System",
    author = "Khashabi, Daniel  and
      Min, Sewon  and
      Khot, Tushar  and
      Sabharwal, Ashish  and
      Tafjord, Oyvind  and
      Clark, Peter  and
      Hajishirzi, Hannaneh",
    booktitle = "Findings of the Association for Computational Linguistics: EMNLP 2020",
    month = nov,
    year = "2020",
    address = "Online",
    publisher = "Association for Computational Linguistics",
    url = "https://aclanthology.org/2020.findings-emnlp.171",
    doi = "10.18653/v1/2020.findings-emnlp.171",
    pages = "1896--1907",
}

Note that each UnifiedQA dataset has its own citation. Please see the source to
see the correct citation for each contained dataset."

unified_qa/squad1_1

Descrição da configuração : Este é um conjunto de dados de compreensão de leitura que consiste em perguntas feitas por crowdworkers em um conjunto de artigos da Wikipédia, onde a resposta para cada pergunta é um segmento de texto da passagem de leitura correspondente.
Tamanho do download : 80.62 MiB
Tamanho do conjunto de dados : 83.99 MiB
Cache automático ( documentação ): Sim
Divisões :

Dividir	Exemplos
`'train'`	87.514
`'validation'`	10.570

Exemplos ( tfds.as_dataframe ):

Citação :

@inproceedings{rajpurkar-etal-2016-squad,
    title = "{SQ}u{AD}: 100,000+ Questions for Machine Comprehension of Text",
    author = "Rajpurkar, Pranav  and
      Zhang, Jian  and
      Lopyrev, Konstantin  and
      Liang, Percy",
    booktitle = "Proceedings of the 2016 Conference on Empirical Methods in Natural Language Processing",
    month = nov,
    year = "2016",
    address = "Austin, Texas",
    publisher = "Association for Computational Linguistics",
    url = "https://aclanthology.org/D16-1264",
    doi = "10.18653/v1/D16-1264",
    pages = "2383--2392",
}

@inproceedings{khashabi-etal-2020-unifiedqa,
    title = "{UNIFIEDQA}: Crossing Format Boundaries with a Single {QA} System",
    author = "Khashabi, Daniel  and
      Min, Sewon  and
      Khot, Tushar  and
      Sabharwal, Ashish  and
      Tafjord, Oyvind  and
      Clark, Peter  and
      Hajishirzi, Hannaneh",
    booktitle = "Findings of the Association for Computational Linguistics: EMNLP 2020",
    month = nov,
    year = "2020",
    address = "Online",
    publisher = "Association for Computational Linguistics",
    url = "https://aclanthology.org/2020.findings-emnlp.171",
    doi = "10.18653/v1/2020.findings-emnlp.171",
    pages = "1896--1907",
}

Note that each UnifiedQA dataset has its own citation. Please see the source to
see the correct citation for each contained dataset."

unified_qa/squad2

Descrição da configuração : este conjunto de dados combina o conjunto de dados original de Stanford Question Answering Dataset (SQuAD) com perguntas sem resposta escritas adversariamente por crowdworkers para parecerem semelhantes às que podem ser respondidas.
Tamanho do download : 116.56 MiB
Tamanho do conjunto de dados : 121.43 MiB
Cache automático ( documentação ): Sim
Divisões :

Dividir	Exemplos
`'train'`	130.149
`'validation'`	11.873

Exemplos ( tfds.as_dataframe ):

Citação :

@inproceedings{rajpurkar-etal-2018-know,
    title = "Know What You Don{'}t Know: Unanswerable Questions for {SQ}u{AD}",
    author = "Rajpurkar, Pranav  and
      Jia, Robin  and
      Liang, Percy",
    booktitle = "Proceedings of the 56th Annual Meeting of the Association for Computational Linguistics (Volume 2: Short Papers)",
    month = jul,
    year = "2018",
    address = "Melbourne, Australia",
    publisher = "Association for Computational Linguistics",
    url = "https://aclanthology.org/P18-2124",
    doi = "10.18653/v1/P18-2124",
    pages = "784--789",
}

@inproceedings{khashabi-etal-2020-unifiedqa,
    title = "{UNIFIEDQA}: Crossing Format Boundaries with a Single {QA} System",
    author = "Khashabi, Daniel  and
      Min, Sewon  and
      Khot, Tushar  and
      Sabharwal, Ashish  and
      Tafjord, Oyvind  and
      Clark, Peter  and
      Hajishirzi, Hannaneh",
    booktitle = "Findings of the Association for Computational Linguistics: EMNLP 2020",
    month = nov,
    year = "2020",
    address = "Online",
    publisher = "Association for Computational Linguistics",
    url = "https://aclanthology.org/2020.findings-emnlp.171",
    doi = "10.18653/v1/2020.findings-emnlp.171",
    pages = "1896--1907",
}

Note that each UnifiedQA dataset has its own citation. Please see the source to
see the correct citation for each contained dataset."

unified_qa/winogrande_l

Descrição da configuração : este conjunto de dados é inspirado no design original do Winograd Schema Challenge, mas ajustado para melhorar a escala e a dureza do conjunto de dados. As principais etapas da construção do conjunto de dados consistem em (1) um procedimento de crowdsourcing cuidadosamente projetado, seguido por (2) redução sistemática de viés usando um novo algoritmo AfLite que generaliza associações de palavras detectáveis por humanos para associações de incorporação detectáveis por máquina. Conjuntos de treinamento com tamanhos diferentes são fornecidos. Este conjunto corresponde ao tamanho l .
Tamanho do download : 1.49 MiB
Tamanho do conjunto de dados : 1.83 MiB
Cache automático ( documentação ): Sim
Divisões :

Dividir	Exemplos
`'train'`	10.234
`'validation'`	1.267

Exemplos ( tfds.as_dataframe ):

Citação :

@inproceedings{sakaguchi2020winogrande,
  title={Winogrande: An adversarial winograd schema challenge at scale},
  author={Sakaguchi, Keisuke and Le Bras, Ronan and Bhagavatula, Chandra and Choi, Yejin},
  booktitle={Proceedings of the AAAI Conference on Artificial Intelligence},
  volume={34},
  number={05},
  pages={8732--8740},
  year={2020}
}

@inproceedings{khashabi-etal-2020-unifiedqa,
    title = "{UNIFIEDQA}: Crossing Format Boundaries with a Single {QA} System",
    author = "Khashabi, Daniel  and
      Min, Sewon  and
      Khot, Tushar  and
      Sabharwal, Ashish  and
      Tafjord, Oyvind  and
      Clark, Peter  and
      Hajishirzi, Hannaneh",
    booktitle = "Findings of the Association for Computational Linguistics: EMNLP 2020",
    month = nov,
    year = "2020",
    address = "Online",
    publisher = "Association for Computational Linguistics",
    url = "https://aclanthology.org/2020.findings-emnlp.171",
    doi = "10.18653/v1/2020.findings-emnlp.171",
    pages = "1896--1907",
}

Note that each UnifiedQA dataset has its own citation. Please see the source to
see the correct citation for each contained dataset."

unified_qa/winogrande_m

Descrição da configuração : este conjunto de dados é inspirado no design original do Winograd Schema Challenge, mas ajustado para melhorar a escala e a dureza do conjunto de dados. As principais etapas da construção do conjunto de dados consistem em (1) um procedimento de crowdsourcing cuidadosamente projetado, seguido por (2) redução sistemática de viés usando um novo algoritmo AfLite que generaliza associações de palavras detectáveis por humanos para associações de incorporação detectáveis por máquina. Conjuntos de treinamento com tamanhos diferentes são fornecidos. Este conjunto corresponde ao tamanho m .
Tamanho do download : 507.46 KiB
Tamanho do conjunto de dados : 623.15 KiB
Cache automático ( documentação ): Sim
Divisões :

Dividir	Exemplos
`'train'`	2.558
`'validation'`	1.267

Exemplos ( tfds.as_dataframe ):

Citação :

@inproceedings{sakaguchi2020winogrande,
  title={Winogrande: An adversarial winograd schema challenge at scale},
  author={Sakaguchi, Keisuke and Le Bras, Ronan and Bhagavatula, Chandra and Choi, Yejin},
  booktitle={Proceedings of the AAAI Conference on Artificial Intelligence},
  volume={34},
  number={05},
  pages={8732--8740},
  year={2020}
}

@inproceedings{khashabi-etal-2020-unifiedqa,
    title = "{UNIFIEDQA}: Crossing Format Boundaries with a Single {QA} System",
    author = "Khashabi, Daniel  and
      Min, Sewon  and
      Khot, Tushar  and
      Sabharwal, Ashish  and
      Tafjord, Oyvind  and
      Clark, Peter  and
      Hajishirzi, Hannaneh",
    booktitle = "Findings of the Association for Computational Linguistics: EMNLP 2020",
    month = nov,
    year = "2020",
    address = "Online",
    publisher = "Association for Computational Linguistics",
    url = "https://aclanthology.org/2020.findings-emnlp.171",
    doi = "10.18653/v1/2020.findings-emnlp.171",
    pages = "1896--1907",
}

Note that each UnifiedQA dataset has its own citation. Please see the source to
see the correct citation for each contained dataset."

unified_qa/winogrande_s

Descrição da configuração : este conjunto de dados é inspirado no design original do Winograd Schema Challenge, mas ajustado para melhorar a escala e a dureza do conjunto de dados. As principais etapas da construção do conjunto de dados consistem em (1) um procedimento de crowdsourcing cuidadosamente projetado, seguido por (2) redução sistemática de viés usando um novo algoritmo AfLite que generaliza associações de palavras detectáveis por humanos para associações de incorporação detectáveis por máquina. Conjuntos de treinamento com tamanhos diferentes são fornecidos. Este conjunto corresponde ao tamanho s .
Tamanho do download : 479.24 KiB
Tamanho do conjunto de dados : 590.47 KiB
Cache automático ( documentação ): Sim
Divisões :

Dividir	Exemplos
`'test'`	1.767
`'train'`	640
`'validation'`	1.267

Exemplos ( tfds.as_dataframe ):

Citação :

@inproceedings{sakaguchi2020winogrande,
  title={Winogrande: An adversarial winograd schema challenge at scale},
  author={Sakaguchi, Keisuke and Le Bras, Ronan and Bhagavatula, Chandra and Choi, Yejin},
  booktitle={Proceedings of the AAAI Conference on Artificial Intelligence},
  volume={34},
  number={05},
  pages={8732--8740},
  year={2020}
}

@inproceedings{khashabi-etal-2020-unifiedqa,
    title = "{UNIFIEDQA}: Crossing Format Boundaries with a Single {QA} System",
    author = "Khashabi, Daniel  and
      Min, Sewon  and
      Khot, Tushar  and
      Sabharwal, Ashish  and
      Tafjord, Oyvind  and
      Clark, Peter  and
      Hajishirzi, Hannaneh",
    booktitle = "Findings of the Association for Computational Linguistics: EMNLP 2020",
    month = nov,
    year = "2020",
    address = "Online",
    publisher = "Association for Computational Linguistics",
    url = "https://aclanthology.org/2020.findings-emnlp.171",
    doi = "10.18653/v1/2020.findings-emnlp.171",
    pages = "1896--1907",
}

Note that each UnifiedQA dataset has its own citation. Please see the source to
see the correct citation for each contained dataset."