- Descrição :
O BEIR é um benchmark heterogêneo contendo diversas tarefas de RI. Ele também fornece uma estrutura comum e fácil para avaliação de seus modelos de recuperação baseados em NLP dentro do benchmark.
Documentação Adicional : Explore em Papers With Code
Página inicial : https://github.com/beir-cellar/beir
Código -fonte:
tfds.datasets.beir.Builder
Versões :
-
1.0.0
(padrão): versão inicial.
-
Estrutura de recursos :
FeaturesDict({
'passage': Text(shape=(), dtype=string),
'passage_id': Text(shape=(), dtype=string),
'passage_metadata': Text(shape=(), dtype=string),
'query': Text(shape=(), dtype=string),
'query_id': Text(shape=(), dtype=string),
'query_metadata': Text(shape=(), dtype=string),
'score': float32,
})
- Documentação do recurso:
Característica | Classe | Forma | Tipo D | Descrição |
---|---|---|---|---|
RecursosDict | ||||
passagem | Texto | corda | ||
id_da_passagem | Texto | corda | ||
passage_metadata | Texto | corda | ||
consulta | Texto | corda | ||
query_id | Texto | corda | ||
query_metadata | Texto | corda | ||
pontuação | tensor | float32 |
Chaves supervisionadas (Consulte
as_supervised
doc ):None
Figura ( tfds.show_examples ): Não suportado.
Citação :
@inproceedings{
thakur2021beir,
title={ {BEIR}: A Heterogeneous Benchmark for Zero-shot Evaluation of Information Retrieval Models},
author={Nandan Thakur and Nils Reimers and Andreas R{"u}ckl{'e} and Abhishek Srivastava and Iryna Gurevych},
booktitle={Thirty-fifth Conference on Neural Information Processing Systems Datasets and Benchmarks Track (Round 2)},
year={2021},
url={https://openreview.net/forum?id=wCu6T5xFjeJ}
}
beir/msmarco (configuração padrão)
Tamanho do download :
1.01 GiB
Tamanho do conjunto de dados :
4.53 GiB
Armazenado em cache automaticamente ( documentação ): Não
Divisões :
Dividir | Exemplos |
---|---|
'passage' | 8.841.823 |
'query' | 509.962 |
'test' | 9.139 |
'train' | 516.472 |
'validation' | 7.433 |
- Exemplos ( tfds.as_dataframe ):
beir/trec_covid
Tamanho do download :
70.45 MiB
Tamanho do conjunto de dados :
292.04 MiB
Armazenado em cache automaticamente ( documentação ): Não
Divisões :
Dividir | Exemplos |
---|---|
'passage' | 171.332 |
'query' | 50 |
'test' | 35.480 |
- Exemplos ( tfds.as_dataframe ):
beir/nfcorpus
Tamanho do download :
2.34 MiB
Tamanho do conjunto de dados :
24.94 MiB
Cache automático ( documentação ): Sim
Divisões :
Dividir | Exemplos |
---|---|
'passage' | 3.633 |
'query' | 3.237 |
'test' | 3.128 |
'train' | 3.588 |
'validation' | 3.119 |
- Exemplos ( tfds.as_dataframe ):
beir/nq
Tamanho do download :
475.22 MiB
Tamanho do conjunto de dados :
1.66 GiB
Armazenado em cache automaticamente ( documentação ): Não
Divisões :
Dividir | Exemplos |
---|---|
'passage' | 2.681.468 |
'query' | 3.452 |
'test' | 4.201 |
- Exemplos ( tfds.as_dataframe ):
beir/hotpotqa
Tamanho do download :
623.73 MiB
Tamanho do conjunto de dados :
2.64 GiB
Armazenado em cache automaticamente ( documentação ): Não
Divisões :
Dividir | Exemplos |
---|---|
'passage' | 5.233.329 |
'query' | 97.852 |
'test' | 13.783 |
'train' | 101.307 |
'validation' | 10.335 |
- Exemplos ( tfds.as_dataframe ):
beir/fiqa
Tamanho do download :
17.12 MiB
Tamanho do conjunto de dados :
73.39 MiB
Cache automático ( documentação ): Sim
Divisões :
Dividir | Exemplos |
---|---|
'passage' | 57.638 |
'query' | 6.648 |
'test' | 1.706 |
'train' | 14.166 |
'validation' | 1.238 |
- Exemplos ( tfds.as_dataframe ):
beir/arguana
Tamanho do download :
3.60 MiB
Tamanho do conjunto de dados :
15.08 MiB
Cache automático ( documentação ): Sim
Divisões :
Dividir | Exemplos |
---|---|
'passage' | 8.674 |
'query' | 1.406 |
'test' | 1.401 |
- Exemplos ( tfds.as_dataframe ):
beir/webis_touche2020
Tamanho do download :
216.61 MiB
Tamanho do conjunto de dados :
747.57 MiB
Armazenado em cache automaticamente ( documentação ): Não
Divisões :
Dividir | Exemplos |
---|---|
'passage' | 382.545 |
'query' | 49 |
'test' | 2.099 |
- Exemplos ( tfds.as_dataframe ):
beir/cqadupstack.android
Tamanho do download :
4.98 GiB
Tamanho do conjunto de dados :
883.49 MiB
Armazenado em cache automaticamente ( documentação ): Não
Divisões :
Dividir | Exemplos |
---|---|
'passage' | 22.998 |
'query' | 699 |
'test' | 1.696 |
- Exemplos ( tfds.as_dataframe ):
beir/cqadupstack.english
Tamanho do download :
4.98 GiB
Tamanho do conjunto de dados :
3.78 GiB
Armazenado em cache automaticamente ( documentação ): Não
Divisões :
Dividir | Exemplos |
---|---|
'passage' | 40.221 |
'query' | 1.570 |
'test' | 3.765 |
- Exemplos ( tfds.as_dataframe ):
beir/cqadupstack.gaming
Tamanho do download :
4.98 GiB
Tamanho do conjunto de dados :
2.64 GiB
Armazenado em cache automaticamente ( documentação ): Não
Divisões :
Dividir | Exemplos |
---|---|
'passage' | 45.301 |
'query' | 1.595 |
'test' | 2.263 |
- Exemplos ( tfds.as_dataframe ):
beir/cqadupstack.gis
Tamanho do download :
4.98 GiB
Tamanho do conjunto de dados :
1.47 GiB
Armazenado em cache automaticamente ( documentação ): Não
Divisões :
Dividir | Exemplos |
---|---|
'passage' | 37.637 |
'query' | 885 |
'test' | 1.114 |
- Exemplos ( tfds.as_dataframe ):
beir/cqadupstack.mathematica
Tamanho do download :
4.98 GiB
Tamanho do conjunto de dados :
1.58 GiB
Armazenado em cache automaticamente ( documentação ): Não
Divisões :
Dividir | Exemplos |
---|---|
'passage' | 16.705 |
'query' | 804 |
'test' | 1.358 |
- Exemplos ( tfds.as_dataframe ):
beir/cqadupstack.physics
Tamanho do download :
4.98 GiB
Tamanho do conjunto de dados :
2.02 GiB
Armazenado em cache automaticamente ( documentação ): Não
Divisões :
Dividir | Exemplos |
---|---|
'passage' | 38.316 |
'query' | 1.039 |
'test' | 1.933 |
- Exemplos ( tfds.as_dataframe ):
beir/cqadupstack.programmers
Tamanho do download :
4.98 GiB
Tamanho do conjunto de dados :
2.14 GiB
Armazenado em cache automaticamente ( documentação ): Não
Divisões :
Dividir | Exemplos |
---|---|
'passage' | 32.176 |
'query' | 876 |
'test' | 1.675 |
- Exemplos ( tfds.as_dataframe ):
beir/cqadupstack.stats
Tamanho do download :
4.98 GiB
Tamanho do conjunto de dados :
941.07 MiB
Armazenado em cache automaticamente ( documentação ): Não
Divisões :
Dividir | Exemplos |
---|---|
'passage' | 42.269 |
'query' | 652 |
'test' | 913 |
- Exemplos ( tfds.as_dataframe ):
beir/cqadupstack.tex
Tamanho do download :
4.98 GiB
Tamanho do conjunto de dados :
21.75 GiB
Armazenado em cache automaticamente ( documentação ): Não
Divisões :
Dividir | Exemplos |
---|---|
'passage' | 68.184 |
'query' | 2.906 |
'test' | 5.154 |
- Exemplos ( tfds.as_dataframe ):
beir/cqadupstack.unix
Tamanho do download :
4.98 GiB
Tamanho do conjunto de dados :
2.04 GiB
Armazenado em cache automaticamente ( documentação ): Não
Divisões :
Dividir | Exemplos |
---|---|
'passage' | 47.382 |
'query' | 1.072 |
'test' | 1.693 |
- Exemplos ( tfds.as_dataframe ):
beir/cqadupstack.webmasters
Tamanho do download :
4.98 GiB
Tamanho do conjunto de dados :
650.08 MiB
Armazenado em cache automaticamente ( documentação ): Não
Divisões :
Dividir | Exemplos |
---|---|
'passage' | 17.405 |
'query' | 506 |
'test' | 1.395 |
- Exemplos ( tfds.as_dataframe ):
beir/cqadupstack.wordpress
Tamanho do download :
4.98 GiB
Tamanho do conjunto de dados :
726.15 MiB
Armazenado em cache automaticamente ( documentação ): Não
Divisões :
Dividir | Exemplos |
---|---|
'passage' | 48.605 |
'query' | 541 |
'test' | 744 |
- Exemplos ( tfds.as_dataframe ):
beir/quora
Tamanho do download :
15.12 MiB
Tamanho do conjunto de dados :
121.33 MiB
Cache automático ( documentação ): Sim
Divisões :
Dividir | Exemplos |
---|---|
'passage' | 522.931 |
'query' | 15.000 |
'test' | 15.675 |
'validation' | 7.626 |
- Exemplos ( tfds.as_dataframe ):
beir/dbpedia_entity
Tamanho do download :
609.67 MiB
Tamanho do conjunto de dados :
2.47 GiB
Armazenado em cache automaticamente ( documentação ): Não
Divisões :
Dividir | Exemplos |
---|---|
'passage' | 4.635.922 |
'query' | 467 |
'test' | 40.724 |
'validation' | 5.658 |
- Exemplos ( tfds.as_dataframe ):
beir/scidocs
Tamanho do download :
135.87 MiB
Tamanho do conjunto de dados :
573.04 MiB
Armazenado em cache automaticamente ( documentação ): Não
Divisões :
Dividir | Exemplos |
---|---|
'passage' | 25.657 |
'query' | 1.000 |
'test' | 25.657 |
- Exemplos ( tfds.as_dataframe ):
beir/febre
Tamanho do download :
1.15 GiB
Tamanho do conjunto de dados :
3.70 GiB
Armazenado em cache automaticamente ( documentação ): Não
Divisões :
Dividir | Exemplos |
---|---|
'passage' | 5.416.568 |
'query' | 123.142 |
'test' | 1.499 |
'train' | 12.547 |
'validation' | 1.460 |
- Exemplos ( tfds.as_dataframe ):
beir/climate_fever
Tamanho do download :
1.14 GiB
Tamanho do conjunto de dados :
3.64 GiB
Armazenado em cache automaticamente ( documentação ): Não
Divisões :
Dividir | Exemplos |
---|---|
'passage' | 5.416.593 |
'query' | 1.535 |
'test' | 1.344 |
- Exemplos ( tfds.as_dataframe ):
beir/scifact
Tamanho do download :
2.69 MiB
Tamanho do conjunto de dados :
10.16 MiB
Cache automático ( documentação ): Sim
Divisões :
Dividir | Exemplos |
---|---|
'passage' | 5.183 |
'query' | 1.109 |
'test' | 283 |
'train' | 565 |
- Exemplos ( tfds.as_dataframe ):