lbpp
컬렉션을 사용해 정리하기
내 환경설정을 기준으로 콘텐츠를 저장하고 분류하세요.
참고: 이 데이터 세트는 최근에 추가되었으며 tfds-nightly
패키지 nights_stay 에서만 사용할 수 있습니다. Less Basic Python 프로그래밍은 단위 테스트와 함께 제공되는 161개의 프로그래밍 문제 모음입니다. 이는 신선하고(생성 시 유출되지 않음) 유사한 데이터 세트(예: HumanEval 및 MBPP)보다 더 어려운 것을 목표로 만들어졌습니다. 이는 동일한 방식으로 구조화된 해당 데이터 세트를 즉시 대체하거나 강화하는 역할을 할 수 있습니다.
FeaturesDict ({
'categories' : Sequence ( Text ( shape = (), dtype = string )),
'completion' : Text ( shape = (), dtype = string ),
'instruction' : Text ( shape = (), dtype = string ),
'language' : Text ( shape = (), dtype = string ),
'signature' : Text ( shape = (), dtype = string ),
'task_id' : Text ( shape = (), dtype = string ),
'test_file' : Text ( shape = (), dtype = string ),
'test_list' : Sequence ( Text ( shape = (), dtype = string )),
'test_setup' : Text ( shape = (), dtype = string ),
'title' : Text ( shape = (), dtype = string ),
})
특징 수업 모양 Dtype 설명 특징Dict 카테고리 시퀀스(텍스트) (없음,) 끈 완성 텍스트 끈 지침 텍스트 끈 언어 텍스트 끈 서명 텍스트 끈 task_id 텍스트 끈 테스트_파일 텍스트 끈 테스트_목록 시퀀스(텍스트) (없음,) 끈 테스트_설정 텍스트 끈 제목 텍스트 끈
@ inproceedings { matton - etal - 2024 - leakage ,
title = "On Leakage of Code Generation Evaluation Datasets" ,
author = "Matton, Alexandre and
Sherborne, Tom and
Aumiller, Dennis and
Tommasone, Elena and
Alizadeh, Milad and
He, Jingyi and
Ma, Raymond and
Voisin, Maxime and
Gilsenan-McMahon, Ellen and
Gall{\'e}, Matthias" ,
editor = "Al-Onaizan, Yaser and
Bansal, Mohit and
Chen, Yun-Nung" ,
booktitle = "Findings of the Association for Computational Linguistics: EMNLP 2024" ,
month = nov ,
year = "2024" ,
address = "Miami, Florida, USA" ,
publisher = "Association for Computational Linguistics" ,
url = "https://aclanthology.org/2024.findings-emnlp.772/" ,
doi = "10.18653/v1/2024.findings-emnlp.772" ,
pages = "13215--13223" ,
}
lbpp/all(기본 구성) 구성 설명 : 다국어 LBPP
다운로드 크기 : 1.78 MiB
데이터세트 크기 : 4.30 MiB
분할 :
lbpp/다국어 구성 설명 : 다국어 LBPP
다운로드 크기 : 1.78 MiB
데이터세트 크기 : 4.30 MiB
분할 :
lbpp/기본 구성 설명 : Python LBPP
다운로드 크기 : 279.90 KiB
데이터세트 크기 : 627.04 KiB
분할 :
lbpp/파이썬 구성 설명 : Python LBPP
다운로드 크기 : 279.90 KiB
데이터세트 크기 : 627.04 KiB
분할 :
lbpp/cpp 구성 설명 : C++ LBPP
다운로드 크기 : 314.45 KiB
데이터세트 크기 : 761.87 KiB
분할 :
lbpp/go 구성 설명 : Go LBPP
다운로드 크기 : 317.09 KiB
데이터세트 크기 : 687.23 KiB
분할 :
lbpp/자바 구성 설명 : Java LBPP
다운로드 크기 : 337.90 KiB
데이터세트 크기 : 887.40 KiB
분할 :
lbpp/js 구성 설명 : JavaScript LBPP
다운로드 크기 : 303.40 KiB
데이터세트 크기 : 756.69 KiB
분할 :
lbpp/자바스크립트 구성 설명 : JavaScript LBPP
다운로드 크기 : 303.40 KiB
데이터세트 크기 : 756.69 KiB
분할 :
lbpp/녹 구성 설명 : JavaScript LBPP
다운로드 크기 : 272.61 KiB
데이터세트 크기 : 684.31 KiB
분할 :
달리 명시되지 않는 한 이 페이지의 콘텐츠에는 Creative Commons Attribution 4.0 라이선스 에 따라 라이선스가 부여되며, 코드 샘플에는 Apache 2.0 라이선스 에 따라 라이선스가 부여됩니다. 자세한 내용은 Google Developers 사이트 정책 을 참조하세요. 자바는 Oracle 및/또는 Oracle 계열사의 등록 상표입니다.
최종 업데이트: 2025-05-05(UTC)
[null,null,["최종 업데이트: 2025-05-05(UTC)"],[],[],null,["# lbpp\n\n\u003cbr /\u003e\n\n- **Description**:\n\n*Less Basic Python Programming* is a collection of 161 programming problems with\naccompanying unit tests. They were created with the aim of being fresh (not\nleaked at the time of creation) and more difficult than similar datasets (e.g.,\nHumanEval and MBPP). It can serve as a drop-in replacement or enrichment of\nthose datasets as they are structured in an equivalent way.\n\n- **Homepage** :\n \u003chttps://aclanthology.org/2024.findings-emnlp.772/\u003e\n\n- **Source code** :\n [`tfds.datasets.lbpp.Builder`](https://github.com/tensorflow/datasets/tree/master/tensorflow_datasets/datasets/lbpp/lbpp_dataset_builder.py)\n\n- **Versions**:\n\n - **`2.0.0`** (default): No release notes.\n- **Auto-cached**\n ([documentation](https://www.tensorflow.org/datasets/performances#auto-caching)):\n Yes\n\n- **Feature structure**:\n\n FeaturesDict({\n 'categories': Sequence(Text(shape=(), dtype=string)),\n 'completion': Text(shape=(), dtype=string),\n 'instruction': Text(shape=(), dtype=string),\n 'language': Text(shape=(), dtype=string),\n 'signature': Text(shape=(), dtype=string),\n 'task_id': Text(shape=(), dtype=string),\n 'test_file': Text(shape=(), dtype=string),\n 'test_list': Sequence(Text(shape=(), dtype=string)),\n 'test_setup': Text(shape=(), dtype=string),\n 'title': Text(shape=(), dtype=string),\n })\n\n- **Feature documentation**:\n\n| Feature | Class | Shape | Dtype | Description |\n|-------------|----------------|---------|--------|-------------|\n| | FeaturesDict | | | |\n| categories | Sequence(Text) | (None,) | string | |\n| completion | Text | | string | |\n| instruction | Text | | string | |\n| language | Text | | string | |\n| signature | Text | | string | |\n| task_id | Text | | string | |\n| test_file | Text | | string | |\n| test_list | Sequence(Text) | (None,) | string | |\n| test_setup | Text | | string | |\n| title | Text | | string | |\n\n- **Supervised keys** (See\n [`as_supervised` doc](https://www.tensorflow.org/datasets/api_docs/python/tfds/load#args)):\n `None`\n\n- **Figure**\n ([tfds.show_examples](https://www.tensorflow.org/datasets/api_docs/python/tfds/visualization/show_examples)):\n Not supported.\n\n- **Citation**:\n\n @inproceedings{matton-etal-2024-leakage,\n title = \"On Leakage of Code Generation Evaluation Datasets\",\n author = \"Matton, Alexandre and\n Sherborne, Tom and\n Aumiller, Dennis and\n Tommasone, Elena and\n Alizadeh, Milad and\n He, Jingyi and\n Ma, Raymond and\n Voisin, Maxime and\n Gilsenan-McMahon, Ellen and\n Gall{\\'e}, Matthias\",\n editor = \"Al-Onaizan, Yaser and\n Bansal, Mohit and\n Chen, Yun-Nung\",\n booktitle = \"Findings of the Association for Computational Linguistics: EMNLP 2024\",\n month = nov,\n year = \"2024\",\n address = \"Miami, Florida, USA\",\n publisher = \"Association for Computational Linguistics\",\n url = \"https://aclanthology.org/2024.findings-emnlp.772/\",\n doi = \"10.18653/v1/2024.findings-emnlp.772\",\n pages = \"13215--13223\",\n }\n\nlbpp/all (default config)\n-------------------------\n\n- **Config description**: Multilingual LBPP\n\n- **Download size** : `1.78 MiB`\n\n- **Dataset size** : `4.30 MiB`\n\n- **Splits**:\n\n| Split | Examples |\n|----------|----------|\n| `'test'` | 944 |\n\n- **Examples** ([tfds.as_dataframe](https://www.tensorflow.org/datasets/api_docs/python/tfds/as_dataframe)):\n\nDisplay examples... \n\nlbpp/multilingual\n-----------------\n\n- **Config description**: Multilingual LBPP\n\n- **Download size** : `1.78 MiB`\n\n- **Dataset size** : `4.30 MiB`\n\n- **Splits**:\n\n| Split | Examples |\n|----------|----------|\n| `'test'` | 944 |\n\n- **Examples** ([tfds.as_dataframe](https://www.tensorflow.org/datasets/api_docs/python/tfds/as_dataframe)):\n\nDisplay examples... \n\nlbpp/default\n------------\n\n- **Config description**: Python LBPP\n\n- **Download size** : `279.90 KiB`\n\n- **Dataset size** : `627.04 KiB`\n\n- **Splits**:\n\n| Split | Examples |\n|----------|----------|\n| `'test'` | 162 |\n\n- **Examples** ([tfds.as_dataframe](https://www.tensorflow.org/datasets/api_docs/python/tfds/as_dataframe)):\n\nDisplay examples... \n\nlbpp/python\n-----------\n\n- **Config description**: Python LBPP\n\n- **Download size** : `279.90 KiB`\n\n- **Dataset size** : `627.04 KiB`\n\n- **Splits**:\n\n| Split | Examples |\n|----------|----------|\n| `'test'` | 162 |\n\n- **Examples** ([tfds.as_dataframe](https://www.tensorflow.org/datasets/api_docs/python/tfds/as_dataframe)):\n\nDisplay examples... \n\nlbpp/cpp\n--------\n\n- **Config description**: C++ LBPP\n\n- **Download size** : `314.45 KiB`\n\n- **Dataset size** : `761.87 KiB`\n\n- **Splits**:\n\n| Split | Examples |\n|----------|----------|\n| `'test'` | 161 |\n\n- **Examples** ([tfds.as_dataframe](https://www.tensorflow.org/datasets/api_docs/python/tfds/as_dataframe)):\n\nDisplay examples... \n\nlbpp/go\n-------\n\n- **Config description**: Go LBPP\n\n- **Download size** : `317.09 KiB`\n\n- **Dataset size** : `687.23 KiB`\n\n- **Splits**:\n\n| Split | Examples |\n|----------|----------|\n| `'test'` | 161 |\n\n- **Examples** ([tfds.as_dataframe](https://www.tensorflow.org/datasets/api_docs/python/tfds/as_dataframe)):\n\nDisplay examples... \n\nlbpp/java\n---------\n\n- **Config description**: Java LBPP\n\n- **Download size** : `337.90 KiB`\n\n- **Dataset size** : `887.40 KiB`\n\n- **Splits**:\n\n| Split | Examples |\n|----------|----------|\n| `'test'` | 158 |\n\n- **Examples** ([tfds.as_dataframe](https://www.tensorflow.org/datasets/api_docs/python/tfds/as_dataframe)):\n\nDisplay examples... \n\nlbpp/js\n-------\n\n- **Config description**: JavaScript LBPP\n\n- **Download size** : `303.40 KiB`\n\n- **Dataset size** : `756.69 KiB`\n\n- **Splits**:\n\n| Split | Examples |\n|----------|----------|\n| `'test'` | 153 |\n\n- **Examples** ([tfds.as_dataframe](https://www.tensorflow.org/datasets/api_docs/python/tfds/as_dataframe)):\n\nDisplay examples... \n\nlbpp/javascript\n---------------\n\n- **Config description**: JavaScript LBPP\n\n- **Download size** : `303.40 KiB`\n\n- **Dataset size** : `756.69 KiB`\n\n- **Splits**:\n\n| Split | Examples |\n|----------|----------|\n| `'test'` | 153 |\n\n- **Examples** ([tfds.as_dataframe](https://www.tensorflow.org/datasets/api_docs/python/tfds/as_dataframe)):\n\nDisplay examples... \n\nlbpp/rust\n---------\n\n- **Config description**: JavaScript LBPP\n\n- **Download size** : `272.61 KiB`\n\n- **Dataset size** : `684.31 KiB`\n\n- **Splits**:\n\n| Split | Examples |\n|----------|----------|\n| `'test'` | 149 |\n\n- **Examples** ([tfds.as_dataframe](https://www.tensorflow.org/datasets/api_docs/python/tfds/as_dataframe)):\n\nDisplay examples..."]]