TFDS รองรับ รูปแบบ Croissant 🥐 แล้ว! อ่าน เอกสาร เพื่อทราบข้อมูลเพิ่มเติม

TFDS CLI

TFDS CLI เป็นเครื่องมือบรรทัดคำสั่งที่ให้คำสั่งต่างๆ เพื่อให้ทำงานกับชุดข้อมูล TensorFlow ได้อย่างง่ายดาย

ดูบน TensorFlow.org

ทำงานใน Google Colab

ดูแหล่งที่มาบน GitHub

ดาวน์โหลดโน๊ตบุ๊ค

ปิดใช้งานบันทึก TF ในการนำเข้า

%%capture
%env TF_CPP_MIN_LOG_LEVEL=1  # Disable logs on TF import

การติดตั้ง

เครื่องมือ CLI ได้รับการติดตั้งด้วย tensorflow-datasets (หรือ tfds-nightly )

pip install -q tfds-nightly
tfds --version

สำหรับรายการคำสั่ง CLI ทั้งหมด:

tfds --help

usage: tfds [-h] [--helpfull] [--version] {build,new} ...

Tensorflow Datasets CLI tool

optional arguments:
  -h, --help   show this help message and exit
  --helpfull   show full help message and exit
  --version    show program's version number and exit

command:
  {build,new}
    build      Commands for downloading and preparing datasets.
    new        Creates a new dataset directory from the template.

`tfds new` : การใช้ชุดข้อมูลใหม่

คำสั่งนี้จะช่วยให้คุณเริ่มต้นเขียนชุดข้อมูล Python ใหม่โดยสร้าง <dataset_name>/ ที่มีไฟล์การใช้งานเริ่มต้น

การใช้งาน:

tfds new my_dataset

2022-02-07 04:04:10.397902: E tensorflow/stream_executor/cuda/cuda_driver.cc:271] failed call to cuInit: CUDA_ERROR_NO_DEVICE: no CUDA-capable device is detected
Dataset generated at /tmpfs/src/temp/docs/my_dataset
You can start searching `TODO(my_dataset)` to complete the implementation.
Please check https://www.tensorflow.org/datasets/add_dataset for additional details.

จะสร้าง:

ls -1 my_dataset/

__init__.py
checksums.tsv
dummy_data/
my_dataset.py
my_dataset_test.py

ดู คู่มือการเขียนชุดข้อมูล ของเราสำหรับข้อมูลเพิ่มเติม

ตัวเลือกที่มีจำหน่าย:

tfds new --help

usage: tfds new [-h] [--helpfull] [--dir DIR] dataset_name

positional arguments:
  dataset_name  Name of the dataset to be created (in snake_case)

optional arguments:
  -h, --help    show this help message and exit
  --helpfull    show full help message and exit
  --dir DIR     Path where the dataset directory will be created. Defaults to
                current directory.

`tfds build` : ดาวน์โหลดและเตรียมชุดข้อมูล

ใช้ tfds build <my_dataset> เพื่อสร้างชุดข้อมูลใหม่ <my_dataset> สามารถเป็น:

เส้นทางไปยัง dataset/ โฟลเดอร์หรือไฟล์ dataset.py (ว่างสำหรับไดเร็กทอรีปัจจุบัน):
- tfds build datasets/my_dataset/
- cd datasets/my_dataset/ && tfds build
- cd datasets/my_dataset/ && tfds build my_dataset
- cd datasets/my_dataset/ && tfds build my_dataset.py
ชุดข้อมูลที่ลงทะเบียน:
- tfds build mnist
- tfds build my_dataset --imports my_project.datasets