Đại lý TensorFlow

Học tăng cường với TensorFlow

Các tác nhân làm cho việc thiết kế, triển khai và thử nghiệm các thuật toán RL mới trở nên dễ dàng hơn bằng cách cung cấp các thành phần mô-đun đã được thử nghiệm kỹ càng, có thể sửa đổi và mở rộng. Nó cho phép lặp lại mã nhanh, tích hợp thử nghiệm và đo điểm chuẩn tốt.

Để bắt đầu, chúng tôi khuyên bạn nên xem một trong các hướng dẫn của chúng tôi.

Cài đặt

TF-Agents xuất bản các bản dựng ổn định và hàng đêm. Để biết danh sách các bản phát hành, hãy đọc phần Bản phát hành . Các lệnh bên dưới bao gồm việc cài đặt TF-Agents ổn định và hàng đêm từ pypi.org cũng như từ bản sao GitHub.

:warning: Nếu sử dụng Reverb (bộ đệm phát lại), vốn rất phổ biến, TF-Agents sẽ chỉ hoạt động với Linux.

Ổn định

Chạy các lệnh bên dưới để cài đặt bản phát hành ổn định gần đây nhất. Tài liệu API cho bản phát hành có trên tensorflow.org .

$ pip install --user tf-agents[reverb]

# Use this tag get the matching examples and colabs.
$ git clone https://github.com/tensorflow/agents.git
$ cd agents
$ git checkout v0.17.0

Nếu bạn muốn cài đặt TF-Agents với các phiên bản Tensorflow hoặc Reverb được gắn cờ là không tương thích khi kiểm tra tính phụ thuộc pip, hãy tự chịu rủi ro khi sử dụng mẫu dưới đây.

$ pip install --user tensorflow
$ pip install --user dm-reverb
$ pip install --user tf-agents

Nếu bạn muốn sử dụng TF-Agents với TensorFlow 1.15 hoặc 2.0, hãy cài đặt phiên bản 0.3.0:

# Newer versions of tensorflow-probability require newer versions of TensorFlow.
$ pip install tensorflow-probability==0.8.0
$ pip install tf-agents==0.3.0

hàng đêm

Bản dựng hàng đêm bao gồm các tính năng mới hơn, nhưng có thể kém ổn định hơn so với bản phát hành theo phiên bản. Bản dựng hàng đêm được đẩy thành tf-agents-nightly . Chúng tôi khuyên bạn nên cài đặt các phiên bản hàng đêm của TensorFlow ( tf-nightly ) và TensorFlow Probability ( tfp-nightly ) vì đó là những phiên bản mà TF-Agents hàng đêm được thử nghiệm.

Để cài đặt phiên bản xây dựng hàng đêm, hãy chạy như sau:

# `--force-reinstall helps guarantee the right versions.
$ pip install --user --force-reinstall tf-nightly
$ pip install --user --force-reinstall tfp-nightly
$ pip install --user --force-reinstall dm-reverb-nightly

# Installing with the `--upgrade` flag ensures you'll get the latest version.
$ pip install --user --upgrade tf-agents-nightly

Từ GitHub

Sau khi sao chép kho lưu trữ, các phụ thuộc có thể được cài đặt bằng cách chạy pip install -e .[tests] . TensorFlow cần được cài đặt độc lập: pip install --user tf-nightly .

Đóng góp

Chúng tôi rất mong được cộng tác với bạn! Xem CONTRIBUTING.md để biết hướng dẫn về cách đóng góp. Dự án này tuân thủ quy tắc ứng xử của TensorFlow. Bằng cách tham gia, bạn phải duy trì mã này.

phát hành

TF Agents có bản phát hành ổn định và hàng đêm. Các bản phát hành hàng đêm thường ổn nhưng có thể có sự cố do các thư viện ngược dòng đang thay đổi liên tục. Bảng bên dưới liệt kê (các) phiên bản của TensorFlow phù hợp với từng bản phát hành của Đại lý TF. Phiên bản phát hành quan tâm:

  • 0.16.0 là phiên bản đầu tiên hỗ trợ Python 3.11.
  • 0.15.0 là bản phát hành cuối cùng tương thích với Python 3.7.
  • Nếu sử dụng numpy < 1.19, hãy sử dụng TF-Agents 0.15.0 hoặc phiên bản cũ hơn.
  • 0.9.0 là bản phát hành cuối cùng tương thích với Python 3.6.
  • 0.3.0 là bản phát hành cuối cùng tương thích với Python 2.x.
Giải phóng Chi nhánh / Thẻ Phiên bản TensorFlow Phiên bản dm-reverb
hàng đêm bậc thầy tf-hàng đêm dm-reverb-nightly
0.17.0 v0.17.0 2.13.0 0.12.0
0.16.0 v0.16.0 2.12.0 0.11.0
0.15.0 v0.15.0 2.11.0 0.10.0
0.14.0 v0.14.0 2.10.0 0.9.0
0.13.0 v0.13.0 2.9.0 0.8.0
0.12.0 v0.12.0 2.8.0 0.7.0
0.11.0 v0.11.0 2.7.0 0.6.0
0.10.0 v0.10.0 2.6.0
0.9.0 v0.9.0 2.6.0
0.8.0 v0.8.0 2.5.0
0.7.1 v0.7.1 2.4.0
0.6.0 v0.6.0 2.3.0
0.5.0 v0.5.0 2.2.0
0.4.0 v0.4.0 2.1.0
0.3.0 v0.3.0 1.15.0 và 2.0.0.

Nguyên tắc

Dự án này tuân thủ các nguyên tắc AI của Google . Bằng cách tham gia, sử dụng hoặc đóng góp cho dự án này, bạn phải tuân thủ các nguyên tắc này.

trích dẫn

Nếu bạn sử dụng mã này, vui lòng trích dẫn nó dưới dạng:

@misc{TFAgents,
  title = { {TF-Agents}: A library for Reinforcement Learning in TensorFlow},
  author = {Sergio Guadarrama and Anoop Korattikara and Oscar Ramirez and
     Pablo Castro and Ethan Holly and Sam Fishman and Ke Wang and
     Ekaterina Gonina and Neal Wu and Efi Kokiopoulou and Luciano Sbaiz and
     Jamie Smith and Gábor Bartók and Jesse Berent and Chris Harris and
     Vincent Vanhoucke and Eugene Brevdo},
  howpublished = {\url{https://github.com/tensorflow/agents} },
  url = "https://github.com/tensorflow/agents",
  year = 2018,
  note = "[Online; accessed 25-June-2019]"
}