عوامل تنسورفلو

یادگیری تقویتی با TensorFlow

Agents طراحی، پیاده‌سازی و آزمایش الگوریتم‌های جدید RL را با ارائه مولفه‌های مدولار به خوبی آزمایش شده که قابل تغییر و توسعه هستند، آسان‌تر می‌کند. این امکان تکرار سریع کد را با یکپارچه سازی تست خوب و محک زدن فراهم می کند.

برای شروع، توصیه می کنیم یکی از آموزش های ما را بررسی کنید.

نصب و راه اندازی

TF-Agents بیلدهای شبانه و پایدار را منتشر می کند. برای فهرستی از نسخه‌ها، بخش نسخه‌ها را بخوانید. دستورات زیر نصب TF-Agents پایدار و شبانه از pypi.org و همچنین از یک کلون GitHub را پوشش می دهد.

:warning: در صورت استفاده از Reverb (بازپخش بافر) که بسیار رایج است، TF-Agents فقط با لینوکس کار می کند.

پایدار

برای نصب آخرین نسخه پایدار، دستورات زیر را اجرا کنید. اسناد API برای انتشار در tensorflow.org است.

$ pip install --user tf-agents[reverb]

# Use keras-2
$ export TF_USE_LEGACY_KERAS=1
# Use this tag get the matching examples and colabs.
$ git clone https://github.com/tensorflow/agents.git
$ cd agents
$ git checkout v0.19.0

اگر می‌خواهید TF-Agents را با نسخه‌هایی از Tensorflow یا Reverb نصب کنید که توسط بررسی وابستگی پیپ به‌عنوان ناسازگار علامت‌گذاری شده‌اند، از الگوی زیر با مسئولیت خود استفاده کنید.

$ pip install --user tensorflow
$ pip install --user tf-keras
$ pip install --user dm-reverb
$ pip install --user tf-agents

اگر می خواهید از TF-Agents با TensorFlow 1.15 یا 2.0 استفاده کنید، نسخه 0.3.0 را نصب کنید:

# Newer versions of tensorflow-probability require newer versions of TensorFlow.
$ pip install tensorflow-probability==0.8.0
$ pip install tf-agents==0.3.0

شبانه

ساخت‌های شبانه دارای ویژگی‌های جدیدتری هستند، اما ممکن است نسبت به نسخه‌های نسخه‌شده پایدارتر باشند. ساخت شبانه به عنوان tf-agents-nightly قرار داده شده است. پیشنهاد می‌کنیم نسخه‌های شبانه TensorFlow ( tf-nightly ) و TensorFlow Probability ( tfp-nightly ) را نصب کنید، زیرا این نسخه‌ها نسخه‌هایی هستند که TF-Agents شبانه روی آن‌ها آزمایش می‌شوند.

برای نصب نسخه شبانه بیلد، موارد زیر را اجرا کنید:

# Use keras-2
$ export TF_USE_LEGACY_KERAS=1
# `--force-reinstall helps guarantee the right versions.
$ pip install --user --force-reinstall tf-nightly
$ pip install --user --force-reinstall tf-keras-nightly
$ pip install --user --force-reinstall tfp-nightly
$ pip install --user --force-reinstall dm-reverb-nightly

# Installing with the `--upgrade` flag ensures you'll get the latest version.
$ pip install --user --upgrade tf-agents-nightly

از GitHub

پس از کلون سازی مخزن، وابستگی ها را می توان با اجرای pip install -e .[tests] نصب کرد. TensorFlow باید به طور مستقل نصب شود: pip install --user tf-nightly .

کمک کردن

ما مشتاق همکاری با شما هستیم! برای راهنمایی در مورد نحوه مشارکت به CONTRIBUTING.md مراجعه کنید. این پروژه به آیین نامه رفتار تنسورفلو پایبند است. با شرکت، از شما انتظار می رود که این کد را حفظ کنید.

منتشر شده

TF Agents نسخه های پایدار و شبانه دارد. نسخه‌های شبانه اغلب خوب هستند، اما به دلیل در جریان بودن کتابخانه‌های بالادست، ممکن است مشکلاتی داشته باشند. جدول زیر نسخه(های) TensorFlow را فهرست می کند که با هر نسخه از TF Agents همخوانی دارند. نسخه های مورد علاقه:

  • 0.19.0 از tensorflow-2.15.0 پشتیبانی می کند.
  • 0.18.0 پشتیبانی Python 3.8 را حذف کرد.
  • 0.16.0 اولین نسخه ای است که پایتون 3.11 را پشتیبانی می کند.
  • 0.15.0 آخرین نسخه سازگار با پایتون 3.7 است.
  • اگر از numpy < 1.19 استفاده می کنید، از TF-Agents 0.15.0 یا قبل از آن استفاده کنید.
  • 0.9.0 آخرین نسخه سازگار با پایتون 3.6 است.
  • 0.3.0 آخرین نسخه سازگار با Python 2.x است.
رهایی شعبه / برچسب نسخه TensorFlow نسخه dm-reverb
شبانه استاد tf-شب dm-reverb-nightly
0.19.0 نسخه 0.19.0 2.15.0 0.14.0
0.18.0 نسخه 0.18.0 2.14.0 0.13.0
0.17.0 نسخه 0.17.0 2.13.0 0.12.0
0.16.0 نسخه 0.16.0 2.12.0 0.11.0
0.15.0 نسخه 0.15.0 2.11.0 0.10.0
0.14.0 نسخه 0.14.0 2.10.0 0.9.0
0.13.0 نسخه 0.13.0 2.9.0 0.8.0
0.12.0 نسخه 0.12.0 2.8.0 0.7.0
0.11.0 نسخه 0.11.0 2.7.0 0.6.0
0.10.0 نسخه 0.10.0 2.6.0
0.9.0 نسخه 0.9.0 2.6.0
0.8.0 نسخه 0.8.0 2.5.0
0.7.1 نسخه 0.7.1 2.4.0
0.6.0 نسخه 0.6.0 2.3.0
0.5.0 نسخه 0.5.0 2.2.0
0.4.0 نسخه 0.4.0 2.1.0
0.3.0 نسخه 0.3.0 1.15.0 و 2.0.0.

اصول

این پروژه به اصول هوش مصنوعی گوگل پایبند است. با شرکت، استفاده یا مشارکت در این پروژه از شما انتظار می رود که به این اصول پایبند باشید.

نقل قول

اگر از این کد استفاده می کنید، لطفاً آن را به صورت زیر ذکر کنید:

@misc{TFAgents,
  title = { {TF-Agents}: A library for Reinforcement Learning in TensorFlow},
  author = {Sergio Guadarrama and Anoop Korattikara and Oscar Ramirez and
     Pablo Castro and Ethan Holly and Sam Fishman and Ke Wang and
     Ekaterina Gonina and Neal Wu and Efi Kokiopoulou and Luciano Sbaiz and
     Jamie Smith and Gábor Bartók and Jesse Berent and Chris Harris and
     Vincent Vanhoucke and Eugene Brevdo},
  howpublished = {\url{https://github.com/tensorflow/agents} },
  url = "https://github.com/tensorflow/agents",
  year = 2018,
  note = "[Online; accessed 25-June-2019]"
}