Agenti TensorFlow

Apprendimento per rinforzo con TensorFlow

Gli agenti semplificano la progettazione, l'implementazione e il test di nuovi algoritmi RL, fornendo componenti modulari ben collaudati che possono essere modificati ed estesi. Consente una rapida iterazione del codice, con una buona integrazione di test e benchmarking.

Per iniziare, ti consigliamo di dare un'occhiata a uno dei nostri tutorial .

Installazione

TF-Agents pubblica build notturne e stabili. Per un elenco dei rilasci leggi la sezione Rilasci . I comandi seguenti riguardano l'installazione di TF-Agents stable e nightly da pypi.org e da un clone di GitHub.

:warning: Se si utilizza Reverb (replay buffer), che è molto comune, TF-Agent funzionerà solo con Linux.

Stabile

Eseguire i comandi seguenti per installare la versione stabile più recente. La documentazione API per la versione è su tensorflow.org .

$ pip install --user tf-agents[reverb]

# Use this tag get the matching examples and colabs.
$ git clone https://github.com/tensorflow/agents.git
$ cd agents
$ git checkout v0.17.0

Se desideri installare TF-Agent con versioni di Tensorflow o Reverb contrassegnate come non compatibili dal controllo di dipendenza pip, utilizza il seguente schema a tuo rischio e pericolo.

$ pip install --user tensorflow
$ pip install --user dm-reverb
$ pip install --user tf-agents

Se desideri utilizzare TF-Agents con TensorFlow 1.15 o 2.0, installa la versione 0.3.0:

# Newer versions of tensorflow-probability require newer versions of TensorFlow.
$ pip install tensorflow-probability==0.8.0
$ pip install tf-agents==0.3.0

Di notte

Le build notturne includono funzionalità più recenti, ma potrebbero essere meno stabili rispetto alle versioni con versione. La build notturna viene inviata come tf-agents-nightly . Suggeriamo di installare le versioni notturne di TensorFlow ( tf-nightly ) e TensorFlow Probability ( tfp-nightly ) in quanto queste sono le versioni su cui vengono testati i TF-Agents nightly.

Per installare la versione nightly build, eseguire quanto segue:

# `--force-reinstall helps guarantee the right versions.
$ pip install --user --force-reinstall tf-nightly
$ pip install --user --force-reinstall tfp-nightly
$ pip install --user --force-reinstall dm-reverb-nightly

# Installing with the `--upgrade` flag ensures you'll get the latest version.
$ pip install --user --upgrade tf-agents-nightly

Da GitHub

Dopo aver clonato il repository, le dipendenze possono essere installate eseguendo pip install -e .[tests] . TensorFlow deve essere installato in modo indipendente: pip install --user tf-nightly .

Contribuire

Siamo ansiosi di collaborare con te! Vedi CONTRIBUTING.md per una guida su come contribuire. Questo progetto aderisce al codice di condotta di TensorFlow. Partecipando, sei tenuto a rispettare questo codice.

Rilasci

TF Agents ha versioni stabili e notturne. Le versioni notturne spesso vanno bene, ma possono avere problemi a causa delle librerie a monte che sono in continuo mutamento. La tabella seguente elenca le versioni di TensorFlow che si allineano con ogni versione di TF Agents. Versioni di rilascio di interesse:

  • 0.16.0 è la prima versione a supportare Python 3.11.
  • 0.15.0 è l'ultima versione compatibile con Python 3.7.
  • Se si utilizza numpy < 1.19, utilizzare TF-Agents 0.15.0 o versioni precedenti.
  • 0.9.0 è l'ultima versione compatibile con Python 3.6.
  • 0.3.0 è l'ultima release compatibile con Python 2.x.
Pubblicazione Filiale / Etichetta Versione TensorFlow Versione dm-riverbero
Di notte maestro tf-notturno dm-riverbero-notturno
0.17.0 v0.17.0 2.13.0 0.12.0
0.16.0 v0.16.0 2.12.0 0.11.0
0.15.0 v0.15.0 2.11.0 0.10.0
0.14.0 v0.14.0 2.10.0 0.9.0
0.13.0 v0.13.0 2.9.0 0.8.0
0.12.0 v0.12.0 2.8.0 0.7.0
0.11.0 v0.11.0 2.7.0 0.6.0
0.10.0 v0.10.0 2.6.0
0.9.0 v0.9.0 2.6.0
0.8.0 v0.8.0 2.5.0
0.7.1 v0.7.1 2.4.0
0.6.0 v0.6.0 2.3.0
0.5.0 v0.5.0 2.2.0
0.4.0 v0.4.0 2.1.0
0.3.0 v0.3.0 1.15.0 e 2.0.0.

I principi

Questo progetto aderisce ai principi AI di Google . Partecipando, utilizzando o contribuendo a questo progetto, sei tenuto ad aderire a questi principi.

Citazione

Se usi questo codice, per favore citalo come:

@misc{TFAgents,
  title = { {TF-Agents}: A library for Reinforcement Learning in TensorFlow},
  author = {Sergio Guadarrama and Anoop Korattikara and Oscar Ramirez and
     Pablo Castro and Ethan Holly and Sam Fishman and Ke Wang and
     Ekaterina Gonina and Neal Wu and Efi Kokiopoulou and Luciano Sbaiz and
     Jamie Smith and Gábor Bartók and Jesse Berent and Chris Harris and
     Vincent Vanhoucke and Eugene Brevdo},
  howpublished = {\url{https://github.com/tensorflow/agents} },
  url = "https://github.com/tensorflow/agents",
  year = 2018,
  note = "[Online; accessed 25-June-2019]"
}