টেনসরফ্লো সহ শক্তিবৃদ্ধি শিক্ষা
এজেন্টরা নতুন RL অ্যালগরিদম ডিজাইন, বাস্তবায়ন এবং পরীক্ষা করা সহজ করে তোলে, ভালভাবে পরীক্ষিত মডুলার উপাদানগুলি প্রদান করে যা সংশোধন এবং প্রসারিত করা যেতে পারে। এটি ভাল পরীক্ষা ইন্টিগ্রেশন এবং বেঞ্চমার্কিং সহ দ্রুত কোড পুনরাবৃত্তি সক্ষম করে।
শুরু করার জন্য, আমরা আমাদের টিউটোরিয়ালগুলির একটি চেক আউট করার পরামর্শ দিই৷
ইনস্টলেশন
TF-এজেন্ট রাত্রিকালীন এবং স্থিতিশীল বিল্ড প্রকাশ করে। রিলিজের তালিকার জন্য রিলিজ বিভাগ পড়ুন। নীচের কমান্ডগুলি pypi.org এর পাশাপাশি একটি GitHub ক্লোন থেকে TF-Agents স্থিতিশীল এবং রাত্রিকালীন ইনস্টল করা কভার করে।
:সতর্কতা: যদি Reverb (রিপ্লে বাফার) ব্যবহার করা হয়, যা খুবই সাধারণ, TF-এজেন্ট শুধুমাত্র লিনাক্সের সাথে কাজ করবে।
স্থিতিশীল
সাম্প্রতিক স্থিতিশীল রিলিজ ইনস্টল করতে নীচের কমান্ডগুলি চালান। রিলিজের জন্য API ডকুমেন্টেশন tensorflow.org এ রয়েছে।
$ pip install --user tf-agents[reverb]
# Use keras-2
$ export TF_USE_LEGACY_KERAS=1
# Use this tag get the matching examples and colabs.
$ git clone https://github.com/tensorflow/agents.git
$ cd agents
$ git checkout v0.19.0
আপনি যদি TF-Agents ইনস্টল করতে চান Tensorflow বা Reverb- এর ভার্সন যা পিপ ডিপেন্ডেন্সি চেক দ্বারা সামঞ্জস্যপূর্ণ নয় বলে ফ্ল্যাগ করা হয়েছে, তাহলে নিচের প্যাটার্নটি আপনার নিজের ঝুঁকিতে ব্যবহার করুন।
$ pip install --user tensorflow
$ pip install --user tf-keras
$ pip install --user dm-reverb
$ pip install --user tf-agents
আপনি যদি টেনসরফ্লো 1.15 বা 2.0 এর সাথে TF-এজেন্ট ব্যবহার করতে চান তবে সংস্করণ 0.3.0 ইনস্টল করুন:
# Newer versions of tensorflow-probability require newer versions of TensorFlow.
$ pip install tensorflow-probability==0.8.0
$ pip install tf-agents==0.3.0
রাত্রিবেলা
রাত্রিকালীন বিল্ডগুলিতে নতুন বৈশিষ্ট্য অন্তর্ভুক্ত থাকে তবে সংস্করণযুক্ত রিলিজের তুলনায় কম স্থিতিশীল হতে পারে। রাত্রিকালীন বিল্ড tf-agents-nightly
হিসাবে পুশ করা হয়। আমরা TensorFlow ( tf-nightly
) এবং TensorFlow সম্ভাব্যতা ( tfp-nightly
) এর রাত্রিকালীন সংস্করণগুলি ইনস্টল করার পরামর্শ দিই কারণ এই সংস্করণগুলি TF-এজেন্টদের রাত্রিকালীন পরীক্ষা করা হয়৷
রাতের বিল্ড সংস্করণ ইনস্টল করতে, নিম্নলিখিতটি চালান:
# Use keras-2
$ export TF_USE_LEGACY_KERAS=1
# `--force-reinstall helps guarantee the right versions.
$ pip install --user --force-reinstall tf-nightly
$ pip install --user --force-reinstall tf-keras-nightly
$ pip install --user --force-reinstall tfp-nightly
$ pip install --user --force-reinstall dm-reverb-nightly
# Installing with the `--upgrade` flag ensures you'll get the latest version.
$ pip install --user --upgrade tf-agents-nightly
গিটহাব থেকে
রিপোজিটরি ক্লোন করার পর, pip install -e .[tests]
TensorFlow স্বাধীনভাবে ইনস্টল করা প্রয়োজন: pip install --user tf-nightly
।
অবদান
আমরা আপনার সাথে সহযোগিতা করতে আগ্রহী! কীভাবে অবদান রাখতে হবে তার একটি নির্দেশিকা পেতে CONTRIBUTING.md
দেখুন। এই প্রকল্পটি TensorFlow-এর আচরণবিধি মেনে চলে। অংশগ্রহণ করার মাধ্যমে, আপনি এই কোডটি বজায় রাখবেন বলে আশা করা হচ্ছে।
মুক্তি দেয়
TF এজেন্ট স্থিতিশীল এবং রাত্রিকালীন রিলিজ আছে. রাতের রিলিজগুলি প্রায়শই ঠিক থাকে তবে আপস্ট্রিম লাইব্রেরিগুলি প্রবাহিত হওয়ার কারণে সমস্যা হতে পারে। নীচের সারণীতে TensorFlow-এর সংস্করণ(গুলি) তালিকা করা হয়েছে যা প্রতিটি TF এজেন্টের রিলিজের সাথে সারিবদ্ধ। আগ্রহের সংস্করণ প্রকাশ করুন:
- 0.19.0 tensorflow-2.15.0 সমর্থন করে।
- 0.18.0 পাইথন 3.8 সমর্থন বাদ দিয়েছে।
- 0.16.0 হল প্রথম সংস্করণ যা পাইথন 3.11 সমর্থন করে।
- 0.15.0 হল Python 3.7 এর সাথে সামঞ্জস্যপূর্ণ শেষ রিলিজ।
- যদি numpy <1.19 ব্যবহার করা হয়, তাহলে TF-Agents 0.15.0 বা তার আগের ব্যবহার করুন।
- 0.9.0 হল Python 3.6 এর সাথে সামঞ্জস্যপূর্ণ শেষ রিলিজ।
- 0.3.0 হল Python 2.x এর সাথে সামঞ্জস্যপূর্ণ শেষ রিলিজ।
মুক্তি | শাখা/ট্যাগ | টেনসরফ্লো সংস্করণ | dm-reverb সংস্করণ |
---|---|---|---|
রাত্রিবেলা | মাস্টার | tf-রাত্রিকালীন | dm-reverb-নাইটলি |
0.19.0 | v0.19.0 | 2.15.0 | 0.14.0 |
0.18.0 | v0.18.0 | 2.14.0 | 0.13.0 |
0.17.0 | v0.17.0 | 2.13.0 | 0.12.0 |
0.16.0 | v0.16.0 | 2.12.0 | 0.11.0 |
0.15.0 | v0.15.0 | 2.11.0 | 0.10.0 |
0.14.0 | v0.14.0 | 2.10.0 | 0.9.0 |
0.13.0 | v0.13.0 | 2.9.0 | 0.8.0 |
0.12.0 | v0.12.0 | 2.8.0 | 0.7.0 |
0.11.0 | v0.11.0 | 2.7.0 | 0.6.0 |
0.10.0 | v0.10.0 | 2.6.0 | |
0.9.0 | v0.9.0 | 2.6.0 | |
0.8.0 | v0.8.0 | 2.5.0 | |
0.7.1 | v0.7.1 | 2.4.0 | |
0.6.0 | v0.6.0 | 2.3.0 | |
0.5.0 | v0.5.0 | 2.2.0 | |
0.4.0 | v0.4.0 | 2.1.0 | |
0.3.0 | v0.3.0 | 1.15.0 এবং 2.0.0। |
নীতিমালা
এই প্রকল্পটি Google-এর AI নীতিগুলি মেনে চলে৷ এই প্রকল্পে অংশগ্রহণ, ব্যবহার বা অবদানের মাধ্যমে আপনি এই নীতিগুলি মেনে চলবেন বলে আশা করা হচ্ছে।
উদ্ধৃতি
আপনি যদি এই কোডটি ব্যবহার করেন তবে অনুগ্রহ করে এটিকে উল্লেখ করুন:
@misc{TFAgents,
title = { {TF-Agents}: A library for Reinforcement Learning in TensorFlow},
author = {Sergio Guadarrama and Anoop Korattikara and Oscar Ramirez and
Pablo Castro and Ethan Holly and Sam Fishman and Ke Wang and
Ekaterina Gonina and Neal Wu and Efi Kokiopoulou and Luciano Sbaiz and
Jamie Smith and Gábor Bartók and Jesse Berent and Chris Harris and
Vincent Vanhoucke and Eugene Brevdo},
howpublished = {\url{https://github.com/tensorflow/agents} },
url = "https://github.com/tensorflow/agents",
year = 2018,
note = "[Online; accessed 25-June-2019]"
}
টেনসরফ্লো সহ শক্তিবৃদ্ধি শিক্ষা
এজেন্টরা নতুন RL অ্যালগরিদম ডিজাইন, বাস্তবায়ন এবং পরীক্ষা করা সহজ করে তোলে, ভালভাবে পরীক্ষিত মডুলার উপাদানগুলি প্রদান করে যা সংশোধন এবং প্রসারিত করা যেতে পারে। এটি ভাল পরীক্ষা ইন্টিগ্রেশন এবং বেঞ্চমার্কিং সহ দ্রুত কোড পুনরাবৃত্তি সক্ষম করে।
শুরু করার জন্য, আমরা আমাদের টিউটোরিয়ালগুলির একটি চেক আউট করার পরামর্শ দিই৷
ইনস্টলেশন
TF-এজেন্ট রাত্রিকালীন এবং স্থিতিশীল বিল্ড প্রকাশ করে। রিলিজের তালিকার জন্য রিলিজ বিভাগ পড়ুন। নীচের কমান্ডগুলি pypi.org এর পাশাপাশি একটি GitHub ক্লোন থেকে TF-Agents স্থিতিশীল এবং রাত্রিকালীন ইনস্টল করা কভার করে।
:সতর্কতা: যদি Reverb (রিপ্লে বাফার) ব্যবহার করা হয়, যা খুবই সাধারণ, TF-এজেন্ট শুধুমাত্র লিনাক্সের সাথে কাজ করবে।
স্থিতিশীল
সাম্প্রতিক স্থিতিশীল রিলিজ ইনস্টল করতে নীচের কমান্ডগুলি চালান। রিলিজের জন্য API ডকুমেন্টেশন tensorflow.org এ রয়েছে।
$ pip install --user tf-agents[reverb]
# Use keras-2
$ export TF_USE_LEGACY_KERAS=1
# Use this tag get the matching examples and colabs.
$ git clone https://github.com/tensorflow/agents.git
$ cd agents
$ git checkout v0.19.0
আপনি যদি TF-Agents ইনস্টল করতে চান Tensorflow বা Reverb- এর ভার্সন যা পিপ ডিপেন্ডেন্সি চেক দ্বারা সামঞ্জস্যপূর্ণ নয় বলে ফ্ল্যাগ করা হয়েছে, তাহলে নিচের প্যাটার্নটি আপনার নিজের ঝুঁকিতে ব্যবহার করুন।
$ pip install --user tensorflow
$ pip install --user tf-keras
$ pip install --user dm-reverb
$ pip install --user tf-agents
আপনি যদি টেনসরফ্লো 1.15 বা 2.0 এর সাথে TF-এজেন্ট ব্যবহার করতে চান তবে সংস্করণ 0.3.0 ইনস্টল করুন:
# Newer versions of tensorflow-probability require newer versions of TensorFlow.
$ pip install tensorflow-probability==0.8.0
$ pip install tf-agents==0.3.0
রাত্রিবেলা
রাত্রিকালীন বিল্ডগুলিতে নতুন বৈশিষ্ট্য অন্তর্ভুক্ত থাকে তবে সংস্করণযুক্ত রিলিজের তুলনায় কম স্থিতিশীল হতে পারে। রাত্রিকালীন বিল্ড tf-agents-nightly
হিসাবে পুশ করা হয়। আমরা TensorFlow ( tf-nightly
) এবং TensorFlow সম্ভাব্যতা ( tfp-nightly
) এর রাত্রিকালীন সংস্করণগুলি ইনস্টল করার পরামর্শ দিই কারণ এই সংস্করণগুলি TF-এজেন্টদের রাত্রিকালীন পরীক্ষা করা হয়৷
রাতের বিল্ড সংস্করণ ইনস্টল করতে, নিম্নলিখিতটি চালান:
# Use keras-2
$ export TF_USE_LEGACY_KERAS=1
# `--force-reinstall helps guarantee the right versions.
$ pip install --user --force-reinstall tf-nightly
$ pip install --user --force-reinstall tf-keras-nightly
$ pip install --user --force-reinstall tfp-nightly
$ pip install --user --force-reinstall dm-reverb-nightly
# Installing with the `--upgrade` flag ensures you'll get the latest version.
$ pip install --user --upgrade tf-agents-nightly
গিটহাব থেকে
রিপোজিটরি ক্লোন করার পর, pip install -e .[tests]
TensorFlow স্বাধীনভাবে ইনস্টল করা প্রয়োজন: pip install --user tf-nightly
।
অবদান
আমরা আপনার সাথে সহযোগিতা করতে আগ্রহী! কীভাবে অবদান রাখতে হবে তার একটি নির্দেশিকা পেতে CONTRIBUTING.md
দেখুন। এই প্রকল্পটি TensorFlow-এর আচরণবিধি মেনে চলে। অংশগ্রহণ করার মাধ্যমে, আপনি এই কোডটি বজায় রাখবেন বলে আশা করা হচ্ছে।
মুক্তি দেয়
TF এজেন্ট স্থিতিশীল এবং রাত্রিকালীন রিলিজ আছে. রাতের রিলিজগুলি প্রায়শই ঠিক থাকে তবে আপস্ট্রিম লাইব্রেরিগুলি প্রবাহিত হওয়ার কারণে সমস্যা হতে পারে। নীচের সারণীতে TensorFlow-এর সংস্করণ(গুলি) তালিকা করা হয়েছে যা প্রতিটি TF এজেন্টের রিলিজের সাথে সারিবদ্ধ। আগ্রহের সংস্করণ প্রকাশ করুন:
- 0.19.0 tensorflow-2.15.0 সমর্থন করে।
- 0.18.0 পাইথন 3.8 সমর্থন বাদ দিয়েছে।
- 0.16.0 হল প্রথম সংস্করণ যা পাইথন 3.11 সমর্থন করে।
- 0.15.0 হল Python 3.7 এর সাথে সামঞ্জস্যপূর্ণ শেষ রিলিজ।
- যদি numpy <1.19 ব্যবহার করা হয়, তাহলে TF-Agents 0.15.0 বা তার আগের ব্যবহার করুন।
- 0.9.0 হল Python 3.6 এর সাথে সামঞ্জস্যপূর্ণ শেষ রিলিজ।
- 0.3.0 হল Python 2.x এর সাথে সামঞ্জস্যপূর্ণ শেষ রিলিজ।
মুক্তি | শাখা/ট্যাগ | টেনসরফ্লো সংস্করণ | dm-reverb সংস্করণ |
---|---|---|---|
রাত্রিবেলা | মাস্টার | tf-রাত্রিকালীন | dm-reverb-নাইটলি |
0.19.0 | v0.19.0 | 2.15.0 | 0.14.0 |
0.18.0 | v0.18.0 | 2.14.0 | 0.13.0 |
0.17.0 | v0.17.0 | 2.13.0 | 0.12.0 |
0.16.0 | v0.16.0 | 2.12.0 | 0.11.0 |
0.15.0 | v0.15.0 | 2.11.0 | 0.10.0 |
0.14.0 | v0.14.0 | 2.10.0 | 0.9.0 |
0.13.0 | v0.13.0 | 2.9.0 | 0.8.0 |
0.12.0 | v0.12.0 | 2.8.0 | 0.7.0 |
0.11.0 | v0.11.0 | 2.7.0 | 0.6.0 |
0.10.0 | v0.10.0 | 2.6.0 | |
0.9.0 | v0.9.0 | 2.6.0 | |
0.8.0 | v0.8.0 | 2.5.0 | |
0.7.1 | v0.7.1 | 2.4.0 | |
0.6.0 | v0.6.0 | 2.3.0 | |
0.5.0 | v0.5.0 | 2.2.0 | |
0.4.0 | v0.4.0 | 2.1.0 | |
0.3.0 | v0.3.0 | 1.15.0 এবং 2.0.0। |
নীতিমালা
এই প্রকল্পটি Google-এর AI নীতিগুলি মেনে চলে৷ এই প্রকল্পে অংশগ্রহণ, ব্যবহার বা অবদানের মাধ্যমে আপনি এই নীতিগুলি মেনে চলবেন বলে আশা করা হচ্ছে।
উদ্ধৃতি
আপনি যদি এই কোডটি ব্যবহার করেন তবে অনুগ্রহ করে এটিকে উল্লেখ করুন:
@misc{TFAgents,
title = { {TF-Agents}: A library for Reinforcement Learning in TensorFlow},
author = {Sergio Guadarrama and Anoop Korattikara and Oscar Ramirez and
Pablo Castro and Ethan Holly and Sam Fishman and Ke Wang and
Ekaterina Gonina and Neal Wu and Efi Kokiopoulou and Luciano Sbaiz and
Jamie Smith and Gábor Bartók and Jesse Berent and Chris Harris and
Vincent Vanhoucke and Eugene Brevdo},
howpublished = {\url{https://github.com/tensorflow/agents} },
url = "https://github.com/tensorflow/agents",
year = 2018,
note = "[Online; accessed 25-June-2019]"
}