- Регистрация
- 8 Сен 2016
- Сообщения
- 483.880
- Реакции
- 268.180
**Усиленное обучение [Джеймс Девис]**
Данное руководство по усиленному обучению (Reinforcement Learning, RL) охватывает теоретические основы, практические применения и современные достижения.
В начале рассматривается определение RL, его исторический контекст и ключевые отличия от других видов машинного обучения. Примеры применения RL включают игры, робототехнику, финансовые рынки и управление ресурсами.
Математические основы включают в себя марковские процессы принятия решений, состояния, действия, награды, политики, а также Беллмановские уравнения и итерацию ценности.
Основные алгоритмы RL, такие как метод Монте-Карло, Q-Learning, SARSA, методы градиента политики, REINFORCE и Actor-Critic, рассматриваются вместе с моделями на основе планирования и глубокого усиленного обучения (DQN, DDPG, A3C).
Практическая часть книги включает использование OpenAI Gym и других сред, настройку и тестирование моделей, а также примеры кода на Python с использованием библиотек TensorFlow и PyTorch.
**Цена:** 690 руб.
**Форматы:** epub, fb2, fb3, ios.epub, mobi, pdf, txt, zip
Данное руководство по усиленному обучению (Reinforcement Learning, RL) охватывает теоретические основы, практические применения и современные достижения.
В начале рассматривается определение RL, его исторический контекст и ключевые отличия от других видов машинного обучения. Примеры применения RL включают игры, робототехнику, финансовые рынки и управление ресурсами.
Математические основы включают в себя марковские процессы принятия решений, состояния, действия, награды, политики, а также Беллмановские уравнения и итерацию ценности.
Основные алгоритмы RL, такие как метод Монте-Карло, Q-Learning, SARSA, методы градиента политики, REINFORCE и Actor-Critic, рассматриваются вместе с моделями на основе планирования и глубокого усиленного обучения (DQN, DDPG, A3C).
Практическая часть книги включает использование OpenAI Gym и других сред, настройку и тестирование моделей, а также примеры кода на Python с использованием библиотек TensorFlow и PyTorch.
**Цена:** 690 руб.
**Форматы:** epub, fb2, fb3, ios.epub, mobi, pdf, txt, zip
Для просмотра скрытого содержимого вы должны зарегистрироваться
Возможно, Вас ещё заинтересует:
- Базаров порезал палец. Капитанская дочка. Как повзрослеть и не умереть [MedioModo] [Борис Прокудин, Филипп Жевлаков]
- [Выкройки] Рикарда жакет. Размер 34-52. Рост 162-168 [Vikisews] [Виктория Ракуса]
- [Выкройки] Чани куртка. Размер XS-XL . Рост 162-168 [Vikisews] [Виктория Ракуса]
- [Выкройки] Сандал юбка. Размер 34-52. Рост 162-168 [Vikisews] [Виктория Ракуса]
- [Вязание] Пуловер Mavlin [Гуля Антипова]
- [Выкройки] Клодия юбка. Размер 34-52. Рост 162-168 [Vikisews] [Виктория Ракуса]
- [Выкройки] Мэйт куртка. Размер XS-XL Рост 162-168 [Vikisews] [Виктория Ракуса]
- Мы потомки рептилий?! [MedioModo] [Дмитрий Соболев]