Facebook
Закрыть
Доставка в United States
Глубокое обучение с подкреплением. AlphaGo и другие технологии
32.42
32.42
Доставим:  6 июля
Под заказ

Глубокое обучение с подкреплением. AlphaGo и другие технологии

4,1 92 оценки
Характеристики и описание
Эта книга — подробное руководство по новейшим инструментам глубокого обучения с подкреплением и их ограничениям. Мы реализуем и проверим на практике методы кросс-энтропии и итерации по ценностям (Q-learning), а также градиенты по стратегиям. Для экспериментов используются самые разные среды обучения с подкреплением (RL), начиная с классических CartPole и GridWorld и заканчивая эмуляторами Atari и средами непрерывного управления (на основе PyBullet и RoboSchool). Множество примеров основано на нестандартных средах, в которых мы с нуля разработаем модель окружения. В этой книге: - Вы узнаете, какое место в контексте глубокого обучения занимают методы RL, реализуете сложные модели глубокого обучения. - Изучите основу RL: марковские процессы принятия решений. - Рассмотрите примеры реализации методов RL: метод кросс-энтропии, DQN, A3C, TRPO, PPO, DDPG, D4PG и других. - Узнаете, как работать с дискретными и непрерывными пространствами действий в различных средах. - Увидите, как разработать систему, обучающуюся играм Atari, используя обучение с подкреплением. - Создадите собственную среду по модели OpenAI Gym для обучения биржевого агента. - Реализуете метод AlphaGo Zero для игры в Connect4. - Познакомитесь с применением RL в обработке речи: узнаете, как обучить диалогового бота на фразах из кинофильмов.

Книги автора Лапань М.

Смотреть все

Книги серии Для профессионалов (Питер ИД)

Смотреть все

Книги издательства Питер

Смотреть все
Вы смотрели Смотреть все
Глубокое обучение с подкреплением. AlphaGo и другие технологии
Глубокое обучение с подкреплением. AlphaGo и другие технологии
4,1 92 оценки
32.42
Закрыть без сохранения изменений?