Joy RL：强化学习实践教程最新章节全文无弹窗在线阅读-QQ阅读短篇女生网

QQ阅读女生中文仙侠网

女生中文仙侠网

达人推广书架浏览历史

登录 | 注册

书籍简介

本书是继《EasyRL：强化学习教程》（俗称“蘑菇书”）之后，为强化学习的读者专门打造的一本深入实践的全新教程。全书大部分内容基于3位作者的实践经验，涵盖马尔可夫决策过程、动态规划、免模型预测、免模型控制、深度学习基础、DQN算法、DQN算法进阶、策略梯度、Actor-Critic算法、DDPG与TD3算法、PPO算法等内容，旨在帮助读者快速入门强化学习的代码实践，并辅以一套开源代码框架“JoyRL”，便于读者适应业界应用研究风格的代码。与“蘑菇书”不同，本书对强化学习核心理论进行提炼，并串联知识点，重视强化学习代码实践的指导而不是对理论的详细讲解。本书适合具有一定编程基础且希望快速进入实践应用阶段的读者阅读。

品牌：人邮图书

上架时间：2025-04-01 00:00:00

出版社：人民邮电出版社

本书数字版权由人邮图书提供，并由其授权上海阅文信息技术有限公司制作发行

最新章节

江季王琦杨毅远

同类热门书

最新上架

会员
人工智能数学基础与Python机器学习实战
本书分为3个部分：第1章和第2章是人工智能的数学基础，主要介绍了机器学习的概念、Python开发环境的搭建、机器学习bibei的数学知识，以及线性代数和概率论的相关知识；第3~12章主要介绍了回归模型、分类模型、聚类模型、半监督模型的建立和相关算法的理论，以及如何使用sklearn具体实现相关算法模型的搭建；第13章介绍了Spark机器学习，笔者认为对于机器学习，不能只限于Python中的skle
刘润森计算机0字
会员
AI时代产品经理升级之道：ChatGPT让产品经理插上翅膀
本书是一本面向产品经理的实用新书，分12章探讨如何用ChatGPT提升产品管理工作的效率和质量。第1章介绍了人工智能对产品管理的影响；第2章介绍用ChatGPT提高文档写作效率；第3章介绍用ChatGPT进行竞品和市场分析；第4章介绍用ChatGPT优化需求管理；第5章介绍用ChatGPT分析产品数据；第6章介绍用ChatGPT改进用户体验；第7章介绍用ChatGPT设计产品原型；第8章介绍用Ch
关东升计算机11.5万字
会员
AIGC+智慧教育：Web 3.0时代的教育变革与转型
随着Web3.0时代的来临，我国教育领域迎来了一场全面而深刻的变革——AIGC、ChatGPT、大数据、云计算、物联网、数字孪生、元宇宙等新兴技术与教育行业的融合程度日益加深，AI驱动的教育新形态、新模式、新产品不断涌现，数字化、网络化、智能化逐渐成为引领我国教育变革与转型的重要方向。本书立足于全球范围内智慧教育领域的实践经验与前沿趋势，全面阐述AIGC、ChatGPT、元宇宙、数字孪生等新兴技
程君青邵立东杨爱喜计算机13.8万字
会员
硅基物语·AI大爆炸：ChatGPT→AIGC→GPT-X→AGI进化→魔法时代→人类未来
本书以第一人称视角，讲述AI的来龙去脉，表达AI的技术原理。从历史到未来，跨越百年时空；从理论到实践，解读AI大爆炸；从技术到哲学，穿越多个维度；从语言到绘画，落地实战演练。ChatGPT的诞生，引发了奇点降临，点亮了AGI（通用人工智能），并涉及大模型、深度神经网络、Transformer、AIGC、涌现效应等一系列技术前沿。
量子学派@ChatGPT计算机8.6万字
会员
GPT-4o极简入门与绘画大全
现在，AI与多模态技术快速发展，高效创作优质视觉内容已成为核心竞争力，OpenAI推出的GPT-4o为此提供了全新解决方案。本书系统整合一线实战经验，详细讲解GPT-4o从基础操作到多领域应用的108个实战案例、50种绘画风格及6大商业变现路径，并提供全面、详尽的提示词模板与示例，还讲解如何结合DeepSeek优化提示词，可帮助读者缩短创作周期，实现“懒人直出”。本书总计7章。第1章讲解GPT-4
李艮基肖灵煊曹方咏崢计算机4.2万字
会员
贝叶斯算法与机器学习
本书共分为10章，涵盖了贝叶斯概率、概率估计、贝叶斯分类、随机场、参数估计、机器学习、深度学习、贝叶斯网络、动态贝叶斯网络、贝叶斯深度学习等。本书涉及的应用领域包含机器学习、图像处理、语音识别、语义分析等。
刘冰计算机0字
心与芯：我们与机器人的无限未来
我们当下正在经历一场AI革命。现在有创纪录的310万个机器人在工厂工作，从事从组装电脑到包装货物以及监测空气质量等各种工作。数量庞大的智能机器以各种各样的方式影响着我们的生活，如提高外科医生的手术精确度，清洁我们的家等等，我们正处于机器智能带来的令人兴奋的可能性当中。下一个万亿规模的企业，也许正在AI机器人领域诞生。当下的机器人产业，远远超出常人的想象。你会看到全世界最先锋的机器人研究团队如何开发
(美)丹妮拉·鲁斯 (美)格雷戈里·莫内计算机13.5万字
会员
人工智能算法基础
本书分为4章，共20章。其中第1篇为基础算法篇，从第1章到第9章，讲述排序、查找、线性结构、树、散列、图、堆栈等基本数据结构算法；第2篇为机器学习算法篇，从第10章到第14章，讲述分类算法、回归算法、聚类算法、降维算法和集成学习算法；第3篇为强化学习算法篇，从第15章到第16章，讲述基于价值的强化学习算法和基于策略的强化学习算法；第4篇为深度学习算法篇，从第17章到第19章，讲述神经网络模型算法、
唐宇迪史卫亚罗召勇李琳侯惠芳编著计算机0字
会员
Joy RL：强化学习实践教程
本书是继《EasyRL：强化学习教程》（俗称“蘑菇书”）之后，为强化学习的读者专门打造的一本深入实践的全新教程。全书大部分内容基于3位作者的实践经验，涵盖马尔可夫决策过程、动态规划、免模型预测、免模型控制、深度学习基础、DQN算法、DQN算法进阶、策略梯度、Actor-Critic算法、DDPG与TD3算法、PPO算法等内容，旨在帮助读者快速入门强化学习的代码实践，并辅以一套开源代码框架“Joy
江季王琦杨毅远计算机7.8万字

关于腾讯About Tencent服务协议开放平台广告服务腾讯招聘腾讯公益客服中心违规举报

达人推广合作：https://kol.yuewen.com

网站合作：傅女士 fuli.a@yuewen.com

双新用户（设备和账号都新为双新用户）下载并登录后1-20天最多可免费领取20本会员/单订书且可免费读10天

Copyright (C) 2025 ivideo.qq.com All Rights Reserved 上海阅文信息技术有限公司版权所有
粤公网安备 44030002000001号增值电信业务经营许可证：粤B2-20090059 互联网ICP备案号：粤B2-20090059-5 沪ICP备14016804号-3 举报电话：010-59357051 营业执照
网络文化经营许可证：沪网文 (2023) 3296-228号网络出版服务许可证：（署）网出证（沪）字第055号互联网宗教信息服务许可证：沪（2023）0000015