
会员
Joy RL:强化学习实践教程
更新时间:2025-05-19 16:15:54 最新章节:第12章
书籍简介
本书是继《EasyRL:强化学习教程》(俗称“蘑菇书”)之后,为强化学习的读者专门打造的一本深入实践的全新教程。全书大部分内容基于3位作者的实践经验,涵盖马尔可夫决策过程、动态规划、免模型预测、免模型控制、深度学习基础、DQN算法、DQN算法进阶、策略梯度、Actor-Critic算法、DDPG与TD3算法、PPO算法等内容,旨在帮助读者快速入门强化学习的代码实践,并辅以一套开源代码框架“JoyRL”,便于读者适应业界应用研究风格的代码。与“蘑菇书”不同,本书对强化学习核心理论进行提炼,并串联知识点,重视强化学习代码实践的指导而不是对理论的详细讲解。本书适合具有一定编程基础且希望快速进入实践应用阶段的读者阅读。
品牌:人邮图书
上架时间:2025-04-01 00:00:00
出版社:人民邮电出版社
本书数字版权由人邮图书提供,并由其授权上海阅文信息技术有限公司制作发行
最新章节
江季 王琦 杨毅远
同类热门书
最新上架
- 会员本书分为3个部分:第1章和第2章是人工智能的数学基础,主要介绍了机器学习的概念、Python开发环境的搭建、机器学习bibei的数学知识,以及线性代数和概率论的相关知识;第3~12章主要介绍了回归模型、分类模型、聚类模型、半监督模型的建立和相关算法的理论,以及如何使用sklearn具体实现相关算法模型的搭建;第13章介绍了Spark机器学习,笔者认为对于机器学习,不能只限于Python中的skle计算机0字
- 会员本书是一本面向产品经理的实用新书,分12章探讨如何用ChatGPT提升产品管理工作的效率和质量。第1章介绍了人工智能对产品管理的影响;第2章介绍用ChatGPT提高文档写作效率;第3章介绍用ChatGPT进行竞品和市场分析;第4章介绍用ChatGPT优化需求管理;第5章介绍用ChatGPT分析产品数据;第6章介绍用ChatGPT改进用户体验;第7章介绍用ChatGPT设计产品原型;第8章介绍用Ch计算机11.5万字
- 会员随着Web3.0时代的来临,我国教育领域迎来了一场全面而深刻的变革——AIGC、ChatGPT、大数据、云计算、物联网、数字孪生、元宇宙等新兴技术与教育行业的融合程度日益加深,AI驱动的教育新形态、新模式、新产品不断涌现,数字化、网络化、智能化逐渐成为引领我国教育变革与转型的重要方向。本书立足于全球范围内智慧教育领域的实践经验与前沿趋势,全面阐述AIGC、ChatGPT、元宇宙、数字孪生等新兴技计算机13.8万字
- 会员本书以第一人称视角,讲述AI的来龙去脉,表达AI的技术原理。从历史到未来,跨越百年时空;从理论到实践,解读AI大爆炸;从技术到哲学,穿越多个维度;从语言到绘画,落地实战演练。ChatGPT的诞生,引发了奇点降临,点亮了AGI(通用人工智能),并涉及大模型、深度神经网络、Transformer、AIGC、涌现效应等一系列技术前沿。计算机8.6万字
- 会员现在,AI与多模态技术快速发展,高效创作优质视觉内容已成为核心竞争力,OpenAI推出的GPT-4o为此提供了全新解决方案。本书系统整合一线实战经验,详细讲解GPT-4o从基础操作到多领域应用的108个实战案例、50种绘画风格及6大商业变现路径,并提供全面、详尽的提示词模板与示例,还讲解如何结合DeepSeek优化提示词,可帮助读者缩短创作周期,实现“懒人直出”。本书总计7章。第1章讲解GPT-4计算机4.2万字
- 会员本书共分为10章,涵盖了贝叶斯概率、概率估计、贝叶斯分类、随机场、参数估计、机器学习、深度学习、贝叶斯网络、动态贝叶斯网络、贝叶斯深度学习等。本书涉及的应用领域包含机器学习、图像处理、语音识别、语义分析等。计算机0字
- 会员本书是继《EasyRL:强化学习教程》(俗称“蘑菇书”)之后,为强化学习的读者专门打造的一本深入实践的全新教程。全书大部分内容基于3位作者的实践经验,涵盖马尔可夫决策过程、动态规划、免模型预测、免模型控制、深度学习基础、DQN算法、DQN算法进阶、策略梯度、Actor-Critic算法、DDPG与TD3算法、PPO算法等内容,旨在帮助读者快速入门强化学习的代码实践,并辅以一套开源代码框架“Joy计算机7.8万字