从零开始大模型开发与微调:基于PyTorch与ChatGLM在线阅读
会员

从零开始大模型开发与微调:基于PyTorch与ChatGLM

王晓华
开会员,本书免费读 >

计算机网络人工智能12.8万字

更新时间:2024-12-31 17:38:36 最新章节:18.5 本章小结

立即阅读
加书架
下载
听书

书籍简介

大模型是深度学习自然语言处理皇冠上的一颗明珠,也是当前AI和NLP研究与产业中最重要的方向之一。本书使用PyTorch2.0作为学习大模型的基本框架,以ChatGLM为例详细讲解大模型的基本理论、算法、程序实现、应用实战以及微调技术,为读者揭示大模型开发技术。《从零开始大模型开发与微调:基于PyTorch与ChatGLM》共18章,内容包括人工智能与大模型、PyTorch2.0深度学习环境搭建、从零开始学习PyTorch2.0、深度学习基础算法详解、基于PyTorch卷积层的MNIST分类实战、PyTorch数据处理与模型展示、ResNet实战、有趣的词嵌入、基于PyTorch循环神经网络的中文情感分类实战、自然语言处理的编码器、预训练模型BERT、自然语言处理的解码器、强化学习实战、只具有解码器的GPT-2模型、实战训练自己的ChatGPT、开源大模型ChatGLM使用详解、ChatGLM高级定制化应用实战、对ChatGLM进行高级微调。《从零开始大模型开发与微调:基于PyTorch与ChatGLM》适合PyTorch深度学习初学者、大模型开发初学者、大模型开发人员学习,也适合高等院校人工智能、智能科学与技术、数据科学与大数据技术、计算机科学与技术等专业的师生作为教学参考书。
品牌:清华大学
上架时间:2023-11-01 00:00:00
出版社:清华大学出版社
本书数字版权由清华大学提供,并由其授权上海阅文信息技术有限公司制作发行

最新章节

王晓华
主页

同类热门书

最新上架

  • 会员
    DeepSeek是一种生成式人工智能(AI)大模型,擅长处理复杂任务,具有训练效率高、成本低、性能强、开源等优势,吸引了全世界的关注。本书是写给DeepSeek初学者的快速上手实践指南。本书通过项目实例进行讲解,手把手地教读者如何使用DeepSeek。本书共6章,首先对DeepSeek进行概述,包括其成长路线、优势、技术原理、应用场景、应用方式等;其次讲解如何为DeepSeek写提示词,包括结构化
    李强编著计算机3.6万字
  • 会员
    本书全面解析了DeepSeek的崛起历程、技术突破及其对AI行业的深远影响。全书共6章,第1章追溯DeepSeek的起源与发展,展示其从初创到全球爆火的历程;第2章通过“AI领域拼多多”的比喻,分析其低成本、高性能的商业化路径,并深入探讨其核心技术;第3章介绍相关应用方法,包括优化交互方式、调用API服务、本地部署模型等;第4章、第5章分别分析DeepSeek引发的行业变革,以及其AI能力在垂直行
    陈根计算机11.6万字
  • 本书的主题是从通用人工智能的视角来诠释中国的思想。朱松纯教授致力于搭建人文社科与通用人工智能的双向连接,本书是为人文赋“理”,即以人工智能的数理与认知模型诠释中国思想,试图为中国优秀哲学思想构建严格的数理体系,以便中国思想可以在正在到来的智能时代指导社会治理与实践,从而转化成强大的生产力。为此,本书先从智能时代的文明与道路说起,基于文明起源与演化的历程指出演化的关键在于“心”的出现,探索“心”的构
    朱松纯计算机13.7万字
  • 会员
    本书融合作者构建、运维和扩展大型机器学习系统的经验,通过丰富的示例,详细讲解如何运行高效、可靠的机器学习系统。本书首先概述机器学习相关概念和数据管理原则,涵盖数据管理、机器学习模型、评估质量、特征、公平性、隐私等主题;然后介绍机器学习模型及其生命周期;最后讲述如何将机器学习引入组织,以及引入后组织会发生什么等复杂问题。
    (美)凯茜·陈 (爱尔兰)尼尔·理查德·墨菲 (美)克兰蒂·帕里萨 (美)D.斯卡利 (美)托德·安德伍德计算机26.5万字
  • 会员
    本书聚焦通用人工智能的学科内涵与发展趋势,以一套基于“能力与价值双系统”的通用人工智能认知架构与测试模式为核心,梳理形成“一个定义、两个完备性、三个特征、八个关键问题”的理论框架。本书共6章,从人工智能的历史、内涵与哲学基础切入,依次介绍通用人工智能的定义与特征、测试与评级、训练与测试平台,以及TongAI理论框架,最后给出对发展通用人工智能的建议。本书既有助于科技领域的管理者和投资者提纲挈领,把
    朱松纯主编计算机16.4万字
  • 会员
    《DeepSeeK实操指南:引爆AI时代个人效率核聚变》是一本专为职场人士量身打造的AI工具使用指南,旨在帮助读者通过DeepSeek这一强大的AI工具,全面提升工作效率,解锁职场新技能。本书不仅详细介绍了DeepSeek的基础知识和核心优势,还提供了40个实用的职场AI技能,涵盖从文案创作、数据处理到社交媒体运营等多个领域,助力读者在职场中脱颖而出。通过丰富的实操案例和技巧,本书深入讲解了如何运
    苏江 温洁计算机7.4万字
  • 会员
    本书是关于如何从零开始构建大模型的指南,由畅销书作家塞巴斯蒂安·拉施卡撰写,通过清晰的文字、图表和实例,逐步指导读者创建自己的大模型。在本书中,读者将学习如何规划和编写大模型的各个组成部分、为大模型训练准备适当的数据集、进行通用语料库的预训练,以及定制特定任务的微调。此外,本书还将探讨如何利用人工反馈确保大模型遵循指令,以及如何将预训练权重加载到大模型中。
    (美)塞巴斯蒂安·拉施卡计算机13.8万字
  • 会员
    本书全面系统地介绍了字节跳动旗下AI智能助手——豆包的使用方法,涵盖注册登录流程及基本操作要点,并通过丰富多样的学习、工作、生活等场景的应用实例,如化身学习小能手、担当高效职场助手、呈现精彩模拟人物互动等,充分展现了豆包的强大效用。此外,还深入介绍了豆包智能体及其应用实例,以及豆包App的注册/登录方式和便捷功能。随书赠送学习资源,包含50个高效提问公式,40个深度提问模板、100个豆包智能体模板
    何华平编著计算机7.1万字
  • 在技术进步和经济不断发展的当下,越来越多的人开始思考这些问题:当机器人能够顺畅地处理大部分工作时,是否会导致人类大量失业?在大量失业的情况下,人们该如何获得收入,是否会因此感到人生毫无意义,丧失获得快乐的能力?假设人类安全地开发出了超级智能,对它进行了良好的管理,并很好地利用了这项技术所能释放的巨大经济潜力和神奇的变革力量。在这个世界中,人工智能可以做我们能做的一切,而且可以做得更好、更快,成本更
    (英)尼克·博斯特罗姆计算机29.6万字

同类书籍最近更新

  • 《为机器立心》的主题是迈向通用人工智能的中国路线,让AI不再缺“心”,点亮人工智能的“中国时刻”。在书中,朱松纯教授解答了什么是通用人工智能、如何认清智能的本质、如何为人工智能找到统一理论与认知架构,进而为机器立“心”等重要问题。全书共分为两大部分。第一部分“厘清通用人工智能的3大关键迷思”:ChatGPT等大模型无异于缸中之脑;要寻找“乌鸦智能”而不是“鹦鹉智能”;理(U体系)与心(V体系)并非
    朱松纯人工智能11.7万字
  • 本书的主题是从通用人工智能的视角来诠释中国的思想。朱松纯教授致力于搭建人文社科与通用人工智能的双向连接,本书是为人文赋“理”,即以人工智能的数理与认知模型诠释中国思想,试图为中国优秀哲学思想构建严格的数理体系,以便中国思想可以在正在到来的智能时代指导社会治理与实践,从而转化成强大的生产力。为此,本书先从智能时代的文明与道路说起,基于文明起源与演化的历程指出演化的关键在于“心”的出现,探索“心”的构
    朱松纯人工智能13.7万字
  • 如今,人工智能的迅速发展给人们的日常生活和工作带来了巨大的影响。要想让人工智能朝着人类智能的方向持续迈进,我们就应该让我们创造的硅基大脑像人类大脑一样有感知、有记忆、有决策、有行动。问题的难点在于,人类大脑由约1000亿个神经元构成,神经元间交流复杂,大脑掌管认知、意识,影响我们生活的方方面面。我们如何破解如此庞大的复杂系统的运行机制呢?在《心智的10大模型》中,计算神经科学家格蕾丝·林赛深入探讨
    (美)格蕾丝·林赛人工智能19.9万字