Spark 3.0大数据分析与挖掘：基于机器学习最新章节全文无弹窗在线阅读-QQ阅读女生幻言网

QQ阅读女生幻言网

女生幻言网

达人推广书架浏览历史

登录 | 注册

书籍简介

Spark作为新兴的、应用范围广泛的大数据处理开源框架，吸引了大量的大数据分析与挖掘从业人员进行相关内容的学习与开发，其中ML是Spark3.0机器学习框架使用的核心。本书用于Spark3.0ML大数据分析与挖掘入门，配套示例源码、PPT课件、数据集、思维导图、开发环境和作者答疑服务。本书共分13章，从Spark3.0大数据分析概述、基础安装和配置开始，依次介绍ML的DataFrame、ML的基本概念，以及协同过滤、线性回归、分类、决策树与随机森林、聚类、关联规则、数据降维、特征提取和转换等数据处理方法；最后通过经典的鸢尾花分析实例，回顾前面的学习内容，实现了一个完整的数据分析与挖掘过程。本书采取实例和理论相结合的方式，讲解细致直观，示例丰富，适合Spark3.0机器学习初学者、大数据分析和挖掘人员，也适合高等院校和培训机构人工智能与大数据相关专业的师生教学参考。

品牌：清华大学

上架时间：2022-03-01 00:00:00

出版社：清华大学出版社

本书数字版权由清华大学提供，并由其授权上海阅文信息技术有限公司制作发行

最新章节

王晓华罗凯靖编著

最新上架

会员
ETL数据整合与处理（Kettle）
本书以Kettle实现ETL流程为目标，将ETL知识点与任务相结合，配套真实案例，深入浅出地介绍了ETL数据整合与处理的相关内容。全书共8章，第1章介绍了ETL概念和ETL工具，让读者在了解ETL相关的概念后，立刻上手ETL工具Kettle；第2~6章介绍了Kettle工具转换相关的组件，包括源数据获取、记录处理、字段处理、高级转换、迁移和装载等内容，内容与ETL流程匹配，能帮助读者快速掌握ETL
王雪松张良均主编计算机8.1万字
会员
Python数据分析、挖掘与可视化从入门到精通
本书分为4篇，第1篇是基础入门篇，主要介绍数据分析与挖掘的基本概念及Python语言的数据分析基础；第2篇是数据分析篇，主要介绍常用的数据分析方法；第3篇是数据挖掘篇，主要介绍常用的数据挖掘方法；第4篇是实战应用篇，介绍两个完整的数据分析与挖掘案例。
熊熙张雪莲编著计算机10.9万字
会员
云计算服务保障体系
云计算是一种商业计算模型，它将计算任务分布在大量计算机构成的资源池上，使用户能够按需获取计算能力、存储空间和信息服务。与以往的计算模式不同，云计算环境下，信息安全和服务保障问题更严重、更突出。本书从云计算的安全技术和服务质量评价两个方面论述云计算服务保障的体系架构，安全技术方面主要阐述了基于可信计算的实时度量、基于角色的数据隔离访问、云节点信任链的动态维护模型与验证机制和多级安全访问控制模型；服务
林果园计算机9.5万字
会员
大数据导论
本书围绕新工科背景下大数据人才培养需求编写，既涵盖了大数据的基础知识，又介绍了大数据分析的相关工具与案例。全书共9章，介绍了大数据采集与预处理、大数据存储与管理、大数据处理与分析、大数据可视化处理流程；重点分析了科大讯飞大数据平台在政务、交通、金融和用户画像等实际场景中的应用，还介绍了大数据实验环境的详细搭建步骤，方便读者快速理解和体验大数据应用技术；最后介绍了大数据治理中法律政策、行业标准建设的
于俊伟母亚双闫秋玲编著计算机14.5万字
会员
云数据中心基础
本教材共介绍7个项目，项目1为云数据中心认知，主要介绍了什么是数据中心、云数据中心的特点、体系结构、云数据中心和传统数据中心的区别、绿色数据的概念以及发展趋势。项目2介绍了云数据中心的规划与设计，主要包括云数据中心的设计建设的指标、基础设施的规划以及云数据中心的优化策略。项目3介绍了云数据中心的硬件选型，主要包括服务器设备、网络设备以及存储设备的介绍和选型。项目4到项目6则重点介绍了虚拟化技术、云
戴经国何丰王国滨郭炳宇姜善永计算机12.1万字
会员
数据要素五论：信息、权属、价值、安全、交易
本书从与数据要素关系最密切的信息、权属、价值、安全、交易等五个维度出发，汇聚不同学科背景的既有文献，整合现有观点，对数据要素的多维特性进行探讨，以丰富人们对数据要素的认知，凝聚共识，澄清数字时代的发展与治理迷思，为未来的相关创新提供起点。
张平文邱泽奇编著计算机14.5万字
会员
Power BI商业数据分析完全自学教程
本书共5篇，分为14章介绍了PowerBI的基本操作、数据导入、数据整理、数据建模、数据可视化分析、数据发布等相关技能。第1篇为基础入门篇（第1-3章），主要针对初学者，从零开始，系统且全面地讲解了PowerBI的入门知识点、基本操作及数据的输入和连接操作。第2篇为数据处理篇（第4-6章），介绍了PowerBI数据的整理操作、表格中行/列数据的管理，以及PowerBI数据的高级处理、M函数的使
凤凰高新教育编著计算机0字
会员
数据挖掘算法实践与案例详解
数据挖掘算法为大数据与人工智能的核心，掌握数据挖掘各算法的编程实现，有助于提升大数据的实践运用能力。本书详细阐述了数据挖掘常用算法与编程实现，同时，本书以多个经典的数据挖掘赛题为案例，详细论述了数据预处理、特征选择、可视化、算法选择等全流程数据挖掘过程的编程实现，有助于提升读者面对实际数据问题时灵活运用各类算法能力。
丁兆云沈大勇徐伟周鋆计算机4.7万字
会员
OLAP引擎底层原理与设计实践
本书分为6篇，共14章。从OLAP核心概念出发，以Presto为例，从整体执行流程到不同SQL的执行原理，力图把OLAP查询的核心流程以一种系统化的方式来给读者讲清楚。第一篇背景知识（第1章和第2章）介绍OLAP的基础知识和Presto相关的背景知识，并给出了后续贯穿全书的SQL代码；第二篇核心原理（第3章和第4章）非常详细地串讲了SQL执行流程，介绍了执行计划的生成和优化；第三篇经典SQL（第5
高英举许一腾计算机19.7万字

关于腾讯About Tencent服务协议开放平台广告服务腾讯招聘腾讯公益客服中心违规举报

达人推广合作：https://kol.yuewen.com

网站合作：傅女士 fuli.a@yuewen.com

双新用户（设备和账号都新为双新用户）下载并登录后1-20天最多可免费领取20本会员/单订书且可免费读10天

Copyright (C) 2025 tbook.qq.com All Rights Reserved 上海阅文信息技术有限公司版权所有
粤公网安备 44030002000001号增值电信业务经营许可证：粤B2-20090059 互联网ICP备案号：粤B2-20090059-5 沪ICP备14016804号-3 举报电话：010-59357051 营业执照
网络文化经营许可证：沪网文 (2023) 3296-228号网络出版服务许可证：（署）网出证（沪）字第055号互联网宗教信息服务许可证：沪（2023）0000015