![Spark SQL入门与实践指南在线阅读](https://wfqqreader-1252317822.image.myqcloud.com/cover/764/26793764/b_26793764.jpg)
会员
Spark SQL入门与实践指南
更新时间:2019-12-06 16:38:46 最新章节:9.9 本章小结
书籍简介
SparkSQL是Spark大数据框架的一部分,支持使用标准SQL查询和HiveQL来读写数据,可用于结构化数据处理,并可以执行类似SQL的Spark数据查询,有助于开发人员更快地创建和运行Spark程序。全书分为4篇,共9章,第一篇讲解了SparkSQL发展历史和开发环境搭建。第二篇讲解了SparkSQL实例,使得读者掌握SparkSQL的入门操作,了解SparkRDD、DataFrame和DataSet,并熟悉DataFrame各种操作。第三篇讲解了基于WiFi探针的商业大数据分析项目,实例中包含数据采集、预处理、存储、利用SparkSQL挖掘数据,一步一步带领读者学习SparkSQL强大的数据挖掘功能。第四篇讲解了SparkSQL优化的知识。本书适合Spark初学者、Spark数据分析人员以及Spark程序开发人员,也适合高校和培训学校相关专业的师生教学参考。
品牌:清华大学
上架时间:2018-04-01 00:00:00
出版社:清华大学出版社
本书数字版权由清华大学提供,并由其授权上海阅文信息技术有限公司制作发行
最新章节
纪涵
同类热门书
最新上架
- 会员人本智造(以人为本的智能制造)体现了工业特别是制造业未来发展的重要趋势,是未来工业(工业5.0)的核心使能技术,是新一代智能制造的重要技术方向。本书深入阐述面向工业5.0的人本智造最新研究成果,包括人的数字孪生、人机协同作业、人机团队合作等,以及相关典型案例,展现了当前国内外人本智造领域的技术进展和应用前景。本书是《人本智造:面向新工业革命的制造模式》一书的姊妹篇,可为从事机械制造业科学研究、企业工业9.6万字