
会员
大数据分析处理(慕课版)
教材教辅研究生/本科/专科教材10.1万字
更新时间:2024-04-23 17:44:15 最新章节:项目实践
书籍简介
本书采用理论知识与任务案例相结合的形式,以PyCharm为主要开发工具,系统地阐述了大数据分析处理工作流程中的重要步骤,介绍了大数据分析过程中常用的几种第三方库。本书共13个单元,第1单元介绍了大数据分析处理的概念;第2、3单元介绍了大数据分析中科学计算与统计分析的相关知识;第4-7单元介绍了使用Pandas实现数据预处理的方法;第8单元介绍了使用Scikit-learn实现简单的机器学习的方法;第9单元介绍了使用Matplotlib、Seaborn绘制图表的方法;第10-13单元分别介绍了4个大数据分析处理的综合案例。单元1-9中,每个单元都包含了相关知识部分和任务实现部分,任务实现部分一般包含多个任务的具体实现过程,每个任务后面都有课堂实践,通过完成实践操作,读者可以进一步巩固所学知识。本书既可作为高等院校大数据技术专业的教材,也可作为大数据爱好者的自学书籍。
品牌:人邮图书
上架时间:2024-02-01 00:00:00
出版社:人民邮电出版社
本书数字版权由人邮图书提供,并由其授权上海阅文信息技术有限公司制作发行
最新章节
郭永洪 贺萌主编
最新上架
- 会员人工智能技术在新媒体领域中的应用,不仅极大地提高了新媒体的生产效率,而且让新媒体传播更加精准和智能化。越来越多的企业通过短视频、直播和图文等新媒体平台开展营销内容创作与生产、私域经营和管理、短视频直播带货、广告投放与管理等互联网组合营销活动。本书根据新媒体运营和营销岗位及其要求,聚焦抖音、视频号、小红书等主流的新媒体平台,讲解移动互联网环境下对新媒体职业领域的认知与策划、营销内容的采编与生产、以及教材教辅9.6万字
- 会员本书主要讲解Hadoop的分布式文件系统、MapReduce编程模型和Spark大数据处理技术。全书共12章,具体包括大数据概述、Hadoop大数据处理架构、HDFS分布式文件系统、MapReduce分布式计算框架、HBase分布式数据库、Spark概述、基于Scala的Spark编程、Windows环境下Spark综合编程、SparkSQL结构化数据处理、SparkStreaming流计算、教材教辅9.7万字
- 会员本书以Kettle实现ETL流程为目标,将ETL知识点与任务相结合,配套真实案例,深入浅出地介绍了ETL数据整合与处理的相关内容。全书共8章,第1章介绍了ETL概念和ETL工具,让读者在了解ETL相关的概念后,立刻上手ETL工具Kettle;第2~6章介绍了Kettle工具转换相关的组件,包括源数据获取、记录处理、字段处理、高级转换、迁移和装载等内容,内容与ETL流程匹配,能帮助读者快速掌握ETL教材教辅8.1万字
- 会员本书以任务驱动为主线,围绕企业级应用进行项目任务设计,介绍了平台的本地模式安装、伪分布式模式安装及完全分布式模式安装,并基于Hadoop2.X生态系统,全面讲解了Hive环境搭建与基本操作、ZooKeeper环境搭建与基本操作、HBase环境搭建与基本操作、Hadoop常用工具组件的安装与应用、集群搭建与管理,以及Hadoop平台应用综合案例等相关知识及操作技能。本书具有实用性和可操作性强、语言教材教辅6.2万字