Hadoop大数据实战权威指南（第2版）最新章节全文无弹窗在线阅读-QQ阅读女生现言网

QQ阅读女生短篇网

女生短篇网

达人推广书架浏览历史

登录 | 注册

书籍简介

大数据贵在落实！本书是一本讲解大数据实战的图书，按照“深入分析组件原理、充分展示搭建过程、详细指导应用开发”的指导思想编写。全书分为三篇，第一篇为大数据的基本概念和技术，主要介绍大数据的背景、概念、特性及关键技术；第二篇为Hadoop大数据平台搭建与基本应用，内容涉及Linux、HDFS、MapReduce、Yarn、Hive、HBase、Sqoop、Kafka、Spark等；第三篇为大数据处理与项目开发，包括交互式数据处理、协同过滤推荐系统、销售数据分析系统，并就京东的部分销售数据使用大数据进行处理分析。本书适合初学者入门和进阶，也可供希望全面、系统地理解并掌握大数据实际应用的读者参考，对从事大数据项目开发的专业人员也有参考价值。

上架时间：2019-09-01 00:00:00

出版社：电子工业出版社

上海阅文信息技术有限公司已经获得合法授权，并进行制作发行

最新章节

黄东军

同类热门书

会员

低代码极速物联网开发指南：基于阿里云IoT Studio快速构建物联网项目
数据库
会员

计算机应用基础（微课版）
数据库
会员

云原生数据中台：架构、方法论与实践
数据库
会员

从Lucene到Elasticsearch：全文检索实战
数据库
会员

大数据搜索引擎原理分析
数据库
会员

Visual Studio 2010（C#）Web数据库项目开发
数据库

最新上架

会员
剑指大数据：Flink实时数据仓库项目实战（电商版）
本书从需求规划、需求实现到可视化展示等，遵循项目开发的主要流程，全景介绍了电商行业Flink实时数据仓库的搭建过程。在整个项目的搭建过程中，介绍了主要组件的安装部署、需求实现的具体思路、问题的解决方案等，并穿插了大数据和数据仓库相关的理论知识，包括数据仓库的概念介绍、电商业务概述、数据仓库理论介绍和数据仓库建模等。最核心的内容是代码中对Flink的灵活应用，为读者展示了Flink处理数据的多种可能
尚硅谷教育编著计算机13.1万字
会员
数据要素化时代的数据治理
随着数字化的发展，数据逐渐融入生产、分配、流通、消费和社会服务管理等环节，为数据的拥有者或使用者带来经济效益，成为一种新型的生产要素，给生产方式、生活方式和社会治理方式带来了深刻的变革。本书主要介绍数据要素化时代的数据治理。本书分为5篇。第一篇“数据治理新趋势”介绍DataOps的发展及实践，产业级数据治理新趋势，数据治理的场景化、工程化和智能化，以及数据资产的安全运营。第二篇“新理论、新方法和新
上海市静安区国际数据管理协会编计算机12.1万字
会员
深入浅出Greenplum分布式数据库：原理、架构和代码分析
本书共3篇：第1篇主要介绍分布式数据库基础理论，包括经典的CAP理论、一致性算法相关的理论、并发控制相关的理论等；第2篇具体介绍Greenplum数据库，从分布式事务、分布式计算和分布式存储3个方面，深入代码层级，讲述分布式理论在工业上的实现；第3篇是总结和展望，介绍云原生数据库和新技术带给Greenplum和数据库管理系统的机遇和挑战。本书打破以理论介绍和架构介绍为主的思路，深入分析工业化的实现
王凤刚计算机7.1万字
会员
数据科学技术：文本分析和知识图谱
数据科学的关键技术包括数据存储计算、数据治理、结构化数据分析、语音分析、视觉分析、文本分析和知识图谱等方面。本书的重点是详细介绍文本分析和知识图谱方面的技术。文本分析技术主要包括文本预训练模型、多语种文本分析、文本情感分析、文本机器翻译、文本智能纠错、NL2SQL问答以及ChatGPT大语言模型等。知识图谱技术主要包括知识图谱构建和知识图谱问答等。本书将理论介绍和实践相结合，详细阐述各个技术主题的
苏海波刘译璟易显维苏萌计算机21.6万字
会员
数据质量实践手册：4步构建高质量数据体系
高质量的数据关乎企业运营、合规、决策和业绩的关键，哈佛商业评论的一项研究发现，企业中只有3%的数据符合质量标准，绝大多数公司都在寻求切实可行的指导来提高数据质量。本书作者基于多年在数据、数据分析和人工智能方面的实践经验，阐述了4步构建高质量数据体系。他提出了高质量数据的四阶段DARS方法（定义、评估、实现、持续）和10个数据质量最佳实践案例，以此来提高业务中的数据质量水平，为业务提供数据价值，保证
(美)普拉桑特·苏特卡尔计算机11.7万字
会员
MySQL数据库实用教程
本书瞄准当前高校MySQL数据库教学与实验的需求，在MySQL8.0的基础上编写而成。全书分为两篇。第一篇为MySQL数据库基础，内容包含：数据库基础、MySQL语言、数据定义、数据操纵、数据查询、视图和索引、MySQL编程技术、MySQL安全管理、备份和恢复、事务管理、PHP和MySQL教学管理系统开发。第二篇为MySQL实验，所编排的各个实验与第一篇中的各章（除第10、11章外）内容相对应，
赵明渊唐明伟主编计算机12万字
会员
智能数据治理：基于大模型、知识图谱
本书基于我国深入实施网络强国和国家大数据战略的大背景，将“大语言模型”“知识图谱”“数据治理”相结合，阐述了大模型、知识图谱在智能数据治理中的应用实践，并以医疗、政务及降碳等行业为例，详细介绍了其数据治理流程及平台构建方法。书中首先阐述了大模型时代知识图谱和智能数据治理之间的协同关系，以儿童孤独症为例介绍了基于CiteSpace软件的医疗知识图谱的构建流程；其次详细阐述了基于神经网络模型的个人健康
沈睿芳时希杰易成岐计算机13.1万字
会员
分布式数据库基础与应用
本书是一本介绍分布式数据库基础内容与应用的大数据专业类图书，力求培养读者对分布式数据库的应用技能。本书共11章，采用原理＋代码实例+综合案例的编写形式，清晰明了地介绍分布式数据库的原理、基础应用、进阶应用及主流工具的使用方法、应用场景，以理实结合为编写要求，让读者能够轻松学习和掌握分布式数据库的内容。本书可以作为高等院校计算机、网络技术等相关专业的教材，也可以作为数据库相关工作的从业人员的参考用书
闭应洲许桂秋刘军主编计算机14万字
会员
PySpark大数据分析与应用
本书以Python作为开发语言，系统介绍PySpark开发环境搭建流程及基于PySpark进行大数据分析的相关知识。本书条理清晰、重点突出，理论叙述循序渐进、由浅入深。本书共7章，第1？5章包括PySpark大数据分析概述、PySpark安装配置、基于PySpark的DataFrame操作、基于PySpark的流式数据处理、基于PySpark的机器学习库，内容介绍注重理论与实践相结合，通过典型示例
戴刚张良均主编计算机10.4万字

同类书籍最近更新

会员
Python数据分析与挖掘实战
本书以Python数据分析与挖掘的常用技术与真实案例相结合的方式，深入浅出地介绍Python数据分析与挖掘的重要内容。本书共11章，分为基础篇（第1～5章）和实战篇（第6～11章），基础篇包括数据挖掘基础、Python数据挖掘编程基础、数据探索、数据预处理、数据挖掘算法基础等基础知识；实战篇包括6个案例，分别为信用卡高风险客户识别、餐饮企业菜品关联分析、金融服务机构资金流量预测、O2O优惠券使用预
翟世臣张良均主编数据库13.6万字
会员
MySQL数据库实用教程
本书瞄准当前高校MySQL数据库教学与实验的需求，在MySQL8.0的基础上编写而成。全书分为两篇。第一篇为MySQL数据库基础，内容包含：数据库基础、MySQL语言、数据定义、数据操纵、数据查询、视图和索引、MySQL编程技术、MySQL安全管理、备份和恢复、事务管理、PHP和MySQL教学管理系统开发。第二篇为MySQL实验，所编排的各个实验与第一篇中的各章（除第10、11章外）内容相对应，
赵明渊唐明伟主编数据库12万字

关于腾讯About Tencent服务协议开放平台广告服务腾讯招聘腾讯公益客服中心违规举报

达人推广合作：https://kol.yuewen.com

网站合作：傅女士 fuli.a@yuewen.com

双新用户（设备和账号都新为双新用户）下载并登录后1-20天最多可免费领取20本会员/单订书且可免费读10天

Copyright (C) 2025 cbook.qq.com All Rights Reserved 上海阅文信息技术有限公司版权所有
粤公网安备 44030002000001号增值电信业务经营许可证：粤B2-20090059 互联网ICP备案号：粤B2-20090059-5 沪ICP备14016804号-3 举报电话：010-59357051 营业执照
网络文化经营许可证：沪网文 (2023) 3296-228号网络出版服务许可证：（署）网出证（沪）字第055号互联网宗教信息服务许可证：沪（2023）0000015