我的购物车 | 我的帐户 | 我的暂存架 | 代查代找 | 联系我们
首页 图书 影视 音乐 期刊 百货
facebook
人物传记 | 中医养生 | 社会小说 | 成功励志 | 中国现当代随笔 | 外国经典小说 | 樊登推荐 | 张爱玲全集 | amazon畅销书—小说 | 理想国译丛 | 南怀瑾全集 | 图书精彩专题 | 著名作家
您现在的位置:首页 - 图书 - 计算机/网络 - 数据库_数据库理论
图书排行榜


暂无大图
自己动手做大数据系统
市场价:¥49.00
会员价:$24.50  VIP价:$23.52
作者:张魁  等著
出版社:电子工业出版社
出版日期:2016年9月    ISBN:9787121295867
版次:1 版    印次:1 次
开本:16开    页数:     装帧:平装
商品所属分类:图书 - 计算机/网络 - 数据库_数据库理论
会员促销价: $23.27 (5% Off)   VIP促销价:$22.34 (9% Off)
7-10个工作日从新泽西发货,免运费,满$39免$3.99包装处理费。了解详情    
预订价: $20.58 (16% Off)
9-12个工作日从新泽西发货,每笔订单不论金额多少,免包装处理费,只收取$6.99运费。此订购适合机构(如图书馆、中文学校等)或者一次性购买较多的顾客。了解详情    
  

商品简介  

内容简介
如果你是一位在校大学生,对大数据感兴趣,也知道使用的企业越来越多,市场需求更是日新月异,但苦于自己基础不够,心有余而力不足;也看过不少大数据方面的书籍、博客、视频等,但感觉进步不大;如果你是一位在职人员,但目前主要使用传统技术,虽然对大数据很有兴趣,也深知其对未来的影响,但因时间不够,虽有一定的基础,常常也是打两天鱼、晒三天网,进展不是很理想。如果你有上述疑惑或遇到相似问题,本书正好比较适合你。本书从OpenStack云平台搭建、软件部署、需求开发实现到结果展示,以纵向角度讲解了生产性大数据项目上线的整个流程;以完成一个实际项目需求贯穿各章节,讲述了Hadoop生态圈中互联网爬虫技术、Sqoop、Hive、HBase组件协同工作流程,并展示了Spark计算框架、R制图软件和SparkRHive组件的使用方法。本书的一大特色是提供了实际操作环境,用户可以在线登录云平台来动手操作书中的数据和代码,登录网址请参考http://www.feiguyun.com/support。
作者简介

张魁
虚拟化工程师,Openstack架构师,苏州某高校云平台架构师,十余年Linux系统运维实践及虚拟化开发经验,4年Linux系统补丁开发经验。先后在美企担任虚拟化应用运维、服务器集群开发运维工程师或系统开发架构师,高校信息中心云平台架构师,主要关注Openstack、Docker及分布式存储等。

张粤磊
DBA、大数据架构师,十余年一线数据处理数据分析实战经验。先后在咨询、金融、互联网行业担任数据平台技术负责人或架构师。主要关注大数据基础平台、大数据模型构建和大数据分析。

刘未昕
从事IT研发和项目管理工作十余年以上。使用多种程序设计语言,目前研究方向主要是大数据生态系统,从事金融、数据仓库等领域研发。五年以上IT行业授课、培训经验,并在多所高校担任外聘讲师。

吴茂贵
运筹学与控制论专业研究生学历。毕业后主要参与数据仓库、商务智能等方面的项目,期间做过数据处理、数据分析、数据挖掘等工作,行业涉及金融、物流、制造业等。近期主要做复杂数据存储、清理、转换等工作,同时在大数据方面也很有兴趣并投入大量时间和精力,且将持续为之。


目录
目 录

第1章 为什么要自己动手做大数据系统\t1
1.1 大数据时代\t1
1.2 实战大数据项目\t2
1.3 大数据演练平台\t2
第2章 项目背景及准备\t4
2.1 项目背景\t4
2.2 项目简介\t4
2.3 项目架构\t4
2.4 操作系统\t5
2.5 数据存储\t7
2.6 数据处理\t8
2.7 开发工具\t9
2.8 调试工具\t10
2.9 版本管理\t10
第3章 大数据环境搭建和配置\t11
3.1 各组件功能说明\t11
3.1.1 各种数据源的采集工具\t12
3.1.2 企业大数据存储工具\t12
3.1.3 企业大数据系统的数据仓库工具\t12
3.1.4 企业大数据系统的分析计算工具\t13
3.1.5 企业大数据系统的数据库工具\t13
3.2 大数据系统各组件安装部署配置\t13
3.2.1 安装的前期准备工作\t13
3.2.2 Hadoop基础环境安装及配置\t15
3.2.3 Hive安装及配置\t21
3.2.4 Sqoop安装及配置\t24
3.2.5 Spark安装及配置\t30
3.2.6 Zookeeper安装及配置\t31
3.2.7 HBase安装及配置\t33
3.3 自动化安装及部署说明\t35
3.3.1 自动化安装及部署整体架构设计\t35
3.3.2 大数据系统自动化部署逻辑调用关系\t36
3.4 本章小结\t43
第4章 大数据的获取\t44
4.1 使用爬虫获取互联网数据\t45
4.2 Python和Scrapy 框架的安装\t45
4.3 抓取和解析招聘职位信息\t47
4.4 职位信息的落地\t51
4.5 两个爬虫配合工作\t53
4.6 让爬虫的架构设计更加合理\t55
4.7 获取数据的其他方式\t57
4.8 使用Sqoop同步论坛中帖子数据\t57
4.9 本章小结\t59
第5章 大数据的处理\t60
5.1 Hive是什么\t60
5.2 为什么使用Hive做数据仓库建模\t60
5.3 飞谷项目中Hive建模步骤\t61
5.3.1 逻辑模型的创建\t62
5.3.2 物理模型的创建\t67
5.3.3 将爬虫数据导入stg_job表\t74
5.4 使用Hive进行数据清洗转换\t77
5.5 数据清洗转换的必要性\t78
5.6 使用HiveQL清洗数据、提取维度信息\t79
5.6.1 使用HQL清洗数据\t79
5.6.2 提取维度信息\t82
5.7 定义Hive UDF封装处理逻辑\t85
5.7.1 Hive UDF的开发、部署和调用\t86
5.7.2 Python版本的UDF\t89
5.8 使用左外连接构造聚合表rpt_job\t92
5.9 让数据处理自动调度\t96
5.9.1 HQL的几种执行方式\t96
5.9.2 Hive Thrift服务\t99
5.9.3 使用JDBC连接Hive\t100
5.9.4 Python调用HiveServer服务\t103
5.9.5 用crontab实现的任务调度\t105
5.10 本章小结\t107
第6章 大数据的存储\t108
6.1 NoSQL及HBase简介\t108
6.2 HBase中的主要概念\t110
6.3 HBase客户端及JavaAPI\t111
6.4 Hive数据导入HBase的两种方案\t114
6.4.1 利用既有的JAR包实现整合\t114
6.4.2 手动编写MapReduce程序\t116
6.5 使用Java API查询HBase中的职位信息\t122
6.5.1 为什么是HBase而非Hive\t122
6.5.2 多条件组合查询HBase中的职位信息\t123
6.6 如何显示职位表中的某条具体信息\t132
6.7 本章小结\t133
第7章 大数据的展示\t134
7.1 概述\t134
7.2 数据分析的一般步骤\t135
7.3 用R来做数据分析展示\t135
7.3.1 在Ubuntu上安装R\t135
7.3.2 R的基本使用方式\t137
7.4 用Hive充当R的数据来源\t139
7.4.1 RHive组件\t139
7.4.2 把R图表整合到Web页面中\t145
7.5 本章小结\t151
第8章 大数据的分析挖掘\t152
8.1 基于Spark的数据挖掘技术\t152
8.2 Spark和Hadoop的关系\t153
8.3 在Ubuntu上安装Spark集群\t154
8.3.1 JDK和Hadoop的安装\t154
8.3.2 安装Scala\t154
8.3.3 安装Spark\t155
8.4 Spark的运行方式\t157
8.5 使用Spark替代Hadoop Yarn引擎\t160
8.5.1 使用spark-sql查看Hive表\t160
8.5.2 在beeline客户端使用Spark引擎\t161
8.5.3 在Java代码中引用Spark的ThriftServer\t163
8.6 对招聘公司名称做全文检索\t168
8.6.1 从HDFS数据源构造JavaRDD\t169
8.6.2 使用Spark SQL操作RDD\t173
8.6.3 把RDD运行结果展现在前端\t174
8.7 如何把Spark用得更好\t175
8.8 SparkR组件的使用\t177
8.8.1 SparkR的安装及启动\t177
8.8.2 运行自带的Sample例子\t179
8.8.3 利用SparkR生成职位统计饼图\t179
8.9 本章小结\t181
第9章 自己动手搭建支撑大数据系统的云平台\t182
9.1 云平台架构\t182
9.1.1 一期云基础平台架构\t182
9.1.2 二期云基础平台架构\t184
9.2 云平台搭建及部署\t185
9.2.1 安装组件前准备\t185
9.2.2 Identity(Keystone)组件\t190
9.2.3 Image(Glance)组件\t198
9.2.4 Compute(Nova)组件\t201
9.2.5 Storage(Cinder)组件\t206
9.2.6 Networking(Neutron)组件\t210
9.2.7 Ceph分布式存储系统\t221
9.2.8 Dashboard(Horizon)组件\t230
9.3 Identity(Keystone)与LDAP的整合\t232
9.4 配置Image组件大镜像部署\t235
9.5 配置业务系统无缝迁移\t236
9.6 本章小结\t237
参考文献\t238

购买该商品的会员还购买过以下商品  
暂无购买信息!

相似商品  
数字信号处理教程(第五版) 经典教材全新改版,20多年畅销不衰,销售六十多万册,700多所高校使用。
数字信号处理教程(第
数据库系统概念 (本科教学版·原书第7版) 数据库领域的殿堂级作品。夯实数据库理论基础,修炼数据库技术内功的之选。
数据库系统概念(本科
大话数据结构 溢彩加强版 超级畅销书彩色升华版,百万读者认可的趣味解读“数据结构+算法”,配合动效PPT课件,动态扫除难点。程杰作品,必属精品。
大话数据结构溢彩加强
QEMU/KVM源码解析与应用 深入剖析系统虚拟化方案QEMU/KVM代码实现全方位探究系统虚拟化中涉及的各种技术细节
QEMU/KVM源码解析与应
SQL入门经典(第5版)(sql语言教程大全,sql+server案例讲解精粹,不可错过的入门宝典!)
SQL入门经典(第5版)(
创业力:创业者的9堂必修课
创业力:创业者的9堂必
数据库实验教程
数据库实验教程
大数据分析:R语言实现(影印版)
大数据分析:R语言实现
基于本体的数字内容数据管理技术
基于本体的数字内容数
IP创新怎样赢?
IP创新怎样赢?
大数据技术基础
大数据技术基础
数据库原理与应用(第3版)
数据库原理与应用(第

战略合作伙伴: 中图在线 中国图书对外推广网 中国出版集团公司 外语教学与研究出版社 壹嘉出版
  首次购物
·如何注册
·如何购买
·如何找到商品
·安全说明

  付款方式
·支票付款
·信用卡付款
·现金帐户余额付款
·优惠券帐户余额付款

  配送问题
·送货方式
·订单运输情况查询
·配送时间及费用
·全球配送

  我的账户
·查看订单
·暂存商品
·优惠券帐户
·现金账户

  售后服务
·退货服务
·换货服务
·缺货商品处理
·产品小知识

  联系方式
·联系我们
·关于我们
Copyright 2003-2024 Timesbook.com Inc.