我的购物车 | 我的帐户 | 我的暂存架 | 代查代找 | 联系我们
首页 图书 影视 音乐 期刊 百货
facebook
人物传记 | 中医养生 | 社会小说 | 成功励志 | 中国现当代随笔 | 外国经典小说 | 樊登推荐 | 张爱玲全集 | amazon畅销书—小说 | 理想国译丛 | 南怀瑾全集 | 图书精彩专题 | 著名作家
您现在的位置:首页 - 图书 - 计算机/网络 - 数据库_数据库理论
图书排行榜


暂无大图
数据科学
市场价:¥49.00
会员价:$24.50  VIP价:$23.52
作者:朝乐门
出版社:清华大学出版社
出版日期:2016年7月    ISBN:9787302436997
版次:1 版    印次:1 次
开本:16开    页数:     装帧:平装
商品所属分类:图书 - 计算机/网络 - 数据库_数据库理论
会员促销价: $23.27 (5% Off)   VIP促销价:$22.34 (9% Off)
7-10个工作日从新泽西发货,免运费,满$39免$3.99包装处理费。了解详情    
预订价: $20.58 (16% Off)
9-12个工作日从新泽西发货,每笔订单不论金额多少,免包装处理费,只收取$6.99运费。此订购适合机构(如图书馆、中文学校等)或者一次性购买较多的顾客。了解详情    
  

商品简介  

内容简介
数据科学是一门新兴的热门科学,国外一流大学纷纷设立同名课程,相应的专业、课程及书籍也深受欢迎。本书是国内第一部系统阐述数据科学的重要专著,填补了国内此领域的空白。本书在结构设计和内容选择上不仅充分借鉴了国外著名大学设立的相关课程以及全球畅销的外文专著,也考虑到了国内相关课程定位与专业人才的培养需求。本书共包括8个部分(基础知识、数据预处理、数据统计、机器学习、数据可视化、数据计算、数据管理以及R编程),既涵盖了数据科学的基本内容,又避免了与相关课程的低级重复。每章设有综合例题,做到理论学习与动手操作相结合。例题均采用R语言完成数据科学的特定任务。每章的首尾配有“导读”与“小结”,便于教师的教学和学生的自学。“习题”部分以主动数据收集和分析的开放题目为主,旨在帮助学生提高自我学习能力。书后附有R语言语法,便于入门的教学与学习。本书可以满足数据科学、计算机科学与技术、管理学、数据统计、数据分析、图情档类等多个专业的老师、学生(含硕士生和博士生)的教学与自学需要。

目录

目录
第1章基础理论

1.1数据

1.1.1数据模型

1.1.2数据维度

1.2大数据

1.2.1内涵与特征

1.2.2大数据时代的新理念

1.2.3大数据时代的新术语

1.3数据科学概述

1.3.1研究目的

1.3.2理论基础

1.3.3研究内容

1.3.4基本流程

1.3.5主要原则

1.3.6典型应用

1.4数据科学家

1.4.1主要任务

1.4.2能力要求

1.4.3常用工具

1.4.4团队工作

1.5数据科学项目

1.5.1角色定义

1.5.2基本流程

1.6应用案例

小结

习题

参考文献及扩展阅读资料

第2章数据预处理

2.1数据质量

2.1.1统计学规律

2.1.2语言学规律

2.1.3数据连续性理论

2.1.4数据鉴别技术

2.1.5探索性数据分析

2.2数据审计

2.2.1预定义审计

2.2.2自定义审计

2.2.3可视化审计

2.3数据清洗

2.3.1缺失数据处理

2.3.2冗余数据处理

2.3.3噪声数据处理

2.4数据变换

2.4.1大小变换

2.4.2类型变换

2.5数据集成

2.5.1基本类型

2.5.2主要问题

2.6其他预处理方法

2.6.1数据脱敏

2.6.2数据归约

2.6.3数据标注

2.7应用案例

小结

习题

参考文献及扩展阅读资料

第3章数据统计

3.1概率分布

3.1.1正态分布

3.1.2卡方分布

3.1.3t分布

3.1.4F分布

3.2参数估计

3.2.1点估计

3.2.2区间估计

3.3假设检验

3.3.1参数检验

3.3.2非参数检验

3.4基本分析方法

3.4.1相关分析

3.4.2回归分析

3.4.3方差分析

3.4.4分类分析

3.4.5聚类分析

3.4.6时间序列分析

3.4.7其他方法

3.5元分析方法

3.5.1加权平均法

3.5.2优化方法

3.6应用案例

小结

习题

参考文献及扩展阅读资料

第4章机器学习

4.1基本概念

4.1.1定义

4.1.2应用

4.2机器学习活动

4.2.1训练经验的选择

4.2.2目标函数的选择

4.2.3目标函数的表示

4.2.4函数逼近算法的选择

4.3机器学习系统

4.3.1执行器

4.3.2评价器

4.3.3泛化器

4.3.4实验生成器

4.4主要类型

4.4.1基于实例学习

4.4.2概念学习

4.4.3决策树学习

4.4.4人工神经网络学习

4.4.5贝叶斯学习

4.4.6遗传算法

4.4.7分析学习

4.4.8增强学习

4.5典型算法

4.5.1KMeans算法

4.5.2KNN算法

4.5.3ID3算法

4.6应用案例

小结

习题

参考文献及扩展阅读资料

第5章数据可视化

5.1主要类型

5.1.1科学可视化

5.1.2信息可视化

5.1.3可视分析学

5.2基本模型

5.2.1顺序模型

5.2.2循环模型

5.2.3分析模型

5.3常用方法

5.3.1视觉编码

5.3.2统计图表

5.3.3图论方法

5.3.4视觉隐喻

5.3.5图形符号学

5.3.6面向领域的方法

5.4视觉编码

5.4.1视觉感知

5.4.2数据类型

5.4.3视觉通道

5.4.4视觉假象

5.5评价与改进

5.5.1测评原则

5.5.2测评流程

5.5.3测评方法

5.6应用案例

小结

习题

参考文献及扩展阅读资料

第6章数据计算

6.1计算模式的演变

6.1.1集中式计算

6.1.2分布式计算

6.1.3网格计算

6.1.4云计算

6.2主流计算框架——MapReduce

6.2.1基本思想

6.2.2实现过程

6.2.3主要特征

6.2.4关键技术

6.5.5下一代MapReduce

6.3主流计算平台——Hadoop MapReduce

6.3.1数据流

6.3.2任务处理

6.3.3技术实现

6.3.4YARN

6.4其他相关计算系统——Hadoop生态系统

6.4.1HDFS

6.4.2Hive

6.4.3Pig

6.4.4Mahout

6.4.5HBase

6.4.6ZooKeeper

6.4.7Flume

6.4.8Sqoop

6.5应用案例

小结

习题

参考文献及扩展阅读资料

第7章数据管理

7.1基本类型

7.1.1关系数据库

7.1.2NoSQL

7.1.3关系云

7.2体系结构

7.2.1MasterSlave结构

7.2.2P2P结构

7.3关键技术

7.3.1数据模型

7.3.2数据分布

7.3.3数据一致性

7.3.4CAP理论与BASE原则

7.3.5视图与物化视图

7.3.6事务与版本戳

7.4典型系统

7.4.1Memcached

7.4.2MongoDB

7.4.3Cassandra

7.4.4HBase

7.5应用案例

小结

习题

参考文献及扩展阅读资料

附录AR语言与R软件

附录B术语索引


购买该商品的会员还购买过以下商品  
暂无购买信息!

相似商品  
数字信号处理教程(第五版) 经典教材全新改版,20多年畅销不衰,销售六十多万册,700多所高校使用。
数字信号处理教程(第
数据库系统概念 (本科教学版·原书第7版) 数据库领域的殿堂级作品。夯实数据库理论基础,修炼数据库技术内功的之选。
数据库系统概念(本科
大话数据结构 溢彩加强版 超级畅销书彩色升华版,百万读者认可的趣味解读“数据结构+算法”,配合动效PPT课件,动态扫除难点。程杰作品,必属精品。
大话数据结构溢彩加强
QEMU/KVM源码解析与应用 深入剖析系统虚拟化方案QEMU/KVM代码实现全方位探究系统虚拟化中涉及的各种技术细节
QEMU/KVM源码解析与应
SQL入门经典(第5版)(sql语言教程大全,sql+server案例讲解精粹,不可错过的入门宝典!)
SQL入门经典(第5版)(
大数据分析:R语言实现(影印版)
大数据分析:R语言实现
创业力:创业者的9堂必修课
创业力:创业者的9堂必
数据库原理与应用(第3版)
数据库原理与应用(第
数据库实验教程
数据库实验教程
自己动手做大数据系统
自己动手做大数据系统
IP创新怎样赢?
IP创新怎样赢?
精通区块链 第2版(影印版)
精通区块链第2版(影印

战略合作伙伴: 中图在线 中国图书对外推广网 中国出版集团公司 外语教学与研究出版社 壹嘉出版
  首次购物
·如何注册
·如何购买
·如何找到商品
·安全说明

  付款方式
·支票付款
·信用卡付款
·现金帐户余额付款
·优惠券帐户余额付款

  配送问题
·送货方式
·订单运输情况查询
·配送时间及费用
·全球配送

  我的账户
·查看订单
·暂存商品
·优惠券帐户
·现金账户

  售后服务
·退货服务
·换货服务
·缺货商品处理
·产品小知识

  联系方式
·联系我们
·关于我们
Copyright 2003-2024 Timesbook.com Inc.