数据科学概论/数据科学与大数据技术丛书

数据科学概论/数据科学与大数据技术丛书 下载 mobi epub pdf 电子书 2024


简体网页||繁体网页
覃雄派 著



点击这里下载
    


想要找书就要到 图书大百科
立刻按 ctrl+D收藏本页
你会得到大惊喜!!

发表于2024-11-05

类似图书 点击查看全场最低价

图书介绍

出版社: 中国人民大学出版社
ISBN:9787300252926
版次:1
商品编码:12318863
包装:平装
丛书名: 数据科学与大数据技术丛书
开本:16开
出版时间:2018-01-01
用纸:胶版纸
页数:576


相关图书





图书描述

内容简介

  数据科学是一门正在兴起的学科,国内外各个大学开始开设数据科学课程或类似课程,并且编写配套教材。我们的教材在内容上按照四大模块进行组织,分别是数据科学基础、数据以及数据上的计算(分析)、数据处理基础设施/平台和工具、以及大数据的案例和实践。我们认为这样的组织,使得内容体系相对完整。

作者简介

  覃雄派(1971?),男,博士,中国人民大学信息学院讲师、硕士生导师,目前主要从事高性能数据库、大数据分析、信息检索等方面的研究工作,主持1项国家自然科学基金面上项目,参与多项国家“863”计划、“973”计划及国家自然科学基金项目,在国内外期刊和会议上发表论文20余篇。
  陈跃国(1978?),男,博士,中国人民大学信息学院副教授、博士生导师,中国计算机学会高级会员,数据库专家委员会委员,大数据专家委员会通信委员,FrontiersofComputerScience青年编委,主要研究方向为大数据分析系统和语义搜索。主持国家自然科学基金项目2项,广东省科技应用重大专项1项,参与多项国家核高基(核心电子器件、高端通用芯片及基础软件产品)、“973”计划、“863”计划项目,近年来在SIGMOD、SIGIR、ICDE、AAAI、IEEETKDE、WWW等国际重要期刊和会议上发表论文30余篇
  杜小勇(1963?),男,博士,中国人民大学信息学院教授,博士生导师,教育部数据工程与知识工程重点实验室主任,中国计算机学会会士,《大数据》期刊编委会副主任。主要研究方向为智能信息检索、高性能数据库、知识工程。主持和参与多项国家核高基(核心电子器件、高端通用芯片及基础软件产品)、“973”计划、“863”计划、国家自然科学基金项目,近年来在SIGMOD、VLDB、AAAI、IEEETKDE等国际重要期刊和会议上发表论文百余篇。

目录

理论篇//

1 数据科学概论

1.1 数据科学的定义

1.2 数据科学的定位

1.2.1 数据科学与数据库、大数据分析的关系

1.2.2 数据科学与基于数据的决策的关系

1.3 数据科学家

1.3.1 数据科学家的技能

1.4 数据科学的基本原则(Principle)

1.4.1 原则1:数据分析可以划分成一系列明确的阶段

1.4.2 原则2:描述性分析与预测性分析

1.4.3 原则3:实体的相似度

1.4.4 原则4:模型的泛化能力

1.4.5 原则5:分析结果的评估与特定应用场景有关

1.4.6 原则6:相关性不同于因果关系

1.4.7 原则7:通过并行处理提高数据处理(分析)速度

1.5 数据处理流程:时间维度的纵向视角

1.6 数据处理系统的架构:系统维度的计算视角

1.6.1 数据处理系统的层次架构

1.6.2 数据处理系统的Lambda架构

1.7 数据的多样性:数据类型维度的横向视角

1.8 数据价值的挖掘:价值维度的价值提升视角

1.9 思考题

2 OLTP与数据服务

2.1 面向OLTP应用的RDBMS数据库技术

2.1.1 关系数据库技术与SQL查询语言

2.1.2 利用索引加快数据访问

2.1.3 数据库的事务处理、恢复技术与安全保证

2.1.4 并行数据库与分布式数据库

2.2 面向数据服务的NoSQL数据库技术

2.2.1 NoSQL数据库技术

2.2.2 CAP理论

2.2.3 Key-Value数据库

2.2.4 Column Family数据库

2.2.5 Document数据库

2.2.6 Graph数据库

2.3 NewSQL数据库技术

2.3.1 VoltDB数据库

2.3.2 Google Spanner数据库

2.4 思考题

3 OLAP与结构化数据分析

3.1 联机分析处理(OLAP)与结构化数据分析

3.1.1 从操作型的业务数据库向数据仓库抽取、转换和装载数据

3.1.2 数据仓库与星型模型

3.1.3 联机分析处理OLAP

3.1.4 三种类型的OLAP系统

3.2 高性能OLAP系统的关键技术

3.2.1 列存储技术

3.2.2 位图索引技术

3.2.3 内存数据库技术

3.2.4 MPP并行数据库

3.3 结构化数据分析工具介绍

3.3.1 MPP(Shared-Nothing)数据库、基于列存储的关系数据库

3.3.2 SQL on Hadoop系统

3.3.3 性能比较

3.4 思考题

......


数据科学概论/数据科学与大数据技术丛书 下载 mobi epub pdf txt 电子书 格式

数据科学概论/数据科学与大数据技术丛书 mobi 下载 pdf 下载 pub 下载 txt 电子书 下载 2024

数据科学概论/数据科学与大数据技术丛书 下载 mobi pdf epub txt 电子书 格式 2024

数据科学概论/数据科学与大数据技术丛书 下载 mobi epub pdf 电子书
想要找书就要到 图书大百科
立刻按 ctrl+D收藏本页
你会得到大惊喜!!

用户评价

评分

评分

评分

评分

评分

评分

评分

评分

评分

类似图书 点击查看全场最低价

数据科学概论/数据科学与大数据技术丛书 mobi epub pdf txt 电子书 格式下载 2024


分享链接








相关图书


本站所有内容均为互联网搜索引擎提供的公开搜索信息,本站不存储任何数据与内容,任何内容与数据均与本站无关,如有需要请联系相关搜索引擎包括但不限于百度google,bing,sogou

友情链接

© 2024 book.teaonline.club All Rights Reserved. 图书大百科 版权所有