发表于2024-12-25
真正的好书来自真正的行家,作为国际R语言认证体系的获得者,作者是早一批接触并迷恋R语言的程序员,并将学习研发经验转化成教材呈现出来,请支持原创,支持分享!
DOS时代用汇编语言,Windows时代倡导Windows编程,Internet时代是HTML的天下,进入大数据时代,R语言必须掌握!本书作者作为一名历经四个时代的老程序员,深知学习编程的痛苦与欢乐,结合多年的开发经验完成此书。本书将从无到有地教读者R语言的使用,同时学习本书并不需要统计学基础,在学习编程的过程中,就掌握了一些必要的统计知识。本书完整讲解了几乎所有R语言语法与使用技巧,通过丰富的程序案例讲解,让你事半功倍。
两位作者均获得大数据国际认证
Chapter01基本概念
1-1BigData的起源2
1-2R语言之美2
1-3R语言的起源2
1-4R的运行环境5
1-5R的扩展5
1-6本书的学习目标5
本章习题6
Chapter02第一次使用R
2-1第一次启动R8
2-1-1在MacOS下启动R8
2-1-2在MacOS下启动RStudio8
2-1-3在Windows环境中启动R和RStudio9
2-2认识RStudio环境10
2-3第一次使用R12
2-4R语言的对象设定15
2-5Workspace窗口16
2-6结束RStudio18
2-7保存工作成果19
2-7-1使用save()函数保存工作成果19
2-7-2使用saveimage()函数保存Workspace20
2-7-3下载之前保存的工作20
2-8历史记录21
2-9程序注释22
本章习题24
Chapter03R的基本数学运算
3-1对象命名原则28
3-2基本数学运算28
4
R语言——迈向大数据之路
3-2-1四则运算28
3-2-2余数和整除29
3-2-3次方或平方根29
3-2-4绝对值30
3-2-5exp()与对数30
3-2-6科学符号e31
3-2-7圆周率与三角函数32
3-2-8四舍五入函数32
3-2-9近似函数33
3-2-10阶乘34
3-3R语言控制运算的优先级34
3-4无限大Infinity35
3-5NotaNumber(NaN)36
3-6NotAvailable(NA)37
本章习题39
Chapter04向量对象运算
4-1数值型的向量对象44
4-1-1建立规则型的数值向量对象应使用序列符号44
4-1-2简单向量对象的运算45
4-1-3建立向量对象函数seq()46
4-1-4连接向量对象函数c()47
4-1-5重复向量对象函数rep()48
4-1-6numeric()函数48
4-1-7程序语句跨行的处理49
4-2常见向量对象的数学运算函数50
4-3考虑Inf、-Inf、NA的向量运算53
4-4R语言的字符串数据的属性54
4-5探索对象的属性55
4-5-1探索对象元素的属性55
4-5-2探索对象的结构56
4-5-3探索对象的数据类型57
4-6向量对象元素的存取57
4-6-1使用索引取得向量对象的元素57
4-6-2使用负索引挖掘向量对象内的部分元素58
5
目录
4-6-3修改向量对象元素值59
4-6-4认识系统内建的数据集letters和LETTERS60
4-7逻辑向量(LogicalVector)61
4-7-1基本应用61
4-7-2对Inf、-Inf和缺失值NA的处理63
4-7-3多组逻辑表达式的应用64
4-7-4NOT表达式65
4-7-5逻辑值TRUE和FALSE的运算65
4-8不同长度向量对象相乘的应用66
4-9向量对象的元素名称67
4-9-1建立简单含元素名称的向量对象67
4-9-2names()函数67
4-9-3使用系统内建的数据集islands68
本章习题71
Chapter05处理矩阵与更高维数据
5-1矩阵Matrix78
5-1-1建立矩阵78
5-1-2认识矩阵的属性79
5-1-3将向量组成矩阵81
5-2取得矩阵元素的值82
5-2-1矩阵元素的取得82
5-2-2使用负索引取得矩阵元素83
5-3修改矩阵的元素值84
5-4降低矩阵的维度86
5-5矩阵的行名和列名87
5-5-1取得和修改矩阵对象的行名和列名88
5-5-2dimnames()函数89
5-6将行名或列名作为索引90
5-7矩阵的运算91
5-7-1矩阵与一般常数的四则运算91
5-7-2行(Row)和列(Column)的运算93
5-7-3转置矩阵94
5-7-4%*%矩阵相乘94
5-7-5diag()95
6
R语言——迈向大数据之路
5-7-6solve()96
5-7-7det()97
5-8三维或高维数组97
5-8-1建立三维数组97
5-8-2identical()函数98
5-8-3取得三维数组的元素98
5-9再谈class()函数99
本章习题101
Chapter06因子Factor
6-1使用factor()或asfactor()函数建立因子108
6-2指定缺失的Levels值109
6-3labels参数109
6-4因子的转换110
6-5数值型因子在转换时常见的错误110
6-6再看levels参数111
6-7有序因子(OrderedFactor)112
6-8table()函数113
6-9认识系统内建的数据集114
本章习题116
Chapter07数据框DataFrame
7-1认识数据框120
7-1-1建立第一个数据框120
7-1-2验证与设置数据框的列名和行名121
7-2认识数据框的结构121
7-3取得数据框的内容122
7-3-1一般取得122
7-3-2特殊字符$123
7-3-3再看取得的数据123
7-4使用rbind()函数增加数据框的行数据124
7-5使用cbind()函数增加数据框的列数据125
7-5-1使用$符号126
7-5-2一次加多个列数据126
7-6再谈转置函数t()127
本章习题128
7
目录
Chapter08串行List
8-1建立串行134
8-1-1建立串行对象——对象元素不含名称134
8-1-2建立串行对象——对象元素含名称134
8-1-3处理串行内对象元素的名称135
8-1-4获得串行的对象元素个数136
8-2获得串行内对象的元素内容136
8-2-1使用“$”符号取得串行内对象的元素内容136
8-2-2使用“[[]]”符号取得串行内对象的元素内容137
8-2-3串行内对象的名称也可当索引值137
8-2-4使用“[]”符号取得串行内对象的元素内容138
8-3编辑串行内对象的元素值139
8-3-1修改串行元素的内容139
8-3-2为串行增加更多元素141
8-3-3删除串行内的元素144
8-4串行合并145
8-5解析串行的内容结构146
本章习题148
Chapter09进阶字符串的处理
9-1语句的分割154
9-2修改字符串的大小写154
9-3unique()函数的使用155
9-4字符串的连接155
9-4-1使用paste()函数常见的失败实例1155
9-4-2使用paste()函数常见的失败实例2156
9-4-3字符串的成功连接与collapse参数156
9-4-4再谈paste()函数157
9-4-5扑克牌向量有趣的应用158
9-5字符串数据的排序158
9-6搜索字符串的内容159
9-6-1使用索引值搜索160
9-6-2使用grep()函数搜索160
9-7字符串内容的更改161
9-8正则表达式(RegularExpression)162
8
R语言——迈向大数据之路
9-8-1搜索具有可选择性162
9-8-2搜索分类字符串163
9-8-3搜索部分字符可重复的字符串163
本章习题164
Chapter10日期和时间的处理
10-1日期的设置与使用170
10-1-1asDate()函数170
10-1-2weekdays()函数170
10-1-3months()函数171
10-1-4quarters()函数171
10-1-5Syslocaleconv()函数171
10-1-6SysDate()函数172
10-1-7再谈seq()函数172
10-1-8使用不同格式表示日期173
10-2时间的设置与使用173
10-2-1Systime()函数174
10-2-2asPOSIXct()函数174
10-2-3时间也是可以作比较的175
10-2-4seq()函数与时间175
10-2-5asPOSIXlt()函数175
10-3时间序列177
本章习题180
Chapter11编写自己的函数
11-1正式编写程序184
11-2函数的基本组成184
11-3设计第一个函数185
11-4函数也是一个对象186
11-5程序代码的简化187
11-6return()的功能188
11-7省略函数的大括号189
11-8传递多个函数参数的应用190
11-8-1设计可传递两个参数的函数190
11-8-2函数参数的默认值191
9
目录
11-8-33点参数“”的使用192
11-9函数也可以作为参数194
11-9-1正式实例应用194
11-9-2以函数的程序代码作为参数传送195
11-10局部变量和全局变量195
11-11通用函数(GenericFunction)196
11-11-1认识通用函数print()197
11-11-2通用函数的默认函数198
11-12设计第一个通用函数198
11-12-1优化转换百分比函数199
11-12-2设计通用函数的默认函数200
本章习题202
Chapter12程序的流程控制
12-1if语句208
12-1-1if语句的基本操作208
12-1-2if…else语句210
12-1-3if语句也可有返回值212
12-1-4if…elseif…elseif…else213
12-1-5嵌套式if语句214
12-2递归式函数的设计215
12-3向量化的逻辑表达式217
12-3-1处理向量数据时if…else产生的错误217
12-3-2ifelse()函数217
12-4switch语句219
12-5for循环221
12-6while循环224
12-7repeat循环225
12-8再谈break语句226
12-9next语句227
本章习题228
Chapter13认识apply家族
13-1apply()函数234
13-2sapply()函数236
13-3lapply()函数238
10
R语言——迈向大数据之路
13-4tapply()函数238
13-5iris鸢尾花数据集240
本章习题242
Chapter14输入与输出
14-1认识文件夹248
14-1-1getwd()函数248
14-1-2setwd()函数248
14-1-3filepath()函数248
14-1-4dir()函数248
14-1-5listfiles()函数249
14-1-6fileexist()函数250
14-1-7filerename()函数250
14-1-8filecreate()函数250
14-1-9filecopy()函数250
14-1-10fileremove()函数251
14-2数据输出cat()函数251
14-3读取数据scan()函数253
14-4输出数据write()函数256
14-5数据的输入257
14-5-1读取剪贴板数据257
14-5-2读取剪贴板数据readtable()函数258
14-5-3读取Excel文件数据259
14-5-4认识CSV文件以及如何读取Excel文件数据260
14-5-5认识delim文件以及如何读取Excel文件数据262
14-6数据的输出263
14-6-1writeClipboard()函数263
14-6-2writetable()函数264
14-7处理其他数据265
本章习题272
Chapter15数据分析与处理
15-1复习数据类型276
15-2随机抽样276
15-2-1将随机抽样应用于扑克牌277
11
在DOS时代,我写了AssemblyLanguage。
在Windows时代,我写了WindowsProgrammingUsingC和VisualBasic。
在Internet时代,我写了HTML。
写了许多的书,曾经也想退休……但仍在职场。
今天是BigData时代,我完成了R。
在DOS时代,我在撰写AssemblyLanguage时,完成了汇编语言语法以及完整的DOS和BIOS
应用的相关写作,我深知,这本书是当时最完整的汇编语言教材,我的心情是愉快的。
在Windows时代,我在撰写WindowsProgramming时,完成了几乎所有Windows组件的重新
设计的写作,当初愉快的心情再度涌上心头。
在Internet时代,我在撰写HTML,完成了各类网页功能的几乎所有组件设计的写作,内心有
了亢奋。
现在是BigData时代,若想进入这个领域,R可说是最重要的程序语言,目前R语言的参考
数据不多,现有几本R语言教材均是统计专家所撰写的,内容叙述在R语言部分着墨不多,这
也造成了目前大多数人无法完整学习R语言,就进入BigData的世界,即使会用R语言作数据分
析,对于R的使用也无法全面了解。很多年以来,除了软件改版的书我不再写新书,因缘,我进
入了这个领域,完成了这本R语言著作,这本书的最大特色包括以下几点。。
(1)从无到有一步一步教导读者R语言的使用。
(2)学习本书不需要有统计基础,但在无形中本书已灌输了统计知识给你。
(3)完整讲解所有R语言语法与使用技巧。
(4)丰富的程序实例与解说,让你事半功倍。
坦白说,当年撰写汇编语言时的那种心情愉快亢奋的感觉再度涌上心头,因为我知道这将是
目前R语言最完整的教材。
最后预祝读者们学习顺利!
编者
特别提示
本书作者为台湾著名跨界资深程序员,虽然本书经过了较为细致的本地化工作,但是仍有极个别位置
(主要是图片)存在个别繁体字,见谅!
R语言——迈向大数据之路 下载 mobi pdf epub txt 电子书 格式 2024
R语言——迈向大数据之路 下载 mobi epub pdf 电子书非常不错,买来自学
评分挺快的,习惯性好评,挺好的
评分好
评分学习
评分书的包装真不错,里面也没有破损,是正品
评分主要是r语言基础,大数据算法很少
评分不是正版
评分双十一活动屯书,留着慢慢看,质优价廉
评分非常不错,买来自学
R语言——迈向大数据之路 mobi epub pdf txt 电子书 格式下载 2024