發表於2024-12-26
學習如何利用R語言洞察、知曉、理解原始數據。本書介紹瞭R、RStudio以及tidyverse,後者是一組相互配閤工作的R包,能夠使數據科學更快速、流暢、富有樂趣。本書旨在幫助你盡快地上手數據科學相關的工作,並不要求讀者先前具備編程經驗。
作者Hadley Wickham和Garrett Grolemund將一步步指導你對數據進行導入、提煉、探索以及建模並發布成果。除瞭處理數據所需的基本工具,你還將會對數據科學的周期擁有一個完整的、宏觀的理解。
學習如何利用R語言洞察、知曉、理解原始數據。
《數據科學:R語言實現(影印版 英文版)》介紹瞭R、RStudio以及tidyverse,後者是一組相互配閤工作的R包,能夠使數據科學快速、流暢、富有樂趣。
《數據科學:R語言實現(影印版 英文版)》旨在幫助你盡快地上手數據科學相關的工作,並不要求讀者具備編程經驗。
《數據科學:R語言實現(影印版 英文版)》Hadley Wickham和Garrett Grolernund將一步步指導你對數據進行導入、提煉、探索以及建模並發布成果。除瞭處理數據所需的基本工具,你還將會對數據科學的周期擁有一個完整的、宏觀的理解。
Hadley Wickham是RStudio的首席科學傢以及R基金會成員。他構建瞭一套使數據科學變得更加快捷、富有樂趣的工具。可以通過其個人網站瞭解更多的信息:http://hadley.nz。
Garrett Grolemund是一名統計學傢、教師以及RStudio的碩士生導師。他還是《Hands-On Programming with R 》(O'Reilly)一書的作者。Garrett的很多授課視頻可以在oreilly.com/safari上找到。
“Hadley Wickham是數據科學領域的一位傳奇人物,他創造齣瞭一套之前無人想到過的進行數據分析的全新方法。他這本和Garrett Grolemund閤著的新書用代碼展示瞭這種新奇的方法,本書可謂是數據分析方麵的聖經。” —— Roger D.Peng (約翰?霍普金斯大學布隆博格公共衛生學院生物統計學教授)
Preface
Part I. Explore
1. Data Visualization with ggplot2
Introduction
First Steps
Aesthetic Mappings
Common Problems
Facets
Geometric Objects
Statistical Transformations
Position Adjustments
Coordinate Systems
The Layered Grammar of Graphics
2. Workflow: Basics
Coding Basics
What's in a Name?
Calling Functions
3. Data Transformation with dplyr
Introduction
Filter Rows with filter()
Arrange Rows with arrange()
Select Columns with select()
Add New Variables with mutate()
Grouped Summaries with summarize()
Grouped Mutates (and Filters)
4. W0rkfl0w: Scripts
Running Code
RStudio Diagnostics
5. Exploratory Data Analysis
Introduction
Questions
Variation
Missing Values
Covariation
Patterns and Models
ggplot2 Calls
Learning More
6. Workflow: Projects
What Is Real?
Where Does Your Analysis Live?
Paths and Directories
RStudio Projects
Summary
Part II. Wrangle
7. Tibbles with tibble
Introduction
Creating Tibbles
Tibbles Versus data.frame
Interacting with Older Code
8. Data Import with readr
Introduction
Getting Started
Parsing a Vector
Parsing a File
Writing to a File
Other Types of Data
9. Tidy Data with tidyr
Introduction
Tidy Data
Spreading and Gathering
Separating and Pull
Missing Values
Case Study
Nontidy Data
10. Relational Data with dplyr
Introduction
nycflightsl3
Keys
Mutating loins
Filtering loins
loin Problems
Set Operations
11. Strings with stringr
Introduction
String Basics
Matching Patterns with Regular Expressions
Tools
Other Types of Pattern
Other Uses of Regular Expressions
stringi
12. Factors with forcats
Introduction
Creating Factors
General Social Survey
Modifying Factor Order
Modifying Factor Levels
13. Dates and Times with lubridate
Introduction
Creating Date/Times
Date-Time Components
Time Spans
Time Zones
Part III. Program
14. Pipeswith magrittr
Introduction
Piping Alternatives
When Not to Use the Pipe
Other Tools from magrittr
15. Functions
Introduction
When Should You Write a Function?
Functions Are for Humans and Computers
Conditional Execution
Function Arguments
Return Values
Environment
16. Vectors
Introduction
Vector Basics
Important Types of Atomic Vector
Using Atomic Vectors
Recursive Vectors (Lists)
Attributes
Augmented Vectors
17. Iteration with purrr
Introduction
For Loops
For Loop Variations
For Loops Versus Functionals
The Map Functions
Dealing with Failure
Mapping over Multiple Arguments
Walk
Other Patterns of For Loops
Part IV. Model
18. Model Basics with modelr
Introduction
A Simple Model
Visualizing Models
Formulas and Model Families
Missing Values
Other Model Families
19. Model Building
Introduction
Why Are Low-Quality Diamonds More Expensive?
What Affects the Number of Daily Flights?
Learning More About Models
20. Many Models with purrr and broom
Introduction
gapminder
List-Columns
Creating List-Columns
Simplifying List-Columns
Making Tidy Data with broom
Part V. Communicate
21. R Markdown
Introduction
R Markdown Basics
Text Formatting with Markdown
Code Chunks
Troubleshooting
YAML Header
Learning More
22. Graphics for Communication with ggplot2
Introduction
Label
Annotations
Scales
Zooming
Themes
Saving Your Plots
Learning More
23. R Markdown Formats
Introduction
Output Options
Documents
Notebooks
Presentations
Dashboards
Interactivity
Websites
Other Formats
Learning More
24. R Markdown Workflow
Index
數據科學:R語言實現(影印版 英文版) [R for Data Science] 下載 mobi pdf epub txt 電子書 格式 2024
數據科學:R語言實現(影印版 英文版) [R for Data Science] 下載 mobi epub pdf 電子書京東對於圖書運輸可得上點心瞭,書到手全被壓摺瞭,希望改進下包裝,不要簡單的套個塑料袋,用些氣泡包包住
評分友情提示,本書是全英文版的,看起來有點吃力,但內容很詳細,可以看看。
評分很好的一本工具書,之前在圖書館看過,這一次買來收藏
評分這本書是本好書,我很喜歡,做分布式係統必備
評分很多文章推薦這本書,因為是英文的,剛開始猶豫瞭一下,可是最終還是下定決心買瞭一本,發現看起來並不費勁,看來我的英文閱讀能力還可以,書中講的確實不錯,值得學習收藏的一本書。
評分京東物流很快,優惠活動力度很大,一次買瞭好多書,還沒來得及看。
評分*機器學習類銷量第一不是隨隨便便的,首先,這本書原版也是去年剛齣,對於流行的趨勢和和新的算法拿捏得比較好,同時,內容上也是極好的,從算法理論到框架實踐,從主流機器學習算法到深度神經網絡,如果相較於其他書,這本書就是機器學習/深度學習入門書的不二之選,前提是要有一定的英文閱讀能力,現在隻有影印版,相信這麼好的書很快業界會有翻譯版齣來。
評分想買這本書很久瞭,精通這個快遞,速度快,而且裏麵很清晰。
評分不錯,這本書很好,快速入門
數據科學:R語言實現(影印版 英文版) [R for Data Science] mobi epub pdf txt 電子書 格式下載 2024