从零开始学R数据分析,数据描述与统计

从零开始学R数据分析,数据描述与统计在前面的章节 学习 R 数据分析的内容 主要包含数据概览 数据清洗 数据预处理 数据筛选的内容 这一节主要介绍数据描述的内容 包含描述统计 标准差 协方差和相关系数的使用方法 以及数据汇总内容 下面一起来学习 示例工具 R x64 3 5

欢迎大家来到IT世界,在知识的湖畔探索吧!

在前面的章节,学习R数据分析的内容,主要包含数据概览、数据清洗、数据预处理、数据筛选的内容,这一节主要介绍数据描述的内容,包含描述统计、标准差、协方差和相关系数的使用方法,以及数据汇总内容,下面一起来学习。

示例工具:R x64 3.5.3、RStudio

本文讲解内容:数据描述与汇总

适用范围:数据描述、数据汇总

从零开始学R数据分析,数据描述与统计



欢迎大家来到IT世界,在知识的湖畔探索吧!

本次内容的学习需要先创建一组数据集,数据内容包含”ID”、”NAME”等五个字段,数据结果如下。

#手动创建数据表data data<-data.frame(ID=c("c001","c002","c003","c004","c005","c006","c007","c008","c009","c010"), NAME=c("Rmesh","Khilan","Kaushik","Chaitali","Hardik","Komal","Tom","Muffy","Susan","Kevin"), AGE=c(23,20,23,25,27,24,26,31,26,30), ADDRESS=c("Ahmed","Delhi","Kota","Mumbai","Bhopal","MP-A","MP-B","Indore","JP-No.1","JP-No.2"), SAL=c(2000,1500,2000,5000,8500,6500,5500,9500,7000,9000))

欢迎大家来到IT世界,在知识的湖畔探索吧!

从零开始学R数据分析,数据描述与统计

一、数据描述

在Excel中,我们使用数据分析工具箱,即可对数据做描述统计、协方差、相关系数等分析,操作较为简单。

从零开始学R数据分析,数据描述与统计

在R中使用summary函数对数据描述统计,summary函数是进行描述统计的函数,自动生成数据的数量,均值,标准差等数据,如下是对手动创建数据表data做描述统计。

在数据表data中,除”AGE”、”SAL”其他三个字段是非数值型字段,所以没有描述统计结果,而”AGE”、”SAL”两个数值型字段计算的描述统计结果如下所示:

欢迎大家来到IT世界,在知识的湖畔探索吧!#数据表描述统计 summary(data)
从零开始学R数据分析,数据描述与统计

除了对整个数据表data做描述统计,还可以对某一个数据列单独做描述统计,如下将SAL列索引出来,然后使用summary函数做描述统计。

#特定列描述统计 summary(data$SAL)
从零开始学R数据分析,数据描述与统计

对数据计数使用length函数,如下对整个数据表计数。

欢迎大家来到IT世界,在知识的湖畔探索吧!#数据表计数 length(data)
从零开始学R数据分析,数据描述与统计

还可以对数据表索引出某一列计数。

#特定列计数 length(data$SAL)
从零开始学R数据分析,数据描述与统计

求和使用sum函数,这里对收入求和。

欢迎大家来到IT世界,在知识的湖畔探索吧!#求和 sum(data$SAL)
从零开始学R数据分析,数据描述与统计

求平均收入使用mean函数。

#均值 mean(data$SAL)
从零开始学R数据分析,数据描述与统计

求收入的最大值使用max函数。

欢迎大家来到IT世界,在知识的湖畔探索吧!#最大值 max(data$SAL)
从零开始学R数据分析,数据描述与统计

求收入的最小值使用min函数。

#最小值 min(data$SAL)
从零开始学R数据分析,数据描述与统计

求年龄的方差使用var函数。

欢迎大家来到IT世界,在知识的湖畔探索吧!#方差 var(data$AGE)
从零开始学R数据分析,数据描述与统计

求年龄的标准差使用sd函数。

#标准差 sd(data$AGE)
从零开始学R数据分析,数据描述与统计

二、数据汇总

数据汇总内容包含数据分组和数据透视,在R中进行数据汇总的方法有很多,这里主要介绍table函数和tapply函数,下面分别介绍这两个函数的使用方法,使用table函数对薪水的分布情况计数。

欢迎大家来到IT世界,在知识的湖畔探索吧!#使用table()函数进行汇总计数 table(data$SAL)
从零开始学R数据分析,数据描述与统计

使用table函数 ,将年龄作为行字段,薪水情况作为列字段进行计数,类似EXCEL中的数据透视功能,汇总依据是计数。

#使用table()函数对两个字段进行汇总计数 table(data$AGE,data$SAL)
从零开始学R数据分析,数据描述与统计

除了汇总依据是计数,还可以将汇总的依据变为求和,使用tapply函数,对每个人的收入进行汇总,数据结果如下:

欢迎大家来到IT世界,在知识的湖畔探索吧!#按人名对薪资求和汇总 tapply(data$SAL,data$NAME,sum)
从零开始学R数据分析,数据描述与统计

如果是计数,在tapply函数中使用length函数,即对该字段计数。

#按年龄对ID计数汇总 tapply(data$ID,data$AGE,length)
从零开始学R数据分析,数据描述与统计

免责声明:本站所有文章内容,图片,视频等均是来源于用户投稿和互联网及文摘转载整编而成,不代表本站观点,不承担相关法律责任。其著作权各归其原作者或其出版社所有。如发现本站有涉嫌抄袭侵权/违法违规的内容,侵犯到您的权益,请在线联系站长,一经查实,本站将立刻删除。 本文来自网络,若有侵权,请联系删除,如若转载,请注明出处:https://itzsg.com/97623.html

(0)
上一篇 7小时前
下一篇 7小时前

相关推荐

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

联系我们YX

mu99908888

在线咨询: 微信交谈

邮件:itzsgw@126.com

工作时间:时刻准备着!

关注微信