当前位置:蜗牛素材网>综合资讯>科技>正文

用r做数据统计分析:从零开始学R数据分析数据可视化

人气:359 ℃/2024-03-04 05:34:55

R软件具有丰富的作图功能,通过借助第三方包,比如gplot、ggplot2、lattice等可视化包,可以实现数据可视化功能,在使用R软件可视化之前需要提前先下载好包,然后加载使用,调用可视化包里面的函数功能,使用ggplot2包做出的图像如下所示。

示例工具:R x64 3.5.3、RStudio

本文讲解内容:数据可视化

适用范围:数据可视化作图

创建数据集

本节介绍使用R的基础功能作图,首先创建一组数据集,数据内容包含"ID"、"NAME"等五个字段,数据结果如下。

#手动创建数据表datadata<-data.frame(ID=c("c001","c002","c003","c004","c005","c006","c007","c008","c009","c010"), NAME=c("Rmesh","Khilan","Kaushik","Chaitali","Hardik","Komal","Tom","Muffy","Susan","Kevin"), AGE=c(23,20,23,25,27,24,26,31,26,30), ADDRESS=c("Ahmed","Delhi","Kota","Mumbai","Bhopal","MP-A","MP-B","Indore","JP-No.1","JP-No.2"), SAL=c(2000,1500,2000,5000,8500,6500,5500,9500,7000,9000))

基础绘图函数

基础的绘图函数如下所示,下面一一介绍其函数功能。

  • plot():绘制散点图;
  • title():给图片加标题;
  • xlab()、ylab():给X、Y轴添加标签;
  • text():在图形内增加文本标签;
  • legend():用于添加图例。

plot函数

plot函数是一个泛型函数,可以绘制出不同的图形,对数值型数据,可以绘制散点图,对分类数据,可以绘制箱线图,对一些统计模型,可以绘制出相应的统计图形,如下使用plot函数绘制年龄与收入的散点图。

#散点图plot(data$AGE,data$SAL)

做出散点图如上所示,从员工年龄和收入的关系来看,随着年龄的增长,收入逐渐增加,员工收入与年龄呈正相关 。

如果要改变散点的颜色,可以使用col参数,设置颜色即可,做出的散点图如下所示。

plot(data$AGE,data$SAL,col="red")

title函数

title函数用于修改图片的标题,cex 表示相对于默认大小缩放倍数的数值,col标题的颜色,font用于指定绘图使用的字体样式,当1=常规,2=粗体,3=斜体,4=粗斜体,5=符号字体,这里使用蓝色粗体的标题。

plot(data$AGE,data$SAL,title(main = list("年龄与收入关系散点图", cex = 1.2,col = "blue", font = 2)))

xlab、ylab函数

xlab()、ylab()函数用于给横坐标和纵坐标添加坐标轴标题,这里横坐标命名为"年龄",纵坐标命名为"收入"。

plot(data$AGE,data$SAL,title(main = list("年龄与收入关系散点图", cex = 1.2,col = "blue", font = 2)),xlab='年龄',ylab='收入')

text函数

text()函数用于添加数据标签,其中pch参数用于更改数据标签的颜色,这里pch=2,表示使用三角符号用于数据标签的形状,常用的数据标签形状的参数如下所示。

使用text参数添加数据标签,adj参数用于调整各个数据标签的位置。

plot(data$AGE,data$SAL,main = "年龄与收入关系散点图",xlab='年龄',ylab='收入',pch=2,col = "red",text(data$AGE,data$SAL,labels=data$NAME,adj=c(1.2,0)))

legend函数

使用legend()函数添加图表图例,"topleft"表示显示位置在左上方,图例命名为"收入",标注为三角符号,图例主题命名为"图例"。

plot(data$AGE,data$SAL,main = "年龄与收入关系散点图",xlab='年龄',ylab='收入',pch=2,col = "red",text(data$AGE,data$SAL,labels=data$NAME,adj=c(1.2,0)))legend("topleft",c("收入"),pch = c(2),title="图例")

关于图表的参数设置基本是相似的,如下是比较常见的一些R图表,包含条形图、直方图、饼图、箱线图等。

barplot函数用于绘制条形图。

#条形图barplot(table(data$SAL))

hist函数用于绘制直方图。

#直方图hist(data$SAL)

pie函数用于绘制饼图。

#饼图pie(table(data$SAL))

boxplot函数用于绘制箱线图。

#箱线图boxplot(data$SAL)

par函数

在R绘图时,有时在一个绘图区中同时绘制多幅图,在R语言中可以有多个函数来实现此要求,R中的par()函数可以将绘图区分割成规则的几个部分,多图环境用参数mfrow或参数mfcol来设定。

比如这里par(mforw=c(2,2))则是在同一绘图区中绘制2行2列共4个图形,而且是先按行绘制,即绘制完第1行的2个图形后,再绘制第2行的2个图形,绘制的图形效果如下。

par(mfrow = c(2, 2))#散点图plot(data$AGE,data$SAL)#条形图barplot(table(data$SAL))#饼图pie(table(data$SAL))#饼图boxplot(data$SAL)

搜索更多有关“用r做数据统计分析:从零开始学R数据分析数据可视化”的信息 [百度搜索] [SoGou搜索] [头条搜索] [360搜索]
本网站部分内容、图文来自于网络,如有侵犯您的合法权益,请及时与我们联系,我们将第一时间安排核实及删除!
CopyRight © 2008-2024 蜗牛素材网 All Rights Reserved. 手机版