博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
R语言数据分析系列之五
阅读量:7078 次
发布时间:2019-06-28

本文共 1974 字,大约阅读时间需要 6 分钟。

R语言数据分析系列之五

—— 

本节来讨论一下R语言的基本图形展示,先来看一张效果图吧。

这是一张用R语言生成的,虚拟的wordcloud云图,详细实现细节请參见我的github项目:

好了我们開始今天的旅程吧:

本节用到的包有:RColorBrewer用来生成序列颜色值, plotrix三维图形

本节用到的数据集:vcd包中的Arthritis数据集

 

数据集

install.packages("vcd")library('vcd')install.packages(plotrix) #将图形包也一并安装了library(plotrix)data(package='vcd') # 查看vcd包得所有数据集

class(Arthritis) # 查看数据集类型names(Arthritis) # 查看列名arth <- Arthritis # 复制一份arth[1:10,] #查看前10行数据

柱状图

#该数据集最后一列Improved为因子型数据。table(arth$Improved) #查看因子水平的count值col <- c(brewer.pal(9,'YlOrRd')[1:9])  #设置颜色序列barplot(table(arth$Improved),col=col,xlab='improved',ylab='count',main='StatisticsOf Improved')  #绘制柱状图

 

barplot(table(arth$Improved),col=col,horiz=T,xlab='count',ylab='improved',main='StatisticsOf Improved')  #水平柱状图

 

 

 

barplot(counts,col=col,legend=rownames(counts),width=0.1)  #堆砌条形图

 

barplot(counts,col=col[1:3],legend=rownames(counts),width=0.1,beside=T)#分组条形图

 

 

饼图

par(mfrow=c(1,2)) # 定义横向画布,两格布局label <- c('壮年','中年','长辈','老年')ages <- cut(arth$Age,breaks=c(20,30,50,70,100),labels=label)#将年龄数据离散化pie(table(ages),family='STKaiti') # 画出饼图  pie(table(ages),labels=paste(levels(ages),':',round(table(ages)/sum(table(ages))*100,2),'%'),family='STKaiti',main='关节炎发病率年龄段占比')

pie3D(table(ages),labels= paste(round(table(ages)/sum(table(ages))*100,2),'%'),family='STKaiti',main='关节炎发病率年龄段占比',explode=0.1)# 3D 饼图

 

 

直方图

我们採用mtcars数据集来进行图形绘制:

h <- hist(mtcars$mpg,breaks=12,col=col,freq=F,xlab='MilesPer Gallon',main='Histogram Of Car Gallon,Density curve') # 绘制直方图lines(density(mtcars$mpg),col='blue',lwd=2)#加入核密度图

 

 

假设要单独绘制和密度图的话能够这样:

plot(density(mtcars$mpg),main='DensityOf  Car Gallon')

 

图中我们能够看到,我们得核密度函数採用的高斯核,方差为2.477。样本採样为32个。

 

 

箱型图

箱线图。通过绘制连续型变量的五数总括,即最小值(相应图中最以下那条线)、下四分位数(相应第二条线)、中位数(相应最中间那条线)、上四分位数(相应箱子上边沿) 以及最大值(相应最上面那条线),描写叙述了连续型变量的分布。

而且能够将离群点列出。

比如我们还拿mtcars数据集,当中mpg是每百公里油耗。cyl是发动机汽缸数。要对照不同得汽缸数对每加仑汽油行驶的公里数的影响就能够这样作图:

boxplot(mpg ~ cyl,data=mtcars,main='Car Milage Data',xlab='Number Of Cylinder',ylab='Miles Per Gallon')

从图中我们能够明显看到。4缸发动机有效利用率最高。6缸的最稳定,8缸利用率低且不够稳定。

 

 

 

 

你可能感兴趣的文章
WWDC 2015大会十大看点总结:Swift要开源了
查看>>
墨瞳漫画 升级vue2 踩坑
查看>>
I/O重定向和管道
查看>>
MindFusion.WinForms Pack v2016.R2发布
查看>>
为什么 NSLog 不支持 Swift 对象
查看>>
如何优雅的选择字体(font-family)
查看>>
为 Koa 框架封装 webpack-dev-middleware 中间件
查看>>
深入浅出JavaScript:理解函数
查看>>
将群晖 NAS 安全地暴露到公网中
查看>>
【二次元的CSS】—— 用 DIV + CSS3 画咸蛋超人(详解步骤)
查看>>
Android程序逆向分析
查看>>
在阿里云centOS环境下搭建基于thinkphp的网站
查看>>
RegEx 快速掌握最基本的正则语法
查看>>
过去的2015年
查看>>
Webpack + React 开发之路
查看>>
【译】使用 AngularJS 和 Electron 构建桌面应用
查看>>
【经验总结】记一次艰难的居中--日历榜单
查看>>
所有博客将会誊到http://www.xumenger.com/
查看>>
Jodd 5.0.8 发布,Java 常用工具包
查看>>
某网页数据爬取记录
查看>>