/ 小明的数据分析笔记本_R语言ggplot2散点图添加拟合曲线和回归方程的简单小例子

小明的数据分析笔记本_R语言ggplot2散点图添加拟合曲线和回归方程的简单小例子

由Punicagranatum发表于2021-07-20 18:06:27

本篇推文来自于公众号读者的投稿

最近在画散点图的时候使用lm函数进行线性回归拟合之后,想将拟合的方程与R2加入到绘制的图片中。在百度中翻了半天,终于在一个外国网站上找到了方法。下面我把这个方法介绍给大家。

参考链接是

https://stackoverflow.com/questions/7549694/add-regression-line-equation-and-r2-on-graph

首先是模拟一份数据集
df<-data.frame(x = c(1:100))
df$y <- 2 + 3 * df$x + rnorm(100, sd = 40)
head(df)
ggplot2基本的散点图并添加拟合曲线
library(ggplot2)
p <- ggplot(data = df, aes(x = x, y = y)) +
  geom_smooth(method = "lm", se=FALSE, 
              color="black", formula = y ~ x) +
  geom_point()
p
image.png

题外话:有读者在公众号留言说R语言做出来的图有锯齿,应该是在Rstudio那个图形显示界面就是这个,如果导出图片后就会变得清楚了,这里为什么在Rstudio的图形显示界面会不清楚 我也不知道

如果要显示95%置信区间,可以将se参数的FALSE改为TRUE
p <- ggplot(data = df, aes(x = x, y = y)) +
  geom_smooth(method = "lm", se=TRUE, 
              color="black", formula = y ~ x) +
  geom_point()+
  theme_bw()
p
image.png
添加拟合方程和R2

这里他的办法是自定义了一个函数,这个函数看起来还挺复杂的,先不用管这个函数的意思了 ,直接复制过来用就可以了

lm_eqn <- function(df){
  m <- lm(y ~ x, df);
  eq <- substitute(italic(y) == a + b %.% italic(x)*","~~italic(r)^2~"="~r2, 
                   list(a = format(unname(coef(m)[1]), digits = 2),
                        b = format(unname(coef(m)[2]), digits = 2),
                        r2 = format(summary(m)$r.squared, digits = 3)))
  as.character(as.expression(eq));
}

p1 <- p + 
  geom_text(x = 25, y = 300, 
            label = lm_eqn(df), parse = TRUE)
p1
image.png
第二种方法 现成的R包 ggpmisc

加载R包,模拟数据集

library(ggplot2)
library(ggpmisc)

df <- data.frame(x = c(1:100))
df$y <- 2 + 3 * df$x + rnorm(100, sd = 40)
head(df)

这里添加拟合方程用到的是 stat_poly_eq()这个函数

library(ggplot2)
library(ggpmisc)

df <- data.frame(x = c(1:100))
df$y <- 2 + 3 * df$x + rnorm(100, sd = 40)
head(df)

my.formula <- y ~ x
ggplot(data = df, aes(x = x, y = y)) +
  geom_smooth(method = "lm", se=FALSE, 
              color="black", formula = my.formula) +
  stat_poly_eq(formula = my.formula, 
               aes(label = paste(..eq.label..,
                                 ..rr.label..,
                                 sep = "~~~")), 
               parse = TRUE) +         
  geom_point()
image.png
最后是调整细节进行美化
  • 点的大小与颜色,透明度
  • 拟合曲线相关颜色,粗细与填充
  • 去掉背景网格线

代码

ggplot(data = df, aes(x = x, y = y)) +
  geom_smooth(method = "lm"
              se=FALSE, color="black"
              formula = my.formula) +
  stat_poly_eq(formula = my.formula, 
               aes(label = paste(..eq.label.., 
                                 ..rr.label.., 
                                 sep = "~~~")), 
               parse = TRUE) +         
  geom_point(size=4,
             alpha=0.7,
             color="#fe654c")+
  coord_cartesian(ylim = c(0,320),
                  xlim = c(0,105))+
  scale_y_continuous(breaks = c(0,100,200,300))+
  scale_x_continuous(breaks = c(0,25,50,75,100,105))+#x轴比上个图多个105
  theme_bw()+
  geom_smooth(method = "lm",
              color="#558ebd",
              fill="lightgray",
              alpha=.7,
              size=0.8,se=T,
              formula = y~x)+
  theme(panel.grid = element_blank())

最终出图

image.png

欢迎大家关注我的公众号

小明的数据分析笔记本


小明的数据分析笔记本 公众号 主要分享:1、R语言和python做数据分析和数据可视化的简单小例子;2、园艺植物相关转录组学、基因组学、群体遗传学文献阅读笔记;3、生物信息学入门学习资料及自己的学习笔记!


作者:Punicagranatum

公众号:小明的数据分析笔记本

原文链接:http://mp.weixin.qq.com/s?__biz=MzI3NzQ3MTcxMg==&mid=2247489596&idx=1&sn=35a538335765edd42b84176697f6e4d5&chksm=eb6490b3dc1319a5d5a84b99672a74ab58cd05ef96f0337d25bcbf4932be989060d0d071ac46&scene=0&xtrack=1#rd

发布时间:2021-07-20 18:06:27

发表评论

您的电子邮箱地址不会被公开。 必填项已用*标注