Agora que já aprendemos ‘tudo’ sobre ANOVA, vamos aprender um pouco sobre um outro tipo de modelo linear que é usado para analisar a relação entre variáveis contínuas: a Regressão Linear. A regressão linear é usada quando: (1) se quer saber se uma variável contínua está associada a outra variável contínua; (2) quando se quer medir a força da associação (r2); ou (3) se quer a equação que descreve a relação para poder usá-la na predição de valores que não são conhecidos.
A regressão linear (simples ou múltipla) é feita com a função lm(), a exemplo do ANOVA - que também é um modelo linear. Relembrando, essa função requer uma fórmula. No caso da regressão linear simples a fórmula assume a forma DV ~ IV, que podemos ler como ‘DV como função de IV’ ou ‘DV predita por IV’, ‘DV modelada por IV’, etc. Lembre-se que DV (ou variável resposta) deve vir antes de ‘~’ e IV ou variáveis explanatórias depois. É super simples, vamos tentar usando a base de dados ‘cats’ do pacote ‘MASS’, que contém informação sobre algumas características de gatos domésticos.
require(MASS)
## Loading required package: MASS
data(cats)
str(cats)
## 'data.frame': 144 obs. of 3 variables:
## $ Sex: Factor w/ 2 levels "F","M": 1 1 1 1 1 1 1 1 1 1 ...
## $ Bwt: num 2 2 2 2.1 2.1 2.1 2.1 2.1 2.1 2.1 ...
## $ Hwt: num 7 7.4 9.5 7.2 7.3 7.6 8.1 8.2 8.3 8.5 ...
summary(cats)
## Sex Bwt Hwt
## F:47 Min. :2.000 Min. : 6.30
## M:97 1st Qu.:2.300 1st Qu.: 8.95
## Median :2.700 Median :10.10
## Mean :2.724 Mean :10.63
## 3rd Qu.:3.025 3rd Qu.:12.12
## Max. :3.900 Max. :20.50
‘Bwt’ é a massa corpórea em kilogramas, ‘Hwt’ é a massa do coração em gramas, em machos e fêmeas (‘Sex’). Vamos checar o comportamento dos dados usando um scatterplot.
attach(cats)
plot(Bwt, Hwt)
title(main="Massa do Coração (g) vs. Massa corpórea (kg)\nde Gatos Domésticos")