Regressão Linear

Agora que já aprendemos ‘tudo’ sobre ANOVA, vamos aprender um pouco sobre um outro tipo de modelo linear que é usado para analisar a relação entre variáveis contínuas: a Regressão Linear. A regressão linear é usada quando: (1) se quer saber se uma variável contínua está associada a outra variável contínua; (2) quando se quer medir a força da associação (r2); ou (3) se quer a equação que descreve a relação para poder usá-la na predição de valores que não são conhecidos.

A regressão linear (simples ou múltipla) é feita com a função lm(), a exemplo do ANOVA - que também é um modelo linear. Relembrando, essa função requer uma fórmula. No caso da regressão linear simples a fórmula assume a forma DV ~ IV, que podemos ler como ‘DV como função de IV’ ou ‘DV predita por IV’, ‘DV modelada por IV’, etc. Lembre-se que DV (ou variável resposta) deve vir antes de ‘~’ e IV ou variáveis explanatórias depois. É super simples, vamos tentar usando a base de dados ‘cats’ do pacote ‘MASS’, que contém informação sobre algumas características de gatos domésticos.

require(MASS)
## Loading required package: MASS
data(cats)
str(cats)
## 'data.frame':    144 obs. of  3 variables:
##  $ Sex: Factor w/ 2 levels "F","M": 1 1 1 1 1 1 1 1 1 1 ...
##  $ Bwt: num  2 2 2 2.1 2.1 2.1 2.1 2.1 2.1 2.1 ...
##  $ Hwt: num  7 7.4 9.5 7.2 7.3 7.6 8.1 8.2 8.3 8.5 ...
summary(cats)
##  Sex         Bwt             Hwt       
##  F:47   Min.   :2.000   Min.   : 6.30  
##  M:97   1st Qu.:2.300   1st Qu.: 8.95  
##         Median :2.700   Median :10.10  
##         Mean   :2.724   Mean   :10.63  
##         3rd Qu.:3.025   3rd Qu.:12.12  
##         Max.   :3.900   Max.   :20.50

‘Bwt’ é a massa corpórea em kilogramas, ‘Hwt’ é a massa do coração em gramas, em machos e fêmeas (‘Sex’). Vamos checar o comportamento dos dados usando um scatterplot.

attach(cats)
plot(Bwt, Hwt)
title(main="Massa do Coração (g) vs. Massa corpórea (kg)\nde Gatos Domésticos")