A regressão linear é um tipo básico e comumente usado de análise preditiva. A ideia geral da regressão é examinar duas coisas:
(1) um conjunto de variáveis preditoras faz um bom trabalho ao prever uma variável de resultado (dependente)
(2) Quais variáveis em particular são preditores significativos da variável de resultado e de que maneira elas – indicadas pela magnitude e sinal das estimativas beta – impactam a variável de resultado
Essas estimativas de regressão são usadas para explicar a relação entre uma variável dependente e uma ou mais variáveis independentes.
A forma mais simples da equação de regressão com uma variável dependente e uma variável independente é definida pela fórmula
y = c + b*x, onde
y = pontuação estimada da variável dependente,
c = constante,
b = coeficiente de regressão e
x = pontuação no variável independente.
Nomeando as Variáveis. Há muitos nomes para a variável dependente de uma regressão. Pode ser chamada de variável de resultado, variável de critério, variável endógena ou regressando.
As variáveis independentes podem ser chamadas de variáveis exógenas, variáveis preditoras ou regressoras.
Três usos principais para a análise de regressão são:
(1) determinar a força dos preditores,
(2) prever um efeito e
(3) prever a tendência.