Cosa sono i residui?

Vedere un esempio di un grafico residuo corrispondente a un particolare grafico a dispersione

Grafico a dispersione con la trama residua corrispondente di seguito. CK Taylor





La regressione lineare è uno strumento statistico che determina quanto bene una linea retta si adatta a un insieme diI residui si ottengono effettuando la sottrazione. Tutto quello che dobbiamo fare è sottrarre il valore previsto di Y dal valore osservato di Y per un particolare X . Il risultato è chiamato residuo.

Formula per i residui

La formula per i residui è semplice:



Residuo = osservato Y – previsto Y

È importante notare che il valore previsto deriva dalla nostra linea di regressione. Il valore osservato proviene dal nostro set di dati.



Esempi

Illustreremo l'uso di questa formula mediante un esempio. Supponiamo di avere il seguente insieme di dati accoppiati:

(1, 2), (2, 3), (3, 7), (3, 6), (4, 9), (5, 9)

Usando il software possiamo vedere che la retta di regressione dei minimi quadrati è Y = 2 X . Lo useremo per prevedere i valori per ogni valore di X .

Ad esempio, quando X = 5 vediamo che 2(5) = 10. Questo ci dà il punto lungo il nostro linea di regressioneche ha un X coordinata di 5.



Per calcolare il residuo nei punti X = 5, sottraiamo il valore previsto dal nostro valore osservato. Dal momento che il Y la coordinata del nostro punto dati era 9, questo dà un residuo di 9 – 10 = -1.

Nella tabella seguente vediamo come calcolare tutti i nostri residui per questo set di dati:



X Osservato y previsto y Residuo
1 Due Due 0
Due 3 4 -1
3 7 6 1
3 6 6 0
4 9 8 1
5 9 10 -1

Caratteristiche dei residui

Ora che abbiamo visto un esempio, ci sono alcune caratteristiche dei residui da notare:

  • I residui sono positivi per i punti che cadono al di sopra della linea di regressione.
  • I residui sono negativi per i punti che cadono al di sotto della linea di regressione.
  • I residui sono zero per i punti che cadono esattamente lungo la linea di regressione.
  • Maggiore è il valore assoluto del residuo, maggiore è la distanza del punto dalla retta di regressione.
  • La somma di tutti i residui dovrebbe essere zero. In pratica a volte questa somma non è esattamente zero. Il motivo di questa discrepanza è che possono accumularsi errori di arrotondamento.

Usi dei residui

Ci sono diversi usi per i residui. Un uso è aiutarci a determinare se abbiamo un set di dati che ha un andamento lineare generale o se dovremmo considerare un modello diverso. La ragione di ciò è che i residui aiutano ad amplificare qualsiasi modello non lineare nei nostri dati. Ciò che può essere difficile da vedere osservando un grafico a dispersione può essere osservato più facilmente esaminando i residui e un corrispondente grafico residuo.



Un altro motivo per considerare i residui è verificare che le condizioni per l'inferenza per la regressione lineare siano soddisfatte. Dopo la verifica di un andamento lineare (verificando i residui), si verifica anche la distribuzione dei residui. Per poter eseguire l'inferenza di regressione, vogliamo che i residui sulla nostra retta di regressione siano distribuiti approssimativamente normalmente. UN istogramma o trama di voto dei residui aiuterà a verificare che tale condizione sia soddisfatta.