Saya memiliki kumpulan data yang berisi 365 observasi dari tiga variabel yaitu pm
, temp
dan rain
. Sekarang saya ingin memeriksa perilaku pm
dalam menanggapi perubahan dalam dua variabel lainnya. Variabel saya adalah:
pm10
= Respon (tergantung)temp
= prediktor (independen)rain
= prediktor (independen)
Berikut ini adalah matriks korelasi untuk data saya:
> cor(air.pollution)
pm temp rainy
pm 1.00000000 -0.03745229 -0.15264258
temp -0.03745229 1.00000000 0.04406743
rainy -0.15264258 0.04406743 1.00000000
Masalahnya adalah ketika saya mempelajari konstruksi model regresi, ada tertulis bahwa metode aditif dimulai dengan variabel yang paling terkait dengan variabel respons. Dalam kumpulan data saya rain
sangat berkorelasi dengan pm
(dibandingkan dengan temp
), tetapi pada saat yang sama itu adalah variabel dummy (hujan = 1, tidak ada hujan = 0), jadi saya sekarang memiliki petunjuk dari mana saya harus mulai. Saya telah terpasang dua gambar dengan pertanyaan: Yang pertama adalah sebar data, dan gambar kedua adalah sebar dari pm10
vs rain
, saya juga tidak dapat menafsirkan sebar dari pm10
vs rain
. Bisakah seseorang membantu saya bagaimana memulainya?