Saya memiliki kerangka data panda dengan beberapa entri, dan saya ingin menghitung korelasi antara pendapatan beberapa jenis toko. Ada sejumlah toko dengan data pendapatan, klasifikasi area aktivitas (teater, toko pakaian, makanan ...) dan data lainnya.
Saya mencoba membuat bingkai data baru dan menyisipkan kolom dengan pendapatan semua jenis toko yang termasuk dalam kategori yang sama, dan kerangka data yang kembali hanya memiliki kolom pertama yang diisi dan sisanya penuh dengan NaN. Kode yang saya lelah:
corr = pd.DataFrame()
for at in activity:
stores.loc[stores['Activity']==at]['income']
Saya ingin melakukannya, jadi saya bisa gunakan .corr()
untuk memberikan matriks korelasi antara kategori toko.
Setelah itu, saya ingin tahu bagaimana saya bisa memplot nilai matriks (-1 ke 1, karena saya ingin menggunakan korelasi Pearson) dengan matplolib.