Hai punya dataframe dengan nilai kategori besar lebih dari 1600 kategori apakah ada cara saya bisa menemukan alternatif sehingga saya tidak memiliki lebih dari 1.600 kolom.
Saya menemukan ini di bawah ini tautan menarik http://amunategui.github.io/feature-hashing/#sourcecode
Tetapi mereka mengkonversi ke kelas / objek yang tidak saya inginkan. Saya ingin hasil akhir saya sebagai kerangka data sehingga saya bisa menguji dengan model pembelajaran mesin yang berbeda? atau apakah ada cara saya dapat menggunakan matriks genetrated untuk melatih model pembelajaran mesin lain selain regresi logistik atau XGBoost?
Apakah ada yang bisa saya terapkan?