Aku harus sesuai RandomForestRegressor
dari sklearn.ensemble
.
forest = ensemble.RandomForestRegressor(**RF_tuned_parameters)
model = forest.fit(train_fold, train_y)
yhat = model.predict(test_fold)
Kode ini selalu berfungsi sampai saya membuat beberapa preprocessing data ( train_y
). Pesan kesalahan mengatakan:
DataConversionWarning: Kolom-vektor y dilewatkan saat array 1d diharapkan. Silahkan rubah bentuk y menjadi (n_samples,), misalnya menggunakan ravel ().
model = forest.fit (train_fold, train_y)
Sebelumnya train_y
adalah Seri, sekarang menjadi array numpy (itu adalah vektor kolom). Jika saya terapkan train_y.ravel()
, maka menjadi vektor baris dan tidak muncul pesan error, melalui langkah prediksi membutuhkan waktu yang sangat lama (sebenarnya tidak pernah selesai ...).
Dalam dokumen RandomForestRegressor
saya menemukan bahwa train_y
harus didefinisikan sebagai y : array-like, shape = [n_samples] or [n_samples, n_outputs]
Ada ide bagaimana mengatasi masalah ini?
train_y
sudahkah Anda memeriksa konten data Anda untuk memastikan pra-pemrosesan tidak merusaknya?
RF_tuned_parameters
Tolong cetak untuk kami.
train_fold.shape
dantrain_y.shape
?