Pertanyaan yang diberi tag «scikit-learn»

scikit-learn adalah pustaka pembelajaran mesin untuk Python yang menyediakan alat sederhana dan efisien untuk analisis data dan penambangan data, dengan fokus pada pembelajaran mesin. Ini dapat diakses oleh semua orang dan dapat digunakan kembali dalam berbagai konteks. Itu dibangun di atas NumPy dan SciPy. Proyek ini open source dan dapat digunakan secara komersial (lisensi BSD).

3
Python - Apa sebenarnya sklearn.pipeline.Pipeline?
Saya tidak tahu bagaimana sklearn.pipeline.Pipelinetepatnya bekerja. Ada sedikit penjelasan di dok . Misalnya apa yang mereka maksud dengan: Pipa transformasi dengan penduga akhir. Untuk memperjelas pertanyaan saya, apa itu steps? Bagaimana mereka bekerja? Sunting Berkat jawabannya, saya dapat membuat pertanyaan saya lebih jelas: Ketika saya memanggil pipeline and pass, sebagai …

13
ImportError dalam mengimpor dari sklearn: tidak dapat mengimpor nama check_build
Saya mendapatkan kesalahan berikut saat mencoba mengimpor dari sklearn: >>> from sklearn import svm Traceback (most recent call last): File "<pyshell#17>", line 1, in <module> from sklearn import svm File "C:\Python27\lib\site-packages\sklearn\__init__.py", line 16, in <module> from . import check_build ImportError: cannot import name check_build Saya menggunakan python 2.7, scipy-0.12.0b1 superpack, …

8
Sebuah kolom-vektor y dilewatkan ketika array 1d diharapkan
Aku harus sesuai RandomForestRegressordari sklearn.ensemble. forest = ensemble.RandomForestRegressor(**RF_tuned_parameters) model = forest.fit(train_fold, train_y) yhat = model.predict(test_fold) Kode ini selalu berfungsi sampai saya membuat beberapa preprocessing data ( train_y). Pesan kesalahan mengatakan: DataConversionWarning: Kolom-vektor y dilewatkan saat array 1d diharapkan. Silahkan rubah bentuk y menjadi (n_samples,), misalnya menggunakan ravel (). model = …

2
Bagaimana cara kerja parameter class_weight di scikit-learn?
Saya mengalami banyak masalah dalam memahami bagaimana class_weightparameter dalam Regresi Logistik scikit-learn beroperasi. Situasi Saya ingin menggunakan regresi logistik untuk melakukan klasifikasi biner pada kumpulan data yang sangat tidak seimbang. Kelas diberi label 0 (negatif) dan 1 (positif) dan data yang diamati memiliki rasio sekitar 19: 1 dengan mayoritas sampel …



4
Bagaimana cara menghitung presisi, recall, akurasi, dan skor f1 untuk kasus multiclass dengan scikit learn?
Saya sedang mengerjakan masalah analisis sentimen, datanya terlihat seperti ini: label instances 5 1190 4 838 3 239 1 204 2 127 Jadi data saya tidak seimbang sejak 1190 instancesdiberi label 5. Untuk klasifikasi saya menggunakan SVC scikit . Masalahnya adalah saya tidak tahu bagaimana menyeimbangkan data saya dengan cara …



11
sklearn: Ditemukan array dengan jumlah sampel yang tidak konsisten saat memanggil LinearRegression.fit ()
Hanya mencoba melakukan regresi linier sederhana tetapi saya bingung dengan kesalahan ini untuk: regr = LinearRegression() regr.fit(df2.iloc[1:1000, 5].values, df2.iloc[1:1000, 2].values) yang menghasilkan: ValueError: Found arrays with inconsistent numbers of samples: [ 1 999] Pilihan ini harus memiliki dimensi yang sama, dan harus berupa array numpy, jadi apa yang saya lewatkan?
102 scikit-learn 


3
RandomForestClassifier vs ExtraTreesClassifier dalam scikit belajar
Adakah yang bisa menjelaskan perbedaan antara RandomForestClassifier dan ExtraTreesClassifier di scikit learn. Saya telah menghabiskan sedikit waktu membaca koran: P. Geurts, D. Ernst., Dan L. Wehenkel, "Pohon yang sangat diacak", Machine Learning, 63 (1), 3-42, 2006 Tampaknya inilah perbedaan untuk ET: 1) Saat memilih variabel secara terpisah, sampel diambil dari …

7
Latihan Stratifikasi / Uji-split dalam scikit-learn
Saya perlu membagi data saya menjadi satu set pelatihan (75%) dan set pengujian (25%). Saat ini saya melakukannya dengan kode di bawah ini: X, Xt, userInfo, userInfo_train = sklearn.cross_validation.train_test_split(X, userInfo) Namun, saya ingin membuat stratifikasi set data pelatihan saya. Bagaimana aku melakukan itu? Saya telah mempelajari StratifiedKFoldmetode ini, tetapi tidak …

5
Parameter "stratify" dari metode "train_test_split" (scikit Learn)
Saya mencoba menggunakan train_test_splitdari paket scikit Learn, tetapi saya mengalami masalah dengan parameter stratify. Selanjutnya kodenya: from sklearn import cross_validation, datasets X = iris.data[:,:2] y = iris.target cross_validation.train_test_split(X,y,stratify=y) Namun, saya terus mendapatkan masalah berikut: raise TypeError("Invalid parameters passed: %s" % str(options)) TypeError: Invalid parameters passed: {'stratify': array([0, 0, 0, 0, …


Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.