Pertanyaan yang diberi tag «scikit-learn»

scikit-learn adalah pustaka pembelajaran mesin untuk Python yang menyediakan alat sederhana dan efisien untuk analisis data dan penambangan data, dengan fokus pada pembelajaran mesin. Ini dapat diakses oleh semua orang dan dapat digunakan kembali dalam berbagai konteks. Itu dibangun di atas NumPy dan SciPy. Proyek ini open source dan dapat digunakan secara komersial (lisensi BSD).

20
Pengkodean label di beberapa kolom di scikit-pelajari
Saya mencoba menggunakan scikit-learn's LabelEncoderuntuk menyandikan panda DataFramelabel string. Karena kerangka data memiliki banyak (50+) kolom, saya ingin menghindari membuat LabelEncoderobjek untuk setiap kolom; Saya lebih suka hanya memiliki satu LabelEncoderobjek besar yang berfungsi di semua kolom data saya. Melempar keseluruhan DataFrameke dalam LabelEncodermenciptakan kesalahan di bawah ini. Harap diingat …


6
Simpan classifier ke disk di scikit-pelajari
Bagaimana cara menyimpan classifier Naive Bayes yang terlatih ke disk dan menggunakannya untuk memprediksi data? Saya memiliki program sampel berikut dari situs scikit-learn: from sklearn import datasets iris = datasets.load_iris() from sklearn.naive_bayes import GaussianNB gnb = GaussianNB() y_pred = gnb.fit(iris.data, iris.target).predict(iris.data) print "Number of mislabeled points : %d" % (iris.target …

15
ImportError: Tidak ada modul bernama sklearn.cross_validation
Saya menggunakan python 2.7 di Ubuntu 14.04. Saya menginstal scikit-learn, numpy dan matplotlib dengan perintah-perintah ini: sudo apt-get install build-essential python-dev python-numpy \ python-numpy-dev python-scipy libatlas-dev g++ python-matplotlib \ ipython Tetapi ketika saya mengimpor paket-paket ini: from sklearn.cross_validation import train_test_split Ini mengembalikan saya kesalahan ini: ImportError: No module named sklearn.cross_validation …








6
panda dataframe kolom scaling dengan sklearn
Saya memiliki kerangka data panda dengan kolom tipe campuran, dan saya ingin menerapkan min_max_scaler sklearn ke beberapa kolom. Idealnya, saya ingin melakukan transformasi ini di tempat, tetapi belum menemukan cara untuk melakukan itu. Saya telah menulis kode berikut yang berfungsi: import pandas as pd import numpy as np from sklearn …

13
sklearn error ValueError: Input berisi NaN, infinity atau nilai terlalu besar untuk dtype ('float64')
Saya menggunakan sklearn dan mengalami masalah dengan propagasi afinitas. Saya telah membangun matriks masukan dan saya terus mendapatkan kesalahan berikut. ValueError: Input contains NaN, infinity or a value too large for dtype('float64'). aku harus lari np.isnan(mat.any()) #and gets False np.isfinite(mat.all()) #and gets True Saya mencoba menggunakan mat[np.isfinite(mat) == True] = …

3
Mengapa satu pengkodean panas meningkatkan kinerja pembelajaran mesin?
Saya telah memperhatikan bahwa ketika One Hot encoding digunakan pada set data tertentu (matriks) dan digunakan sebagai data pelatihan untuk algoritma pembelajaran, itu memberikan hasil yang jauh lebih baik sehubungan dengan akurasi prediksi, dibandingkan dengan menggunakan matriks asli itu sendiri sebagai data pelatihan. Bagaimana peningkatan kinerja ini terjadi?


Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.