Pertanyaan yang diberi tag «cart»

'Klasifikasi Dan Pohon Regresi'. CART adalah teknik pembelajaran mesin yang populer, dan membentuk dasar untuk teknik seperti hutan acak dan implementasi umum dari mesin pendorong gradien.

9
Memperoleh pengetahuan dari hutan acak
Hutan acak dianggap kotak hitam, tetapi baru-baru ini saya berpikir pengetahuan apa yang bisa diperoleh dari hutan acak? Hal yang paling jelas adalah pentingnya variabel, dalam varian paling sederhana dapat dilakukan hanya dengan menghitung jumlah kemunculan suatu variabel. Hal kedua yang saya pikirkan adalah interaksi. Saya berpikir bahwa jika jumlah …

2
Gradient Boosting Tree vs Random Forest
Penguatan pohon gradien seperti yang diusulkan oleh Friedman menggunakan pohon keputusan sebagai pelajar dasar. Saya bertanya-tanya apakah kita harus membuat pohon keputusan dasar serumit mungkin (dewasa) atau lebih sederhana? Apakah ada penjelasan untuk pilihannya? Random Forest adalah metode ensemble lain yang menggunakan pohon keputusan sebagai pelajar dasar. Berdasarkan pemahaman saya, …

1
Pohon inferensi bersyarat vs pohon keputusan tradisional
Adakah yang bisa menjelaskan perbedaan utama antara pohon inferensi bersyarat ( ctreedari partypaket dalam R) dibandingkan dengan algoritma pohon keputusan yang lebih tradisional (seperti rpartdalam R)? Apa yang membuat pohon CI berbeda? Kekuatan dan kelemahan? Pembaruan: Saya telah melihat makalah oleh Horthorn et al yang dimaksud Chi dalam komentar. Saya …

3
Contoh: regresi LASSO menggunakan glmnet untuk hasil biner
Saya mulai mencoba-coba penggunaan glmnetdengan LASSO Regression di mana hasil yang saya minati menjadi dikotomis. Saya telah membuat bingkai data mock kecil di bawah ini: age <- c(4, 8, 7, 12, 6, 9, 10, 14, 7) gender <- c(1, 0, 1, 1, 1, 0, 1, 0, 0) bmi_p <- c(0.86, …
78 r  self-study  lasso  regression  interpretation  anova  statistical-significance  survey  conditional-probability  independence  naive-bayes  graphical-model  r  time-series  forecasting  arima  r  forecasting  exponential-smoothing  bootstrap  outliers  r  regression  poisson-distribution  zero-inflation  genetic-algorithms  machine-learning  feature-selection  cart  categorical-data  interpretation  descriptive-statistics  variance  multivariate-analysis  covariance-matrix  r  data-visualization  generalized-linear-model  binomial  proportion  pca  matlab  svd  time-series  correlation  spss  arima  chi-squared  curve-fitting  text-mining  zipf  probability  categorical-data  distance  group-differences  bhattacharyya  regression  variance  mean  data-visualization  variance  clustering  r  standard-error  association-measure  somers-d  normal-distribution  integral  numerical-integration  bayesian  clustering  python  pymc  nonparametric-bayes  machine-learning  svm  kernel-trick  hyperparameter  poisson-distribution  mean  continuous-data  univariate  missing-data  dag  python  likelihood  dirichlet-distribution  r  anova  hypothesis-testing  statistical-significance  p-value  rating  data-imputation  censoring  threshold 

2
Pertanyaan praktis tentang penyetelan Hutan Acak
Pertanyaan saya adalah tentang Hutan Acak. Konsep dari pengelompokan yang indah ini jelas bagi saya, tetapi masih ada banyak pertanyaan penggunaan praktis. Sayangnya, saya gagal menemukan panduan praktis untuk RF (saya telah mencari sesuatu seperti "Panduan Praktis untuk Pelatihan Mesin Boltzman Terbatas" oleh Geoffrey Hinton, tetapi untuk Hutan Acak! Bagaimana …

3
Bagaimana cara sebenarnya memplot pohon contoh dari randomForest :: getTree ()? [Tutup]
Siapa pun mendapat saran pustaka atau kode tentang cara sebenarnya merencanakan beberapa pohon sampel dari: getTree(rfobj, k, labelVar=TRUE) (Ya saya tahu Anda tidak seharusnya melakukan ini secara operasional, RF adalah kotak hitam, dll. Saya ingin secara visual kewarasan-periksa pohon untuk melihat apakah ada variabel yang berperilaku berlawanan, perlu penyesuaian / …

3
Apa itu Deviance? (khusus dalam CART / rpart)
Apa itu "Penyimpangan," bagaimana cara menghitungnya, dan apa kegunaannya dalam berbagai bidang dalam statistik? Secara khusus, saya pribadi tertarik dengan penggunaannya di CART (dan implementasinya dalam rpart in R). Saya menanyakan hal ini karena artikel wiki sepertinya kurang dan wawasan Anda akan sangat disambut.
45 r  cart  rpart  deviance 


3
Mengapa Pohon Keputusan tidak mahal secara komputasi?
Dalam Pengantar Pembelajaran Statistik dengan Aplikasi dalam R , penulis menulis bahwa pemasangan pohon keputusan sangat cepat, tetapi ini tidak masuk akal bagi saya. Algoritma harus melalui setiap fitur dan mempartisi dengan segala cara untuk menemukan pemisahan optimal. Untuk fitur numerik dengan pengamatan, ini dapat menghasilkan partisi untuk setiap fitur.nnnnnn …
38 cart 

6
Mengapa saya mendapatkan pohon keputusan akurasi 100%?
Saya mendapatkan akurasi 100% untuk pohon keputusan saya. Apa yang saya lakukan salah? Ini kode saya: import pandas as pd import json import numpy as np import sklearn import matplotlib.pyplot as plt data = np.loadtxt("/Users/Nadjla/Downloads/allInteractionsnum.csv", delimiter=',') x = data[0:14] y = data[-1] from sklearn.cross_validation import train_test_split x_train = x[0:2635] x_test …



3
Bagaimana Random Forests tidak peka terhadap outlier?
Saya telah membaca di beberapa sumber, termasuk yang satu ini , bahwa Random Forests tidak sensitif terhadap pencilan (dalam cara Regresi Logistik dan metode ML lainnya, misalnya). Namun, dua intuisi mengatakan sebaliknya: Setiap kali pohon keputusan dibangun, semua poin harus diklasifikasikan. Ini berarti bahwa outlier akan diklasifikasikan, dan karenanya akan …

1
Apa sajakah pedoman yang berguna untuk parameter GBM?
Apa saja pedoman yang berguna untuk parameter pengujian (yaitu kedalaman interaksi, anak kecil, laju sampel, dll.) Menggunakan GBM? Katakanlah saya memiliki 70-100 fitur, populasi 200.000 dan saya berniat menguji kedalaman interaksi 3 dan 4. Jelas saya perlu melakukan beberapa pengujian untuk melihat kombinasi parameter apa yang terbaik di luar sampel. …

4
Bagaimana mengukur / memberi peringkat “variabel penting” saat menggunakan CART? (khusus menggunakan {rpart} dari R)
Ketika membangun model CART (khususnya pohon klasifikasi) menggunakan rpart (dalam R), seringkali menarik untuk mengetahui apa pentingnya berbagai variabel yang diperkenalkan pada model. Dengan demikian, pertanyaan saya adalah: Apa ukuran umum yang ada untuk menentukan peringkat / mengukur variabel kepentingan variabel yang berpartisipasi dalam model CART? Dan bagaimana ini bisa …

Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.