Saya harus mengatakan bahwa lingkungan perangkat lunak yang paling lengkap untuk Pembelajaran Mesin dan pemodelan nonparametrik adalah R. Ini adalah bidang besar dalam statistik, mencakup K-NN, perataan Kernel, Model Aditif Umum, pelajar yang lemah, vektor dukungan, jaring saraf, semi -parametric spline regression, imputasi, dll ... Saya akan sangat merekomendasikan membaca: Hastie, T., R. Tibshirani, J. Friedman (2009) Elemen Pembelajaran Statistik: Penambangan Data, Inferensi dan Prediksi. Seri Springer dalam Statistik.
Selain R, perangkat lunak komersial oleh Salford Systems memiliki Random Forests, Multivariate Adaptive Regression Splines, CART dan Gradient Boosting (TreeNet) tersedia di lingkungan GUI. RuleQuest masih menjual See5 / C5 yang merupakan versi terbaru dari algoritma C4 / ID3 CART. Weka 3 dari University of Waikato adalah upaya Java GUI / Commandline open source dengan sejumlah besar model yang tersedia.