Pertanyaan yang diberi tag «loss-functions»

Fungsi yang digunakan untuk mengukur perbedaan antara data yang diamati dan nilai prediksi menurut model. Meminimalkan fungsi kerugian adalah cara untuk memperkirakan parameter model.

1
Bagaimana penduga yang meminimalkan jumlah bias kuadrat dan varians yang sesuai dengan teori keputusan?
Oke - pesan asli saya gagal mendapat respons; jadi, izinkan saya mengajukan pertanyaan yang berbeda. Saya akan mulai dengan menjelaskan pemahaman saya tentang estimasi dari perspektif teori keputusan. Saya tidak memiliki pelatihan formal dan tidak akan mengejutkan saya jika pemikiran saya cacat dalam beberapa cara. Misalkan kita memiliki beberapa fungsi …

1
Penjelasan intuitif logloss
Dalam beberapa kompetisi yang luar biasa, penilaian didasarkan pada "logloss". Ini berkaitan dengan kesalahan klasifikasi. Inilah jawaban teknis tetapi saya mencari jawaban yang intuitif. Saya sangat menyukai jawaban atas pertanyaan ini tentang jarak Mahalanobis, tetapi PCA tidak logloss. Saya dapat menggunakan nilai yang dikeluarkan oleh perangkat lunak klasifikasi saya, tetapi …

1
Apakah saya tetap bisa menggunakan fungsi cross entropy loss dengan label lunak?
Saya memiliki masalah klasifikasi di mana piksel akan dilabeli dengan label lunak (yang menunjukkan probabilitas) daripada label 0,1 yang sulit. Sebelumnya dengan 0,1 pixel pelabelan keras fungsi kehilangan entropi silang (sigmoidCross entropyLossLayer dari Caffe) memberikan hasil yang layak. Apakah saya tetap menggunakan lapisan sigmoid cross entropy loss (dari Caffe) untuk …

4
Pelatihan jaringan saraf untuk regresi selalu memprediksi rata-rata
Saya melatih jaringan saraf convolutional sederhana untuk regresi, di mana tugasnya adalah untuk memprediksi lokasi (x, y) kotak dalam gambar, misalnya: Output dari jaringan memiliki dua node, satu untuk x, dan satu untuk y. Sisa dari jaringan adalah jaringan saraf convolutional standar. Hilangnya adalah standar kuadrat kesalahan antara posisi kotak …


2
Perbandingan antara penaksir Bayes
Pertimbangkan kerugian kuadratik , dengan diberikan sebelumnya mana . Misalkan kemungkinan. Temukan estimator Bayes .L(θ,δ)=(θ−δ)2L(θ,δ)=(θ−δ)2L(\theta,\delta)=(\theta-\delta)^2π(θ)π(θ)\pi(\theta)π(θ)∼U(0,1/2)π(θ)∼U(0,1/2)\pi(\theta)\sim U(0,1/2)f(x|θ)=θxθ−1I[0,1](x),θ>0f(x|θ)=θxθ−1I[0,1](x),θ>0f(x|\theta)=\theta x^{\theta-1}\mathbb{I}_{[0,1]}(x), \theta>0δπδπ\delta^\pi Pertimbangkan kehilangan kuadratik tertimbang mana dengan prior . Biarkan menjadi kemungkinannya. Temukan estimator Bayes .Lw(θ,δ)=w(θ)(θ−δ)2Lw(θ,δ)=w(θ)(θ−δ)2L_w(\theta,\delta)=w(\theta)(\theta-\delta)^2w(θ)=I(−∞,1/2)w(θ)=I(−∞,1/2)w(\theta)=\mathbb{I}_{(-\infty,1/2)}π1(θ)=I[0,1](θ)π1(θ)=I[0,1](θ)\pi_1(\theta)=\mathbb{I}_{[0,1]}(\theta)f(x|θ)=θxθ−1I[0,1](x),θ>0f(x|θ)=θxθ−1I[0,1](x),θ>0f(x|\theta)=\theta x^{\theta-1}\mathbb{I}_{[0,1]}(x), \theta>0δπ1δ1π\delta^\pi_1 Bandingkan danδπδπ\delta^\piδπ1δ1π\delta^\pi_1 Pertama saya perhatikan bahwa , dan saya berasumsi bahwa itu adalah kemungkinannya, kalau …

1
Apa yang akan menjadi contoh ketika L2 adalah fungsi kerugian yang baik untuk menghitung kerugian posterior?
Kehilangan L2, bersama dengan kehilangan L0 dan L1, adalah tiga fungsi kehilangan "standar" yang sangat umum digunakan ketika meringkas posterior dengan kehilangan posterior minimum yang diharapkan. Salah satu alasan untuk ini mungkin karena mereka relatif mudah untuk dihitung (setidaknya untuk 1d-distribusi), L0 menghasilkan mode, L1 di median dan L2 menghasilkan …

1
Membandingkan residu antara regresi OLS dan non-OLS
Misalkan Anda ingin memperkirakan model linier: ( pengamatan respons, dan prediktor) nnnp+1p+1p+1E(yi)=β0+∑j=1pβjxijE(yi)=β0+∑j=1pβjxij\mathbb{E}(y_i) = \beta_0 + \sum_{j=1}^p \beta_j x_{ij} Salah satu cara untuk melakukan ini adalah melalui solusi OLS, yaitu memilih koefisien sehingga jumlah kesalahan kuadrat minimum: (β0,β1, ⋯ ,βhal)T=argminβ0,β1, ⋯ ,βhal∑i = 1n(ysaya-β0-∑j = 1halβjxsaya j)2(β0,β1,⋯,βhal)T=arg⁡minβ0,β1,⋯,βhal∑saya=1n(ysaya-β0-∑j=1halβjxsayaj)2(\beta_0,\beta_1,\cdots,\beta_p)^T = \underset{\beta_0,\beta_1,\cdots,\beta_p}{\arg \min} \sum_{i=1}^{n} …

2
Engsel kehilangan dengan satu-vs-semua classifier
Saat ini saya sedang melihat bentuk primitif satu-vs-semua yang tidak dibatasi ∑i=1NI∑k=1,k≠yiNKL(1+wk⋅xi−wyi⋅xi)∑i=1NI∑k=1,k≠yiNKL(1+wk⋅xi−wyi⋅xi)\sum\limits_{i=1}^{N_I} \sum\limits_{k=1,\atop k \neq y_i}^{N_K} L(1+ \mathbf{w_k}\cdot\mathbf{x_i}-\mathbf{w_{y_i}}\cdot\mathbf{x_i}) dimana NININ_I adalah jumlah instance, NKNKN_K adalah jumlah kelas, NFNFN_F adalah jumlah fitur, XXX adalah NK×NFNK×NFN_K \times N_F matriks data, yyy adalah vektor label kelas, WWW adalah NK×NINK×NIN_K \times N_I matriks di …

1
MSE sebagai proksi Korelasi Pearson dalam Masalah Regresi
TL; DR (terlalu panjang, tidak dibaca): Saya sedang mengerjakan masalah prediksi deret waktu, yang saya rumuskan sebagai masalah Regresi menggunakan Deep Learning (keras). Saya ingin mengoptimalkan korelasi Pearson antara prediksi saya dan label yang sebenarnya. Saya bingung dengan fakta bahwa menggunakan MSE sebagai proxy sebenarnya mengarah ke hasil yang lebih …

1
Membangun fungsi kerugian spesifik masalah
Deskripsi Masalah Saya memulai konstruksi jaringan untuk masalah yang menurut saya bisa memiliki fungsi kerugian yang jauh lebih mendalam daripada regresi MSE sederhana. Masalah saya berkaitan dengan klasifikasi multi-kategori ( lihat pertanyaan saya di SO untuk apa yang saya maksudkan dengan ini), di mana ada jarak atau hubungan yang ditentukan …

1
Menggunakan aturan penilaian yang tepat untuk menentukan keanggotaan kelas dari regresi logistik
Saya menggunakan regresi logistik untuk memprediksi kemungkinan suatu peristiwa terjadi. Pada akhirnya, probabilitas ini dimasukkan ke dalam lingkungan produksi, tempat kami memfokuskan sebanyak mungkin pada prediksi kami yang "Ya". Oleh karena itu berguna bagi kita untuk memiliki gagasan tentang "hit" atau "non-hit" definitif apa yang mungkin menjadi apriori (sebelum berjalan …

2
Mengapa model statistik cocok jika diberi set data yang sangat besar?
Proyek saya saat ini mungkin mengharuskan saya untuk membuat model untuk memprediksi perilaku sekelompok orang tertentu. set data pelatihan hanya berisi 6 variabel (id hanya untuk tujuan identifikasi): id, age, income, gender, job category, monthly spend di mana monthly spendadalah variabel respon. Tetapi dataset pelatihan berisi sekitar 3 juta baris, …
8 modeling  large-data  overfitting  clustering  algorithms  error  spatial  r  regression  predictive-models  linear-model  average  measurement-error  weighted-mean  error-propagation  python  standard-error  weighted-regression  hypothesis-testing  time-series  machine-learning  self-study  arima  regression  correlation  anova  statistical-significance  excel  r  regression  distributions  statistical-significance  contingency-tables  regression  optimization  measurement-error  loss-functions  image-processing  java  panel-data  probability  conditional-probability  r  lme4-nlme  model-comparison  time-series  probability  probability  conditional-probability  logistic  multiple-regression  model-selection  r  regression  model-based-clustering  svm  feature-selection  feature-construction  time-series  forecasting  stationarity  r  distributions  bootstrap  r  distributions  estimation  maximum-likelihood  garch  references  probability  conditional-probability  regression  logistic  regression-coefficients  model-comparison  confidence-interval  r  regression  r  generalized-linear-model  outliers  robust  regression  classification  categorical-data  r  association-rules  machine-learning  distributions  posterior  likelihood  r  hypothesis-testing  normality-assumption  missing-data  convergence  expectation-maximization  regression  self-study  categorical-data  regression  simulation  regression  self-study  self-study  gamma-distribution  modeling  microarray  synthetic-data 
Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.