Pertanyaan yang diberi tag «rule-of-thumb»

Nasihat tentang analisis statistik yang sering berguna dalam praktik (tetapi tidak selalu dijamin berhasil).

24
Aturan praktis untuk statistik "modern"
Saya suka buku G van Belle tentang Aturan Statistik Thumb , dan pada tingkat lebih rendah Kesalahan Umum dalam Statistik (dan Cara Menghindari Mereka) dari Phillip I Good dan James W. Hardin. Mereka mengatasi perangkap umum ketika menafsirkan hasil dari studi eksperimental dan pengamatan dan memberikan rekomendasi praktis untuk inferensi …

8
Menghitung jumlah optimal tempat sampah dalam histogram
Saya tertarik menemukan metode seoptimal mungkin untuk menentukan berapa banyak nampan yang harus saya gunakan dalam histogram. Data saya harus berkisar antara 30 hingga 350 objek paling banyak, dan khususnya saya mencoba menerapkan ambang (seperti metode Otsu) di mana objek "baik", yang saya harus memiliki lebih sedikit dan harus lebih …


4
Referensi apa yang harus dikutip untuk mendukung penggunaan 30 sebagai ukuran sampel yang cukup besar?
Saya telah membaca / mendengar berkali-kali bahwa ukuran sampel setidaknya 30 unit dianggap sebagai "sampel besar" (asumsi normalitas sarana biasanya kira-kira berlaku karena CLT, ...). Karena itu, dalam percobaan saya, saya biasanya menghasilkan sampel sebanyak 30 unit. Bisakah Anda memberi saya beberapa referensi yang harus dikutip ketika menggunakan ukuran sampel …

2
Sumber daya daring yang bagus dengan tips tentang hubungan grafik antara dua variabel numerik dalam berbagai kondisi
Konteks: Sementara saya telah memperoleh satu set heuristik tentang cara memplot secara efektif hubungan antara dua variabel numerik. Saya membayangkan sebagian besar orang yang bekerja dengan data akan memiliki seperangkat aturan yang sama. Contoh aturan tersebut mungkin: Jika salah satu variabel condong positif, pertimbangkan untuk memplot sumbu itu pada skala …

4
Bagaimana cara memproyeksikan vektor baru ke ruang PCA?
Setelah melakukan analisis komponen utama (PCA), saya ingin memproyeksikan vektor baru ke ruang PCA (yaitu menemukan koordinatnya dalam sistem koordinat PCA). Saya telah menghitung PCA dalam bahasa R menggunakan prcomp. Sekarang saya harus bisa mengalikan vektor saya dengan matriks rotasi PCA. Haruskah komponen utama dalam matriks ini disusun dalam baris …
21 r  pca  r  variance  heteroscedasticity  misspecification  distributions  time-series  data-visualization  modeling  histogram  kolmogorov-smirnov  negative-binomial  likelihood-ratio  econometrics  panel-data  categorical-data  scales  survey  distributions  pdf  histogram  correlation  algorithms  r  gpu  parallel-computing  approximation  mean  median  references  sample-size  normality-assumption  central-limit-theorem  rule-of-thumb  confidence-interval  estimation  mixed-model  psychometrics  random-effects-model  hypothesis-testing  sample-size  dataset  large-data  regression  standard-deviation  variance  approximation  hypothesis-testing  variance  central-limit-theorem  kernel-trick  kernel-smoothing  error  sampling  hypothesis-testing  normality-assumption  philosophical  confidence-interval  modeling  model-selection  experiment-design  hypothesis-testing  statistical-significance  power  asymptotics  information-retrieval  anova  multiple-comparisons  ancova  classification  clustering  factor-analysis  psychometrics  r  sampling  expectation-maximization  markov-process  r  data-visualization  correlation  regression  statistical-significance  degrees-of-freedom  experiment-design  r  regression  curve-fitting  change-point  loess  machine-learning  classification  self-study  monte-carlo  markov-process  references  mathematical-statistics  data-visualization  python  cart  boosting  regression  classification  robust  cart  survey  binomial  psychometrics  likert  psychology  asymptotics  multinomial 

3
Metrik
Apakah ada yang menggunakan metrik atau L .5 untuk pengelompokan, bukan L 2 ? Aggarwal et al., Tentang perilaku mengejutkan metrik jarak dalam ruang dimensi tinggi mengatakan (pada 2001) ituL1L1L_1L.5L.5L_.5L2L2L_2 secara konsisten lebih disukai daripada metrik jarak Euclidean L 2 untuk aplikasi penambangan data dimensi tinggiL1L1L_1L2L2L_2 dan mengklaim bahwa atau …


1
Ukuran sampel diperlukan untuk menentukan iklan mana yang memiliki rasio klik-tayang tertinggi
Saya seorang perancang perangkat lunak berdasarkan perdagangan dan saya sedang mengerjakan proyek untuk klien, dan saya ingin memastikan bahwa analisis saya secara statistik baik. Pertimbangkan yang berikut ini: Kami memiliki n iklan (n <10), dan kami hanya ingin tahu iklan mana yang berkinerja terbaik. Server iklan kami akan menayangkan salah …

4
MANOVA dan korelasi antara variabel dependen: seberapa kuat terlalu kuat?
Variabel dependen dalam MANOVA tidak boleh "berkorelasi terlalu kuat". Tetapi seberapa kuat suatu korelasi terlalu kuat? Akan menarik untuk mendapatkan pendapat orang tentang masalah ini. Misalnya, apakah Anda akan melanjutkan dengan MANOVA dalam situasi berikut? Y1 dan Y2 berkorelasi dengan danp &lt; 0,005r = 0,3r=0.3r=0.3p &lt; 0,005p&lt;0.005p<0.005 Y1 dan Y2 …


1
Histogram dengan Bins seragam vs non-seragam
Pertanyaan ini menjelaskan perbedaan mendasar antara histogram yang seragam dan yang tidak seragam. Dan pertanyaan ini membahas aturan praktis untuk memilih jumlah tempat sampah dari histogram seragam yang mengoptimalkan (dalam arti tertentu) sejauh mana histogram mewakili distribusi dari mana sampel data diambil. Sepertinya saya tidak dapat menemukan diskusi "optimalitas" yang …

1
Bagaimana cara memformalkan distribusi probabilitas sebelumnya? Apakah ada aturan praktis yang harus digunakan?
Sementara saya suka berpikir saya memiliki pemahaman yang baik tentang konsep informasi sebelumnya dalam analisis statistik Bayesian dan pengambilan keputusan, saya sering mengalami kesulitan membungkus kepala saya di sekitar penerapannya. Saya telah memikirkan beberapa situasi yang mencontohkan perjuangan saya, dan saya merasa bahwa mereka tidak ditangani dengan benar dalam buku …

1
Jumlah optimal tempat sampah dalam histogram oleh aturan Freedman-Diaconis: perbedaan antara tingkat teoritis dan jumlah aktual
Wikipedia melaporkan bahwa di bawah aturan Freedman dan Diaconis, jumlah optimal tempat sampah dalam histogram, harus tumbuh sebagaikkk k ∼n1 / 3k∼n1/3k\sim n^{1/3} di mana adalah ukuran sampel.nnn Namun, Jika Anda melihat nclass.FDfungsi dalam R, yang mengimplementasikan aturan ini, setidaknya dengan data Gaussian dan ketika , jumlah tampaknya tumbuh pada …

1
Aturan mudah dasar untuk statistik
Dalam percobaan binomial, jika kita amati x=0x=0x=0 individu positif di antara nnn individu, maka proporsi individu positif secara signifikan lebih rendah daripada 3/n3/n3/n dengan kesalahan tipe 1 kurang dari dan sangat dekat 5%5%5\%. Fakta ini, kadang-kadang disebut "aturan tiga", adalah konsekuensi dari ketidaksetaraanexp(−np1−p)≤Pr(X=0)≤exp(−np).exp⁡(−np1−p)≤Pr(X=0)≤exp⁡(−np).\exp\left(-\frac{np}{1-p}\right) \leq \Pr(X=0) \leq \exp(-np). Apakah Anda tahu …
Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.