Statistik dan Big Data

T&J untuk orang-orang yang tertarik dalam statistik, pembelajaran mesin, analisis data, penambangan data, dan visualisasi data

9
Bagaimana cara mendapatkan nilai-p (periksa signifikansi) dari suatu efek dalam model campuran lme4?
Saya menggunakan lme4 dalam R agar sesuai dengan model campuran lmer(value~status+(1|experiment))) di mana nilai kontinu, status dan percobaan adalah faktor, dan saya dapatkan Linear mixed model fit by REML Formula: value ~ status + (1 | experiment) AIC BIC logLik deviance REMLdev 29.1 46.98 -9.548 5.911 19.1 Random effects: Groups …



8
Mengapa terus mengajar dan menggunakan pengujian hipotesis (ketika interval kepercayaan tersedia)?
Mengapa terus mengajar dan menggunakan pengujian hipotesis (dengan semua konsepnya yang sulit dan yang merupakan dosa yang paling statistik) untuk masalah di mana ada penaksir interval (kepercayaan, sepatu boot, kredibilitas atau apa pun)? Apa penjelasan terbaik (jika ada) untuk diberikan kepada siswa? Hanya tradisi? Pandangan akan sangat disambut.

13
Apa saja terobosan dalam Statistik selama 15 tahun terakhir?
Saya masih ingat tulisan Annals of Statistics tentang Boosting oleh Friedman-Hastie-Tibshirani, dan komentar tentang masalah yang sama oleh penulis lain (termasuk Freund dan Schapire). Pada saat itu, Boosting jelas dipandang sebagai terobosan dalam banyak hal: layak secara komputasi, metode ansambel, dengan kinerja luar biasa namun misterius. Sekitar waktu yang sama, …




5
Bagaimana sebenarnya "model efek acak" dalam ekonometrik berhubungan dengan model campuran di luar ekonometrik?
Saya dulu berpikir bahwa "model efek acak" dalam ekonometrik sesuai dengan "model campuran dengan intersep acak" di luar ekonometrik, tetapi sekarang saya tidak yakin. Melakukannya? Ekonometrik menggunakan istilah-istilah seperti "efek tetap" dan "efek acak" agak berbeda dari literatur pada model campuran, dan ini menyebabkan kebingungan yang terkenal. Mari kita perhatikan …

8
Bagaimana cara mensimulasikan data yang memenuhi kendala spesifik seperti memiliki rata-rata spesifik dan standar deviasi?
Pertanyaan ini dimotivasi oleh pertanyaan saya tentang meta-analisis . Tapi saya membayangkan bahwa itu juga akan berguna dalam konteks pengajaran di mana Anda ingin membuat dataset yang persis mencerminkan dataset yang sudah ada diterbitkan. Saya tahu cara menghasilkan data acak dari distribusi yang diberikan. Jadi misalnya, jika saya membaca tentang …

10
Siapa yang sering?
Kami sudah memiliki utas bertanya siapa orang Bayesian dan yang satu bertanya apakah kerap orang Bayesian , tetapi tidak ada utas yang bertanya langsung siapa yang sering ? Ini adalah pertanyaan yang ditanyakan oleh @whuber sebagai komentar di utas ini dan perlu dijawab. Apakah mereka ada (adakah yang sering mengidentifikasi …

2
Diskusi pemilihan variabel yang lebih pasti
Latar Belakang Saya sedang melakukan penelitian klinis di bidang kedokteran dan telah mengikuti beberapa kursus statistik. Saya tidak pernah menerbitkan makalah menggunakan regresi linier / logistik dan ingin melakukan pemilihan variabel dengan benar. Interpretabilitas itu penting, jadi tidak ada teknik pembelajaran mesin yang mewah. Saya telah merangkum pemahaman saya tentang …

2
Mengapa penyusutan berfungsi?
Untuk menyelesaikan masalah pemilihan model, sejumlah metode (LASSO, ridge regression, dll.) Akan mengecilkan koefisien variabel prediktor menjadi nol. Saya mencari penjelasan intuitif mengapa ini meningkatkan kemampuan prediksi. Jika efek sebenarnya dari variabel itu sebenarnya sangat besar, mengapa tidak menyusutkan parameter menghasilkan prediksi yang lebih buruk?

10
Apa saja contoh praktik anakronistik dalam statistik?
Saya merujuk pada praktik yang masih mempertahankan keberadaan mereka, meskipun masalah (biasanya komputasi) yang mereka atasi untuk mengatasi sebagian besar telah diselesaikan. Sebagai contoh, koreksi kontinuitas Yates ditemukan untuk memperkirakan uji pasti Fisher dengan uji , tetapi itu tidak lagi praktis karena perangkat lunak sekarang dapat menangani uji Fisher bahkan …

1
Wald test untuk regresi logistik
Sejauh yang saya mengerti tes Wald dalam konteks regresi logistik digunakan untuk menentukan apakah variabel prediktor tertentu signifikan atau tidak. Ia menolak hipotesis nol dari koefisien yang sesuai menjadi nol.XXX Tes terdiri dari membagi nilai koefisien dengan kesalahan standar .σσ\sigma Yang saya bingung adalah bahwa juga dikenal sebagai Z-score dan …

Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.