Statistik dan Big Data

T&J untuk orang-orang yang tertarik dalam statistik, pembelajaran mesin, analisis data, penambangan data, dan visualisasi data

3
Apakah ada kasus di mana PCA lebih cocok daripada t-SNE?
Saya ingin melihat bagaimana 7 ukuran perilaku koreksi teks (waktu yang dihabiskan untuk memperbaiki teks, jumlah penekanan tombol, dll.) Saling berhubungan. Ukurannya berkorelasi. Saya menjalankan PCA untuk melihat bagaimana langkah-langkah diproyeksikan ke PC1 dan PC2, yang menghindari tumpang tindih menjalankan tes korelasi dua arah terpisah antara langkah-langkah. Saya ditanya mengapa …
39 pca  tsne 


7
Apa bias paling umum yang dibuat manusia ketika mengumpulkan atau menafsirkan data?
Saya seorang econ / stat major. Saya sadar bahwa para ekonom telah mencoba memodifikasi asumsi mereka tentang perilaku manusia dan rasionalitas dengan mengidentifikasi situasi di mana orang tidak berperilaku rasional. Sebagai contoh, misalkan saya menawarkan kepada Anda peluang 100% dari kerugian $ 1000 atau peluang 50% pada kerugian $ 2500, …
39 bias 


4
Haruskah kovariat yang tidak signifikan secara statistik 'disimpan' ketika membuat model?
Saya memiliki beberapa kovariat dalam perhitungan saya untuk sebuah model, dan tidak semuanya signifikan secara statistik. Haruskah saya menghapus yang bukan? Pertanyaan ini membahas fenomena tersebut, tetapi tidak menjawab pertanyaan saya: Bagaimana menafsirkan efek non-signifikan dari kovariat di ANCOVA? Tidak ada jawaban untuk pertanyaan itu yang menunjukkan bahwa kovariat yang …

5
Menggunakan LASSO dari paket lars (atau glmnet) di R untuk pemilihan variabel
Maaf jika pertanyaan ini sedikit mendasar. Saya mencari untuk menggunakan pemilihan variabel LASSO untuk model regresi linier berganda di R. Saya memiliki 15 prediktor, salah satunya adalah kategorikal (akankah itu menyebabkan masalah?). Setelah mengatur dan saya menggunakan perintah berikut:yxxxyyy model = lars(x, y) coef(model) Masalah saya adalah ketika saya menggunakan …


1
Bagaimana menafsirkan dan melaporkan eta kuadrat / eta parsial kuadrat dalam analisis yang signifikan secara statistik dan non-signifikan?
Saya memiliki data yang memiliki nilai kuadrat eta dan nilai kuadrat eta parsial yang dihitung sebagai ukuran ukuran efek untuk perbedaan rata-rata kelompok. Apa perbedaan antara eta kuadrat dan eta kuadrat parsial? Bisakah keduanya ditafsirkan menggunakan pedoman Cohen yang sama (1988 saya pikir: 0,01 = kecil, 0,06 = sedang, 0,13 …

4
Apa arti dari "." (Titik) dalam R?
Saya hanya membaca buku "R in a Nutshell". Dan sepertinya saya melewatkan bagian di mana "." seperti pada "sample.formula" dijelaskan. > sample.formula <- as.formula(y~x1+x2) Apakah sampel objek dengan rumus bidang seperti dalam bahasa lain? Dan jika demikian, bagaimana saya bisa mengetahuinya, bidang / fungsi apa yang dimiliki objek ini? (Ketikkan …
39 r 

2
Simulasi analisis daya regresi logistik - percobaan yang dirancang
Pertanyaan ini sebagai jawaban atas jawaban yang diberikan oleh @Greg Snow sehubungan dengan pertanyaan yang saya ajukan mengenai analisis daya dengan regresi logistik dan SAS Proc GLMPOWER. Jika saya merancang percobaan dan akan menganalisis hasil dalam regresi logistik faktorial, bagaimana saya bisa menggunakan simulasi (dan di sini ) untuk melakukan …

6
Regresi sudut terkecil vs laso
Regresi sudut terkecil dan laso cenderung menghasilkan jalur regularisasi yang sangat mirip (identik kecuali ketika koefisien melintasi nol.) Keduanya cocok secara efisien dengan algoritma yang hampir identik. Adakah alasan praktis untuk lebih menyukai satu metode daripada yang lain?
39 regression  lasso 

3
Mode, Kelas dan Jenis objek R
Saya bertanya-tanya apa perbedaan antara Mode, Kelas dan Jenis objek R? Jenis objek R dapat diperoleh berdasarkan fungsi typeof (), mode per mode (), dan kelas per kelas (). Juga ada fungsi dan konsep serupa lainnya yang saya lewatkan? Terima kasih dan salam!
39 r 

3
Clojure versus R: keuntungan dan kerugian untuk analisis data
Saya punya rencana belajar R dalam waktu dekat. Membaca pertanyaan lain saya tahu tentang Clojure. Sekarang saya tidak tahu harus berbuat apa. Saya pikir keuntungan besar R bagi saya adalah bahwa beberapa orang di Ekonomi menggunakannya, termasuk salah satu penyelia saya (meskipun yang lain mengatakan: menjauhlah dari R!). Salah satu …
39 r 


8
Fungsi gambaran umum data (ringkasan) di R
Saya yakin saya telah menemukan fungsi seperti ini dalam paket R sebelumnya, tetapi setelah Googling yang luas, saya tidak dapat menemukannya di mana pun. Fungsi yang saya pikirkan menghasilkan ringkasan grafis untuk variabel yang diberikan padanya, menghasilkan keluaran dengan beberapa grafik (histogram dan mungkin kotak dan kumis plot) dan beberapa …

Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.