Pertanyaan yang diberi tag «reproducible-research»

Praktik penelitian dalam membuat deskripsi eksperimental lengkap, seluruh data yang dikumpulkan, dan semua skrip analisis data tersedia untuk umum, sehingga hasil yang dipublikasikan dapat direproduksi di tempat lain.

2
Berapa banyak yang kita ketahui tentang peretasan “di alam liar”?
Frasa p -hacking (juga: "pengerukan data" , "pengintai" atau "memancing") mengacu pada berbagai jenis malpraktek statistik di mana hasilnya menjadi signifikan secara statistik secara artifisial. Ada banyak cara untuk mendapatkan hasil yang "lebih penting", termasuk tetapi tidak terbatas pada: hanya menganalisis subset data yang "menarik" , di mana suatu pola …


8
Hasilkan variabel acak dengan korelasi yang ditentukan dengan variabel yang ada
Untuk studi simulasi saya harus membuat variabel acak yang menunjukkan korelasi (populasi) prefined ke variabel .YYY Saya melihat ke dalam Rpaket copuladan CDVineyang dapat menghasilkan distribusi multivarian acak dengan struktur ketergantungan yang diberikan. Namun, tidak mungkin untuk memperbaiki salah satu variabel yang dihasilkan ke variabel yang ada. Setiap ide dan …



5
Apakah nilai p pada dasarnya tidak berguna dan berbahaya untuk digunakan?
Artikel ini " The Odds, Continuous Updated" dari NY Times kebetulan menarik perhatian saya. Singkatnya, ini menyatakan itu [Statistik Bayesian] terbukti sangat berguna dalam mendekati masalah kompleks, termasuk pencarian seperti yang digunakan Coast Guard pada 2013 untuk menemukan nelayan yang hilang, John Aldridge (meskipun tidak, sejauh ini, dalam perburuan untuk …

6
Cara meningkatkan reproduksibilitas penelitian jangka panjang (terutama menggunakan R dan Sweave)
Konteks: Menanggapi pertanyaan sebelumnya tentang penelitian yang dapat direproduksi, Jake menulis Satu masalah yang kami temukan saat membuat arsip JASA kami adalah bahwa versi dan standar paket CRAN berubah. Jadi, dalam arsip itu, kami juga menyertakan versi paket yang kami gunakan. Sistem berbasis sketsa mungkin akan rusak ketika orang mengubah …



4
Sebagai peninjau, dapatkah saya membenarkan meminta data dan kode tersedia meskipun jurnal tidak?
Karena sains harus dapat direproduksi, menurut definisi, ada peningkatan pengakuan bahwa data dan kode merupakan komponen penting dari reproduktifitas, seperti yang dibahas oleh Yale Roundtable untuk data dan pembagian kode . Dalam meninjau naskah untuk jurnal yang tidak memerlukan berbagi data dan kode, dapatkah saya meminta agar data dan kode …

1
Apakah kinerja canggih menggunakan vektor paragraf untuk analisis sentimen telah direplikasi?
Saya terkesan dengan hasil dalam makalah ICML 2014 " Representasi Terdistribusi dari Kalimat dan Dokumen " oleh Le dan Mikolov. Teknik yang mereka gambarkan, disebut "vektor paragraf", mempelajari representasi paragraf / dokumen yang panjangnya tidak diawasi secara sewenang-wenang, berdasarkan perluasan model word2vec. Makalah ini melaporkan kinerja canggih pada analisis sentimen …


1
Bagaimana jika akurasi validasi tinggi tetapi akurasi tes rendah dalam penelitian?
Saya memiliki pertanyaan spesifik tentang validasi dalam penelitian pembelajaran mesin. Seperti yang kita ketahui, rezim pembelajaran mesin meminta para peneliti untuk melatih model mereka pada data pelatihan, memilih dari model kandidat dengan set validasi, dan melaporkan akurasi pada set tes. Dalam studi yang sangat ketat, set tes hanya dapat digunakan …

3
Opsi hosting untuk data yang tersedia untuk umum
Jadi Anda telah memutuskan untuk mendukung gagasan penelitian yang dapat direproduksi dan ingin membuat data Anda tersedia secara online untuk dilihat dan digunakan orang. Pertanyaannya adalah, di mana Anda menyimpannya? Kecenderungan pertama saya tentu saja adalah ruang web pribadi yang saya miliki di server universitas, tetapi hal-hal ini sebenarnya tidak …

4
Implikasi dari perdebatan saat ini pada signifikansi statistik
Dalam beberapa tahun terakhir, berbagai cendekiawan telah mengangkat masalah pengujian hipotesis ilmiah yang merugikan, dijuluki "derajat kebebasan peneliti," yang berarti bahwa para ilmuwan memiliki banyak pilihan untuk membuat selama analisis mereka yang bias terhadap penemuan dengan nilai p <5%. Pilihan ambigu ini, misalnya, kasus mana yang akan dimasukkan, kasus mana …
Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.