Apakah bootstrap kesalahan standar dan interval kepercayaan sesuai dalam regresi di mana asumsi homoseksualitas dilanggar?


13

Jika dalam regresi OLS standar dua asumsi dilanggar (distribusi kesalahan yang normal, homoseksualitas), apakah bootstrap kesalahan standar dan interval kepercayaan merupakan alternatif yang tepat untuk sampai pada hasil yang bermakna sehubungan dengan pentingnya koefisien regresi?

Apakah tes signifikan dengan kesalahan standar bootstrap dan interval kepercayaan masih "berfungsi" dengan heteroskedastisitas?

Jika ya, interval kepercayaan apa yang dapat digunakan yang dapat digunakan dalam skenario ini (persentil, BC, BCA)?

Akhirnya, jika bootstrap cocok dalam skenario ini, literatur apa yang relevan yang perlu dibaca dan dikutip untuk sampai pada kesimpulan ini? Petunjuk apa pun akan sangat dihargai!


1
Jika ada pelanggaran seperti itu, saya rasa bootstrap tidak menyembuhkannya. Alih-alih mengapa tidak mencoba mengubah (mencatat) data untuk mendekati normalitas dan menggunakan kesalahan standar yang kuat seperti dari paket sandwich di R?
B_Miner

Bootstrap berfungsi dengan baik jika Anda mengadaptasi skema resampling dengan situasi di mana Anda berada.
Glen_b -Reinstate Monica

Jawaban:


20

Setidaknya ada tiga (mungkin lebih) pendekatan untuk melakukan bootstrap untuk regresi linier dengan data independen, tetapi tidak terdistribusi secara identik. (Jika Anda memiliki pelanggaran lain terhadap asumsi "standar", misalnya, karena autokorelasi dengan data deret waktu, atau pengelompokan karena desain pengambilan sampel, segala sesuatunya menjadi semakin rumit).

  1. (yj,xj){(yi,xi)} koreksi heteroskedastisitas Huber-White .
  2. ei=yixiβ^xjej dengan penggantian dari distribusi empiris masing-masing, tapi istirahat ini turun pola heteroskedastisitas, jika ada apapun, jadi saya ragu bootstrap ini konsisten.
  3. Anda dapat melakukan bootstrap liar di mana Anda melakukan resample tanda residual, yang mengontrol untuk momen kedua bersyarat (dan, dengan beberapa tweak ekstra, untuk momen ketiga bersyarat juga). Ini akan menjadi prosedur yang saya sarankan (asalkan Anda dapat memahaminya dan mempertahankannya kepada orang lain ketika ditanya, "Apa yang Anda lakukan untuk mengendalikan heteroskedastisitas? Bagaimana Anda tahu itu berfungsi?").

Referensi pamungkas adalah Wu (1986) , tetapi Annals tidak persis membaca buku bergambar.

PEMBARUAN berdasarkan pertanyaan tindak lanjut OP yang ditanyakan dalam komentar:

Jumlah ulangan tampak besar bagi saya; satu-satunya diskusi yang baik dari parameter bootstrap ini yang saya ketahui ada di buku Intro to Bootstrap Efron & Tibshirani .

M) tentang perbandingan antara koreksi bootstrap dan heteroskedastisitas.


Terima kasih banyak atas bantuan Anda! Tolong izinkan saya satu pertanyaan lanjutan: Satu-satunya asumsi yang saya langgar adalah distribusi kesalahan yang normal dan asumsi homoseksualitas. Juga, saya hanya tertarik melihat apakah koefisien regresi saya sig. ke arah yang diharapkan atau tidak. Besarnya efek tidak penting. Saya pikir apa yang telah saya lakukan sejauh ini adalah pilihan Anda 1. Saya bootstrap kesalahan standar dan dihasilkan selain interval kepercayaan bootstrap. Saya melakukan itu dengan menggunakan Stata: vce (bootstrap, reps (2500) bca), estat bootstrap. Apakah itu menyembuhkan pelanggaran asumsi saya?
David

Saya tidak melakukan diagnosa data hanya berdasarkan sintaks Anda, dan tidak ada yang akan melakukannya. Berapa ukuran kumpulan data Anda? reps(2500)mungkin merupakan pembunuhan berlebihan, setidaknya untuk kesalahan standar; Saya pikir reps(500)tidak apa-apa untuk tujuan paling praktis. Buku bootstrap intron Efron & Tibshirani memiliki bagian tentang jumlah ulangan. Mereka memiliki seluruh bab tentang regresi, sehingga mungkin menjadi referensi baik bagi Anda untuk melihatnya.
Tugas

Terima kasih atas jawaban cepat Anda. Dataset ~ 250. Pertanyaan pada jumlah replikasi samping (terima kasih atas tautannya!), Apakah Anda setuju bahwa kesalahan standar bootstrap (dengan cara resampling pengamatan secara keseluruhan) dan / atau interval kepercayaan bootstrap (mis., Persentil atau bias bias) akan menjadi cara yang tepat untuk menentukan signifikansi (atau ketiadaannya) dari koefisien regresi mengingat pelanggaran homoseksualitas dan distribusi asumsi kesalahan yang normal? Terima kasih banyak atas masukan Anda!
David

Ya, saya akan mengatakan itu lebih baik. Jika Anda menggunakan Stata, Anda bisa mendapatkan jawaban yang sangat mirip dengan menggunakan robustopsi regresi Anda. est storebaik hasil dan est tab, semereka untuk membandingkan secara berdampingan.
Tugas

Terima kasih StasK. Saya juga melihat komentar berikut yang Anda buat di tempat lain di situs ini: "Bootstrap sederhana dengan resampling ⇔ Estimator kuat heteroskedastisitas White". Dalam konteks pertanyaan saya sebagaimana diuraikan di atas: Apakah ada artikel jurnal yang diterbitkan yang menegaskan hal ini?
David
Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.