Saya baru-baru ini meminta klien datang kepada saya untuk melakukan analisis bootstrap karena pengulas FDA mengatakan bahwa kesalahan mereka dalam regresi variabel tidak valid karena ketika mengumpulkan data dari situs analisis mencakup pengumpulan data dari tiga situs di mana dua situs termasuk beberapa sampel yang sama.
LATAR BELAKANG
Klien memiliki metode pengujian baru yang ingin mereka perlihatkan adalah "setara" dengan metode yang disetujui yang ada. Pendekatan mereka adalah membandingkan hasil kedua metode yang diterapkan pada sampel yang sama. Tiga situs digunakan untuk melakukan pengujian. Kesalahan-dalam-variabel (Deming regression) diterapkan pada data di setiap situs. Idenya adalah bahwa jika regresi menunjukkan parameter kemiringan mendekati 1 dan intersep dekat 0 ini akan menunjukkan bahwa dua teknik pengujian memberikan hasil yang hampir sama dan karenanya metode baru harus disetujui. Di situs 1 mereka memiliki 45 sampel memberi mereka 45 pengamatan berpasangan. Situs 2 memiliki 40 sampel dan situs 3, 43 sampel. Mereka melakukan tiga regresi Deming yang terpisah (dengan asumsi rasio 1 untuk kesalahan pengukuran untuk kedua metode). Jadi algoritma meminimalkan jumlah jarak tegak lurus kuadrat.
Dalam pengajuan mereka, klien menunjukkan bahwa beberapa sampel yang digunakan di situs 1 dan 2 adalah sama. Dalam ulasan tersebut, resensi FDA mengatakan bahwa regresi Deming tidak valid karena sampel umum digunakan yang menyebabkan "campur tangan" yang membuat asumsi model tidak valid. Mereka meminta agar penyesuaian bootstrap diterapkan pada hasil Deming untuk memperhitungkan gangguan ini.
Pada saat itu karena klien tidak tahu bagaimana melakukan bootstrap yang saya bawa. Istilah interferensi itu aneh dan saya tidak yakin persis apa yang didapat oleh reviewer. Saya berasumsi bahwa intinya adalah karena data yang dikumpulkan memiliki sampel umum, akan ada korelasi untuk sampel umum dan karenanya syarat kesalahan model tidak semuanya independen.
ANALISIS KLIEN
Tiga regresi terpisah sangat mirip. Masing-masing memiliki parameter kemiringan mendekati 1 dan memotong mendekati 0. Interval kepercayaan 95% berisi 1 dan 0 untuk kemiringan dan mencegat masing-masing dalam setiap kasus. Perbedaan utama adalah varians residual yang sedikit lebih tinggi di situs 3. Selanjutnya mereka membandingkan ini dengan hasil dari melakukan OLS dan menemukan mereka sangat mirip (hanya dalam satu kasus melakukan interval kepercayaan untuk lereng berdasarkan OLS tidak mengandung 1). Dalam kasus di mana OLS CI untuk lereng tidak mengandung 1, batas atas interval adalah sekitar 0,99.
Dengan hasil yang sangat mirip di ketiga situs penyatuan data situs tampak masuk akal. Klien melakukan regresi Deming yang dikumpulkan yang juga mengarah pada hasil yang sama. Mengingat hasil ini saya menulis laporan untuk klien yang membantah klaim bahwa regresi tidak valid. Argumen saya adalah bahwa karena ada kesalahan pengukuran yang serupa di kedua variabel, klien berhak menggunakan regresi Deming sebagai cara untuk menunjukkan kesepakatan / ketidaksepakatan. Regresi masing-masing situs tidak memiliki masalah kesalahan berkorelasi karena tidak ada sampel yang diulang dalam situs tertentu. Pooling data untuk mendapatkan interval kepercayaan yang lebih ketat.
Kesulitan ini dapat diatasi dengan hanya mengumpulkan data dengan sampel umum dari situs 1 mengatakan ditinggalkan. Juga tiga model situs individual tidak memiliki masalah dan valid. Bagi saya ini sepertinya memberikan bukti kuat akan persetujuan bahkan tanpa penyatuan. Selanjutnya pengukuran dilakukan secara independen di situs 1 dan 2 untuk situs umum. Jadi saya berpikir bahwa bahkan analisis yang dikumpulkan menggunakan semua data valid karena kesalahan pengukuran untuk sampel di situs 1 tidak berkorelasi dengan kesalahan pengukuran dalam sampel yang sesuai di situs 2. Ini benar-benar hanya mengulangi titik dalam desain. ruang yang seharusnya tidak menjadi masalah. Itu tidak menciptakan korelasi / "gangguan".
Dalam laporan saya, saya menulis bahwa analisis bootstrap tidak diperlukan karena tidak ada korelasi untuk menyesuaikan. Tiga model situs valid (tidak ada "gangguan" di dalam situs) dan analisis gabungan dapat dilakukan dengan menghapus sampel umum di situs 1 saat melakukan pengumpulan. Analisis yang dikumpulkan seperti itu tidak dapat memiliki masalah gangguan. Penyesuaian bootstrap tidak diperlukan karena tidak ada bias untuk menyesuaikan.
KESIMPULAN
Klien setuju dengan analisis saya tetapi takut membawanya ke FDA. Mereka ingin saya melakukan penyesuaian bootstrap.
PERTANYAAN SAYA
A) Apakah Anda setuju dengan (1) Analisis saya tentang hasil klien dan (2) argumen saya bahwa bootstrap tidak diperlukan.
B) Karena saya harus bootstrap regresi Deming, adakah prosedur SAS atau R yang tersedia bagi saya untuk melakukan regresi Deming pada sampel bootstrap?
EDIT: Mengingat saran dari Bill Huber I berencana untuk melihat batas-batas pada regresi kesalahan-dalam-variabel dengan regresi baik y pada x dan x pada y. Kita sudah tahu bahwa untuk satu versi OLS jawabannya pada dasarnya sama dengan kesalahan-dalam-variabel ketika dua varian kesalahan diasumsikan sama. Jika ini benar untuk regresi lain maka saya pikir itu akan menunjukkan bahwa regresi Deming memberikan solusi yang tepat. Apa kamu setuju?
Untuk memenuhi permintaan klien saya perlu melakukan analisis bootstrap yang diminta yang secara samar-samar didefinisikan. Secara etis saya pikir itu akan salah untuk hanya menyediakan bootstrap karena itu tidak benar-benar menyelesaikan masalah nyata klien, yaitu untuk membenarkan prosedur pengukuran pengujian mereka. Jadi saya akan memberi mereka kedua analisis dan meminta setidaknya mereka memberi tahu FDA bahwa selain melakukan bootstrap saya melakukan regresi terbalik dan membatasi regresi Deming yang saya pikir lebih tepat. Saya juga berpikir bahwa analisis akan menunjukkan bahwa metode mereka setara dengan referensi dan karena itu regresi Deming juga memadai.
Saya berencana untuk menggunakan program R yang @whuber menyarankan dalam jawabannya untuk memungkinkan saya untuk bootstrap regresi Deming. Saya tidak terlalu terbiasa dengan R tetapi saya pikir saya bisa melakukannya. Saya telah menginstal R bersama dengan R Studio. Apakah itu akan membuatnya cukup mudah bagi seorang pemula seperti saya?
Saya juga punya SAS dan saya lebih nyaman pemrograman di SAS. Jadi jika ada yang tahu cara untuk melakukan ini di SAS, saya akan sangat menghargai mengetahui tentang hal itu.