Mengapa kita tidak menggunakan angka signifikan?


18

Adakah alasan mengapa kami tidak menggunakan angka signifikan dalam statistik? Sesuatu di sepanjang garis kami menggunakan perkiraan sehingga aturan tentang ketelitian tidak berlaku;)?


1
Pembaca juga dapat menemukan utas ini: jumlah-angka-penting-untuk-dimasukkan-ke-dalam-tabel -minat.
gung - Reinstate Monica

Saya menemukan ini informatif: davegiles.blogspot.com/2011/12/...
John

Sebuah contoh di mana memperhatikan angka-angka penting benar-benar penting muncul di stats.stackexchange.com/questions/113314 , di mana OP memperoleh hasil regresi yang sangat berbeda yang dapat dilacak dengan perbedaan dalam presisi yang dengannya data dimasukkan ke dalam prosedur regresi.
whuber

Jawaban:


19

Digit signifikan digunakan di beberapa bidang (saya belajar tentang mereka dalam Kimia) untuk menunjukkan tingkat presisi bermakna yang ada dalam suatu angka. Ini adalah topik penting dalam statistik juga, jadi sebenarnya kami melaporkan ini secara terus menerus - kami hanya melaporkannya dalam bentuk yang berbeda. Secara khusus, kami melaporkan interval kepercayaan , yang menunjukkan tingkat ketepatan estimasi (seperti rata-rata).

Setelah Anda mendaftarkan 95% CI untuk perkiraan, seperti , Anda dapat membuat daftar sebanyak digit untuk nilai rata-rata yang Anda inginkan, seperti 0,50129519823975923 , dan tidak ada masalah. Faktanya, ahli statistik Andrew Gelman merekomendasikan Anda untuk mendaftar paling tidak empat (2009, hlm. 4) . (0.12,1.12)0.50129519823975923


(Bagian terakhir adalah lidah di pipi, maaf atas ketidaksopanan saya ;-).
gung - Reinstate Monica

2
+1. Sejumlah besar digit tampaknya menghasilkan respons yang tidak sopan: lihat beberapa baris terakhir dari balasan saya untuk pertanyaan serupa di situs SE lainnya.
whuber

@ Gung Bagaimana Anda memutuskan untuk mewakili titik akhir CI dengan dua desimal?
user765195

@ user765195, saya membuat angka-angka itu. Sebenarnya tidak merujuk pada apa pun.
gung - Reinstate Monica

@ung Apa yang ingin saya tanyakan adalah apa ketepatan titik akhir CI? Berapa banyak angka yang valid, katakanlah, ketika Anda menghitung CI Wilson untuk proporsi binomial?
user765195

12

Salah satu alasan untuk membatasi jumlah digit yang dilaporkan dalam banyak perkiraan, nilai-p, dll. Didasarkan pada persepsi. Melaporkan sesuatu seperti p = 0,04872429 menyiratkan tingkat presisi dalam hasil yang menyebabkan mereka dianggap lebih akurat .

Pada dasarnya, penggunaan angka dalam jumlah besar dalam melaporkan hasil statistik rasanya terlalu banyak untuk mencoba menyelubungi temuan Anda dalam suasana otoritas yang tidak patut.


1

Saya pikir itu benar-benar tergantung pada tingkat kepercayaan yang diperlukan, angka lebih sedikit untuk signifikansi sesuai untuk 95%, dibandingkan dengan 99,999% atau lebih besar, misalnya, seperti yang digunakan oleh CERN untuk banyak hasil mereka.


Untuk penjelasan lebih lanjut, artikel Wikipedia tentang Akurasi dan Presisi akan menjadi bacaan yang baik untuk poster aslinya.
Robert Jones

itu poin yang baik, tetapi bahkan ketika 𝛂 = .05 pembulatan dalam perhitungan tertentu dapat memiliki efek besar pada hasilnya.
timothy.s.lau

1

Apakah Anda berbicara tentang pembulatan data ke sejumlah digit signifikan atau pembulatan jawaban akhir Anda? Jika Anda mengumpulkan data Anda, Anda bisa masuk ke situasi di mana Anda telah membuang kebisingan yang harus digunakan perhitungan statistik.


Maksud saya jawaban akhir dan pertengahan perhitungan biasanya dibulatkan bahkan dalam buku teks.
timothy.s.lau
Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.