Cara TIDAK menggunakan statistik


15

Ini semacam pertanyaan terbuka tapi saya ingin jelas. Mengingat populasi yang cukup Anda mungkin dapat belajar sesuatu (ini adalah bagian terbuka) tetapi apa pun yang Anda pelajari tentang populasi Anda, kapan itu bisa berlaku untuk anggota populasi?

Dari apa yang saya pahami tentang statistik, itu tidak pernah berlaku untuk satu anggota populasi, namun, sering kali saya menemukan diri saya dalam diskusi di mana orang lain berkata, "Saya membaca bahwa 10% populasi dunia memiliki penyakit ini" dan terus menyimpulkan bahwa setiap orang kesepuluh di dalam ruangan memiliki penyakit ini.

Saya mengerti bahwa sepuluh orang di ruangan ini bukan sampel yang cukup besar untuk statistik yang relevan tetapi tampaknya tidak banyak.

Lalu ada hal tentang sampel yang cukup besar . Anda hanya perlu menyelidiki populasi yang cukup besar untuk mendapatkan statistik yang andal. Namun, bukankah ini sebanding dengan kompleksitas statistik? Jika saya mengukur sesuatu yang sangat langka, bukankah itu berarti saya perlu sampel yang jauh lebih besar untuk dapat menentukan relevansi untuk statistik seperti itu?

Masalahnya adalah, saya benar-benar mempertanyakan validitas surat kabar atau artikel mana pun ketika statistik terlibat, cara mereka digunakan untuk membangun kepercayaan.

Itu sedikit latar belakang.

Kembali ke pertanyaan, dengan cara apa Anda TIDAK BISA atau mungkin Anda TIDAK menggunakan statistik untuk membentuk argumen . Saya meniadakan pertanyaan karena saya ingin mengetahui lebih lanjut tentang kesalahpahaman umum tentang statistik.


2
Ini hanya jawaban yang sangat parsial, jadi saya tidak akan mempostingnya sebagai jawaban. Anda benar bahwa statistik yang kompleks membutuhkan populasi yang lebih besar; Anda mengacu pada konsep "derajat kebebasan", yang merupakan jumlah variabel independen dikurangi satu. Juga, ketika melakukan sesuatu seperti uji-p, ambang penolakan Anda bergantung pada jumlah derajat kebebasan di samping nilai-p yang Anda pilih (biasanya 0,05).

2
Jika lebih banyak orang membaca Hooke's How to Tell the Liars dari the Statisticians , mungkin tidak akan ada banyak "pengisap statistik" seperti yang sekarang kita miliki di dunia.
JM bukan ahli statistik

1
Saya pikir Anda mungkin mendapat manfaat dari mengajukan pertanyaan ini di stats stackexchange - Saya menandai pertanyaan itu jadi mungkin pertanyaan itu akan dipindahkan ke sana.
Tertarik

Saya bahkan tidak tahu kami memiliki forum yang didedikasikan untuk analisis statistik. Saya akan memindahkan pertanyaan, Jika saya tahu caranya ...

Jawaban:


2

Untuk membuat kesimpulan tentang suatu kelompok berdasarkan populasi, kelompok tersebut harus mewakili populasi dan independen. Orang lain telah membahas hal ini, jadi saya tidak akan membahas bagian ini.

Satu hal lain yang perlu dipertimbangkan adalah probabilitas yang tidak intuitif. Mari kita asumsikan bahwa kita memiliki kelompok 10 orang yang independen dan mewakili populasi (sampel acak) dan kita tahu bahwa dalam populasi 10% memiliki karakteristik tertentu. Oleh karena itu masing-masing dari 10 orang memiliki peluang 10% untuk memiliki karakteristik. Asumsi umum adalah bahwa cukup pasti bahwa setidaknya 1 akan memiliki karakteristik. Tapi itu adalah masalah binomial sederhana, kita dapat menghitung probabilitas bahwa tidak ada dari 10 yang memiliki karakteristik, yaitu sekitar 35% (konvergen ke 1 / e untuk kelompok yang lebih besar / probabilitas yang lebih kecil) yang jauh lebih tinggi daripada perkiraan kebanyakan orang. Ada juga peluang 26% bahwa 2 orang atau lebih memiliki karakteristik.


9

Kecuali orang-orang di ruangan itu adalah sampel acak dari populasi dunia, kesimpulan apa pun berdasarkan statistik tentang populasi dunia akan sangat mencurigakan. Satu dari setiap 5 orang di dunia adalah orang Cina, tetapi tidak satu pun dari lima anak saya ...


6
  1. Untuk mengatasi penerapan statistik yang berlebihan pada sampel-sampel kecil, saya sarankan untuk membalas dengan lelucon-lelucon terkenal ("Saya sangat senang, ibu saya hamil lagi dan adik bayi saya adalah orang China." "Mengapa?" "Saya telah membaca bahwa setiap bayi keempat adalah Cina. ").

  2. Sebenarnya, saya merekomendasikan lelucon untuk mengatasi semua jenis kesalahpahaman dalam statistik, lihat http://xkcd.com/552/ untuk korelasi dan sebab-akibat.

  3. Masalah dengan artikel surat kabar jarang fakta bahwa mereka memperlakukan fenomena langka.

  4. Paradoks Simpsons muncul sebagai contoh bahwa statistik jarang dapat digunakan tanpa analisis penyebabnya.


2
Variasi lelucon "Bayi Cina" yang kudengar membuat ibu hamil takut bayinya dianggap alien asing dan dengan demikian dideportasi ...
JM bukan ahli statistik

3

Ada artikel yang menarik oleh Mary Gray tentang penyalahgunaan statistik dalam kasus-kasus pengadilan dan hal-hal seperti itu ...

Gray, Mary W.; Statistik dan Hukum. Matematika Mag. 56 (1983), no. 2, 67–81



1

Analisis statistik atau data statistik?

Saya pikir contoh ini dalam pertanyaan Anda berkaitan dengan data statistik: "Saya membaca bahwa 10% populasi dunia menderita penyakit ini". Dengan kata lain, dalam contoh ini seseorang menggunakan angka untuk membantu mengkomunikasikan kuantitas secara lebih efektif daripada hanya mengatakan 'banyak orang'.

Dugaan saya adalah bahwa jawaban untuk pertanyaan Anda tersembunyi dalam motivasi pembicara tentang mengapa dia menggunakan angka. Bisa jadi untuk mengomunikasikan gagasan yang lebih baik atau bisa untuk menunjukkan otoritas atau bisa untuk menyilaukan pendengar. Hal yang baik tentang menyatakan angka daripada mengatakan 'sangat besar' adalah bahwa orang dapat menyangkal angka tersebut. Lihat ide Popper tentang sanggahan.


0

Hipotesa: SEBUAH

(Buku Teks) Hasil: Jangan menolakSEBUAH (σ=c)

Pernyataan Anda: SEBUAH tahan dengan probabilitas σ!

Yang benar adalah: Dalam hal ini, Anda tidak tahu apa-apa. Jika Anda ingin "membuktikan"SEBUAH, hipotesis Anda harus ¬SEBUAH; tolak denganσ untuk mendapatkan pernyataan yang diinginkan.


0

Dari apa yang saya pahami tentang statistik, ini tidak pernah berlaku untuk satu anggota populasi saja

Itu tidak benar. Tergantung aplikasinya.

Contoh: peluruhan nuklir dalam fisika. Tingkat peluruhan, menentukan probabilitas peluruhan setiap inti tunggal . Anda mengambil nukleus apa pun dan itu akan memiliki kemungkinan pembusukan yang persis sama, yang Anda buat dengan eksperimen pada sampel.

Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.