Brexit: apakah "pergi" secara statistik signifikan? [Tutup]

12

Ditutup . Pertanyaan ini didasarkan pada pendapat . Saat ini tidak menerima jawaban.

Ingin meningkatkan pertanyaan ini? Perbarui pertanyaan sehingga dapat dijawab dengan fakta dan kutipan dengan mengedit posting ini .

Ditutup 3 tahun yang lalu .

Dalam posting ini kami mengajukan pertanyaan tentang fenomena alam yang disebut manusia berusaha untuk menemukan keputusan dengan menghitung suara . Insiden spesifik dari fenomena alam sedemikian rupa sehingga pertanyaan ini adalah tentang Brexit .

Catatan: pertanyaannya bukan tentang politik. Tujuannya adalah untuk mencoba mendiskusikan fenomena alam seperti itu dari sudut pandang statistik berdasarkan pengamatan.

Pertanyaan spesifik adalah:

Pertanyaan: Apa arti Brexit untuk meninggalkan artinya? Misalnya apakah itu berarti publik benar-benar ingin meninggalkan UE? Apakah itu hanya berarti bahwa publik tidak yakin dan perlu lebih banyak waktu untuk berpikir? Atau itu sesuatu yang lain? $51.9\%$

Asumsi 1: tidak ada kesalahan dalam proses pemilihan.

statistical-significance voting-system

— manusia gua
sumber

14

Demokrasi bukan tentang signifikansi statistik. Hasil 51,9% berarti bahwa 51,9% dari mereka yang memilih, memilih "pergi". Ini bukan jajak pendapat. Mereka yang tidak memilih, memilih dengan (tidak) menggunakan kaki mereka. Menafsirkan 51,9% sebagai "publik tidak yakin dan perlu lebih banyak waktu untuk berpikir" hanyalah berbohong dengan statistik. Brexit terjadi dengan probabilitas 1.

— Tim

7

Utas ini ditakdirkan untuk menjadi non-statistik, berpendapat, dan bahkan mungkin polemik. Hanya saja tidak cocok untuk situs ini, terlepas dari seberapa populernya itu. Kami memiliki ruang obrolan yang diisi oleh orang-orang yang dengan senang hati akan terlibat lebih jauh dalam percakapan seperti itu: lihatlah!

— Whuber

2

Saya percaya diskusi saat ini terfokus secara statistik dan merupakan contoh yang baik untuk menafsirkan hasil pemungutan suara sebagaimana berlaku untuk pengujian statistik.

— Underminer

3

Anda memunculkan masalah penting: kesalahan pengukuran metrik opini publik seperti jajak pendapat. Saya khawatir sumber kesalahan utama bukan dari ukuran sampel.

— Aksakal

4

IMHO, ini adalah pertanyaan non-statistik dengan lapisan tipis statistik yang ditambahkan untuk menyamarkan fakta itu. Ketika saya membacanya, asumsi "tidak ada kesalahan dalam proses pemungutan suara" menghilangkan semua pertimbangan statistik dan tentu saja menyalurkan diskusi ke dalam arti "pemungutan suara ..." dalam demokrasi. Itu masalah ilmu politik dan filsafat, bukan statistik.

— Whuber

17

Saya setuju dengan @Underminer bahwa tidak ada kesalahan pengambilan sampel, tetapi bukan karena sampel besar, tetapi karena tidak ada pengambilan sampel yang terlibat . Tidak ada yang disampel untuk memilih. Jelas ada sebagian kecil orang yang ingin memilih tetapi, tidak dapat (misalnya mengalami kecelakaan mobil pada hari ini), atau yang memberikan suara tidak sah, tetapi itulah satu-satunya "pengambilan sampel" di sini.

Hasilnya tepat, tidak ada kesalahan yang terlibat karena seluruh populasi mengambil bagian dalam pemungutan suara (beberapa mengambil bagian dengan tidak mengambil bagian di dalamnya). Beberapa orang memutuskan untuk memilih, beberapa tidak. Beberapa memutuskan untuk memilih cuti, beberapa tidak. Demokrasi bukan tentang signifikansi statistik, tetapi tentang apa yang sebenarnya terjadi . Voting tidak dimaksudkan untuk belajar tentang pendapat orang, tetapi untuk membuat keputusan. Sebenarnya, orang kadang-kadang tidak memilih sesuai dengan apa yang mereka pikirkan, tetapi untuk mewujudkan, atau mencapai sesuatu . Misalnya, dalam pemilihan, orang dapat memilih bukan untuk kandidat pilihan mereka, tetapi untuk kandidat pilihan kedua mereka jika mereka berpikir dia memiliki peluang lebih besar untuk menang.

— Tim
sumber

Pertimbangkan kasus daerah abu-abu di mana populasi pemilih tidak begitu yakin tentang apa yang baik bagi mereka. Sebagai contoh, kasus memiliki 2 kandidat yang hampir sama baiknya. Dalam hal demikian, saya pikir mereka yang memberikan suara, mungkin akan berbeda secara tidak sistematis karena saya pikir suara mereka mungkin memiliki distribusi yang dekat dengan yang seragam. Tujuan saya di sini bukan untuk mendefinisikan kembali demokrasi (topik politik) tetapi untuk melihat apa yang dapat kita katakan tentang apakah Brexit adalah wilayah abu-abu?

— manusia gua

2

@caveman tidak peduli apakah mereka yakin, atau tidak, yang penting adalah bagaimana mereka memilih karena pemungutan suara adalah tentang suara aktual Yang pasti, beberapa orang tidak memiliki pendapat yang jelas, dengan beberapa dari mereka memberikan suara dan beberapa tidak, tetapi ini juga tidak masalah karena yang diperhitungkan adalah suara sebenarnya dari mereka yang memberikan suara.

— Tim

Jika saya memahaminya dengan benar, maksud Anda adalah bagaimana demokrasi mengartikan suara? Saya setuju dengan kamu. Namun, saya tidak menafsirkannya seperti yang dilakukan para politisi. Saya mencoba menggunakan populasi untuk mengidentifikasi apakah keputusan itu baik, buruk, atau tidak terlalu jelas. Ini adalah penggunaan suara yang berbeda.

— manusia gua

2

@caveman orang berubah pikiran sepanjang waktu, psikolog menulis ribuan makalah tentang ini ... Ya, 51,9% tidak berarti bahwa tepat 51,9% orang Inggris 100% yakin tentang meninggalkan UE. Orang-orang bahkan tidak yakin tentang membandingkan panjang garis ( en.wikipedia.org/wiki/Asch_conformity_experiments ) ...

— Tim

1

@Aksakal Saya tidak akan mengomentari siapa yang berhak memilih dan siapa yang tidak. Saya juga tidak akan mengomentari betapa sulitnya untuk mendapatkan kredensial yang diperlukan. Itu adalah politik dan karenanya tidak menjadi topik di sini. Dari perspektif statistik, setiap pemilih yang memenuhi syarat memiliki probabilitas tertentu untuk tidak memilih. Peluang ini mungkin dipengaruhi oleh faktor-faktor tertentu yang mungkin atau mungkin tidak terkait dengan preferensi mereka, tetapi setiap pemilih yang memenuhi syarat memilih (tidak) untuk menggunakan hak itu atas kebijakannya sendiri.

— user3697176

9

51,9% adalah persentase pemilih yang ingin pergi . Karena ukuran sampel sangat besar (> 33 juta), hampir tidak ada kesalahan pengambilan sampel secara acak.

Pengujian signifikansi statistik akan mencoba untuk menentukan apakah perbedaan dalam tetap dan cuti dapat dijelaskan oleh kesalahan sampling acak saja, dan perbedaannya akan signifikan (lihat jawaban @ manusia gua)

Masalah dengan pendekatan ini adalah bahwa signifikansi statistik membuat asumsi yang sangat kuat bahwa sampel tersebut mewakili seluruh populasi (seluruh Inggris), bukan hanya mereka yang memberikan suara.

Tingkat non-respons (mereka yang tidak memilih) sangat penting dalam menentukan apakah lebih dari setengah dari seluruh Inggris ingin 'pergi', dan sulit untuk diukur. Bias non-respons dibuat ketika subkelompok yang cenderung memilih memiliki pandangan yang berbeda secara sistematis. Berdasarkan jajak pendapat keluar, misalnya, milenium cenderung memilih, tetapi lebih cenderung memilih untuk tetap , yang bias hasilnya ketika mencoba untuk mewakili populasi seluruh Inggris.

Untuk alasan ini, pengujian signifikansi statistik dalam arti tradisional sebagian besar tidak pantas .

Asumsi: Kita perlu mendefinisikan beberapa istilah agar semua ini masuk akal dan menghindari diskusi politik tentang apa yang ingin dicapai oleh pemungutan suara. Inilah definisi saya:

Populasi: Setiap orang yang tinggal di Inggris

Sampling Frame: Setiap orang yang berhak memilih dapat memilih

Metodologi Pengambilan Sampel: Respons sukarela, tindakan memilih berpartisipasi dalam survei

Contoh: Individu yang benar-benar memilih

Dalam pengaturan ini, proporsi sampel dapat digunakan (baik atau buruk) untuk memperkirakan persentase semua orang yang condong ke arah tetap (atau pergi ).

— Underminer
sumber

8

Anda bertanya

Apa arti 51.9% Brexit untuk meninggalkan berarti?

Ini berarti 51,9% pemilih memilih untuk pergi.

Misalnya apakah itu berarti publik benar-benar ingin meninggalkan UE? Apakah itu hanya berarti bahwa publik tidak yakin dan perlu lebih banyak waktu untuk berpikir? Atau itu sesuatu yang lain?

Suara terdiri "cuti" dan $17\,421\,887$ "tetap", menunjukkan $16\,146\,297$ pemilih yang memenuhi syarat tidak memilih dan sekitar juta penduduk tidak berhak memilih. Karena baik koleksi pemilih yang sebenarnya maupun koleksi pemilih yang memenuhi syarat adalah "publik" dan tidak ada sampel representatif (acak, tidak memihak, pilih kata sifat yang relevan) dari "publik", suara Brexit 51,9% tidak memberi tahu Anda yang kedua dan pertanyaan selanjutnya. $12\,931\,353$ $18$

Dimungkinkan untuk membuat kuesioner yang responsif terhadap pertanyaan Anda. Ini sepertinya bukan yang terjadi dalam referendum seperti yang diterapkan.

— Menara Eric
sumber

1

Bisakah Anda mendiskusikan arti suara dalam kaitannya dengan pemilih (yaitu bukan seluruh populasi), di luar kesimpulan bahwa itu berarti " 51,9% suara cuti "? Saya bertanya-tanya sejauh mana informasi yang dapat kita ambil dari ini.

— manusia gua

4

Manusia gua, komentar ini, lebih dari yang lain, menunjukkan pertanyaan Anda non-statistik. Karena 51,9% (bersama dengan jumlah total) merupakan semua data dalam bukti tentang pemilih, dan tidak ada ketidakpastian (kecuali jika Anda ingin menantang keakuratan penghitungan, yang merupakan masalah terpisah), penolakan Anda terhadap jawaban ini menyiratkan Anda mencari kesimpulan non-statistik .

— Whuber

Bagaimana jika kita memodelkan Brexit sebagai masalah klasifikasi biner, dan menganggap pemilih sebagai perkiraan pengklasifikasi yang merupakan anggota ansambel. Dalam model ini, tujuannya bukan untuk mengidentifikasi apa yang diinginkan sebagian besar warga, tetapi tujuannya adalah untuk mengidentifikasi penggolong yang optimal dari ruang penggolong. Kami kemudian dapat menggunakan beberapa langkah untuk menguji kebaikan ensemble berbasis manusia-pemilih seperti itu. Misalnya kita dapat menggunakan Perplexity atau sesuatu yang cocok untuk tugas klasifikasi biner ini di mana kebenaran dasar tidak diketahui (misalnya kita jelas tidak tahu apakah cuti lebih baik daripada tetap).

— manusia gua

@caveman: Mengingat bahwa kebenaran dasar (benar) tidak diketahui, metrik apa yang akan Anda gunakan untuk "mengidentifikasi classifier optimal dari ruang classifier"? Metrik semacam itu menyandikan bias analis yang memilih metrik, kecuali metrik "mereproduksi hasil suara", untuk metrik yang Anda sudah tahu jawabannya: 51,9% / 48,1%.

— Eric Towers

@EricTowers Aku sudah ini untuk politics.stackexchange.com di mana saya berbicara tentang metode yang berbeda - politics.stackexchange.com/questions/11433/...

— gua

2

TL; DR

Saya mensimulasikan populasi yang tidak pasti di bawah (di bawah perincian ) untuk kali, dan kemudian mengukur probabilitas mengamati suara cuti bawah populasi yang tidak pasti seperti itu . Ini memberi saya probabilitas simulasi bahwa populasi yang tidak pasti dapat mencapai suara cuti yang atau lebih besar. $R=1000$ $\ge 51.9\%$ $51.9\%$

Probabilitas simulasi cuti di bawah populasi yang tidak pasti ini adalah . $0$

Mungkin berlebihan, tetapi saya juga melakukan hal yang sama tetapi dengan tetap mengukur probabilitas bahwa populasi yang tidak pasti untuk mendapatkan suara tetap . $\le 48.1\%$

Probabilitas simulasi untuk tetap di bawah populasi yang tidak pasti ini juga . $0$

Oleh karena itu saya menyimpulkan bahwa suara Brexit bukan efek samping berisik dari populasi yang tidak yakin atau bingung . Tampaknya ada alasan sistematis yang membuat mereka meninggalkan Uni Eropa.

Saya mengunggah kode simulator di sini: https://github.com/Al-Caveman/Brexit

Detail

Dengan Asumsi 1 , kemungkinan jawaban (atau hipotesis) adalah:

$H_0$
$H_1$

Catatan: bahwa tidak mungkin publik ingin tetap percaya diri karena kami telah mengesampingkan kesalahan pemilihan.

$H_0$ $H_1$

$\ge 51.9\%$
$\le 1-51.9\%$

$H_1$ $H_0$

Untuk mengukur probabilitas ini, kita perlu mengetahui distribusi populasi Inggris yang tidak pasti dalam sistem pemilihan biner seperti Brexit. Oleh karena itu, langkah pertama saya adalah mensimulasikan distribusi ini dengan mengikuti asumsi di bawah ini:

Asumsi 2: populasi yang terdiri dari individu yang tidak pasti akan memiliki hak pilih secara acak . Yaitu setiap jawaban yang mungkin memiliki kesempatan yang sama untuk dipilih.

Dalam pandangan saya asumsi ini adil / masuk akal.

Selain itu, kami memodelkan kampanye cuti dan tetap sebagai dua proses berbeda sebagai berikut:

$P_{\text{leave}}$ $O_{\text{leave}} = [l_1, l_2, \ldots, l_n]$
$P_{\text{remain}}$ $O_{\text{remain}} = [r_1, r_2, \ldots, r_n]$

dimana:

$n$
$i \in \{1,2,\ldots,n\}$ $l_i,r_i \in \{0, 1\}$ $0$ $1$

tunduk pada batasan berikut:

$i \in \{1,2,\ldots,n\}$ $l_i$ $r_i$ $1$ $l_i=1$ $r_i = 0$ $r_i=1$ $l_i=0$ $i$ $\{1,2,\ldots,n\}$

$O_{\text{leave}} = [1,0,0]$ $3$

$O_{\text{remain}} = [0,1,0]$ $3$

$O_{\text{leave}}[3] = O_{\text{remain}}[3] = 0$

$33,568,184$ $51.9\%$ $100-51.9=48.1\%$

$n = 33,568,184$
$33,568,184 \times 0.519 = 17,421,887.496$ $\sum_{i = 1}^{33, 568, 184} O_{leave} [i] = 17, 421, 887.496 \approx 17, 421, 887$ $\sum_{i=1}^{33,568,184}O_{\text{leave}}[i] = 17,421,887.496 \approx 17,421,887$
$33,568,184 \times (1-0.519) = 16,146,296.504$ $\sum_{i = 1}^{33, 568, 184} O_{remain} [i] = 16, 146, 296.504 \approx 16, 146, 297$ $\sum_{i=1}^{33,568,184}O_{\text{remain}}[i] = 16,146,296.504 \approx 16,146,297$

Oleh karena itu, kami mendefinisikan array output sebagai berikut:

$i \in \{1,2,\ldots, 17421887\}$ $O_{\text{leave}}[i] = 1$
$i \in \{17421887+1,17421887+2,\ldots, 33568184\}$ $O_{\text{leave}}[i] = 0$
$i \in \{1,2,\ldots, 17421887\}$ $O_{\text{remain}}[i] = 0$
$i \in \{17421887+1,17421887+2,\ldots, 33568184\}$ $O_{\text{remain}}[i] = 1$
$i \in \{1,2,\ldots, 33568184\}$ $O_{\text{unsure},m}[i] = C$ $C$ $\{0,1\}$ $m$ $O_{\text{unsure},m}$ $O_{\text{unsure},m}$ $O_{\text{unsure},1} = O_{\text{unsure},2}$ $0.5^{33,568,184}$

$p_{\text{leave}}$

p_{leave} = \frac{1}{R} \sum_{m = 1}^{R} {\begin{cases} 1 & if (\sum_{i = 1}^{33, 568, 184} O_{leave} [i]) \leq (\sum_{i = 1}^{33, 568, 184} O_{unsure, m} [i]) \\ 0 & else \end{cases}

$p_{\text{leave}} = \frac{1}{R}\sum_{m=1}^R \begin{cases} 1 & \text{if } \Big(\sum_{i=1}^{33,568,184} O_{\text{leave}}[i]\Big) \le \Big(\sum_{i=1}^{33,568,184} O_{\text{unsure},m}[i]\Big)\\ 0 & \text{else} \end{cases}$

R

$R$

O_{unsure, m}

$O_{\text{unsure},m}$ didefinisikan.

$p_{\text{remain}}$

p_{remain} = \frac{1}{R} \sum_{m = 1}^{R} {\begin{cases} 1 & if (\sum_{i = 1}^{33, 568, 184} O_{remain} [i]) \geq (\sum_{i = 1}^{33, 568, 184} O_{unsure, m} [i]) \\ 0 & else \end{cases}

$p_{\text{remain}} = \frac{1}{R}\sum_{m=1}^R \begin{cases} 1 & \text{if } \Big(\sum_{i=1}^{33,568,184} O_{\text{remain}}[i]\Big) \ge \Big(\sum_{i=1}^{33,568,184} O_{\text{unsure},m}[i]\Big)\\ 0 & \text{else} \end{cases}$

$R=1,000$

total leave votes: 17421887
total remain votes: 16146297
simulating p values............ ok
p value for leave: 0.000000
p value for remain: 0.000000

Dengan kata lain:

$p_{\text{leave}} = 0$
$p_{\text{remain}} = 0$

— manusia gua
sumber

2

Mungkin yang lebih penting dalam kasus ini adalah tingkat non-respons (yaitu individu yang tidak memilih). Batas kesalahan (atau ukuran signifikansi statistik) hanya memperhitungkan kesalahan sampel acak. Bias non-respons TIDAK termasuk dalam hal ini, dan itu jauh lebih berdampak daripada kesalahan pengambilan sampel acak dengan jajak pendapat dengan ukuran sampel yang besar.

— Underminer

46, 499, 537

$46,499,537$

46, 499, 537 - (17421887 + 16146297) = 12, 931, 353

$46,499,537 - (17421887+16146297) = 12,931,353$

3

Tidak ada cara yang memuaskan secara statistik untuk menangani data yang hilang secara tidak acak.

— Underminer

Mereka yang belum memilih, dapat terdiri dari individu-individu yang tidak peduli dengan politik (misalnya tidak ada kepercayaan lagi). Atau, para pemilih itu bisa jadi mereka yang tidak yakin. Atau, bisa jadi campuran keduanya. Apa yang akan terjadi jika kita menganggap bahwa " semua pemilih tidak yakin "? Apakah ini akan menjadi batas atas untuk menguji apakah situasi saat ini adalah di mana publik merasa bahwa Brexit adalah daerah abu - abu ?

— manusia gua

3

Ada kebingungan di sini tentang sifat & cakupan statistik. Anda berusaha membuat model proses pemungutan suara, & bagaimana hal itu dapat menginformasikan mekanisme & validitas tata kelola & pengambilan keputusan publik. Ini adalah tugas yang berharga dalam Ilmu Politik . Ini bukan statistik (walaupun statistik terlibat).

— gung - Reinstate Monica

1

Anda dapat mengajukan pertanyaan yang sedikit berbeda: Dengan anggapan bahwa 50% dari populasi yang sangat besar memilih "Ya", dan Anda bertanya sampel acak ukuran S, berapa probabilitas bahwa 51,9% dari sampel Anda menjawab "Ya", tergantung pada ukuran sampel?

$S^{1/2}$

$S^{1/2}$ $(6.1 * 0.5 / 0.019)^2$

— gnasher729
sumber

0

Ini adalah solusi lain yang menggunakan metode analitis dan bukan simulasi.

$n$ $0.5$

$51.9\%$ $17,421,887$ $O_{\text{leave}}$ $0.5^{33,568,184}$ $17,421,887 + 1$ $0.5^{33,568,184}$

$\ge 17,421,887$

\begin{aligned} \sum_{i = 17, 421, 887}^{33, 568, 184} {0.5}^{33, 568, 184} & = (33, 568, 184 - 17, 421, 887) \times {0.5}^{33, 568, 184} \\ = 8.39663381928984 \times 10^{-} 10105024 \\ \approx 0 \end{aligned}

$\begin{split} \sum_{i=17,421,887}^{33,568,184} 0.5^{33,568,184} &= (33,568,184-17,421,887) \times 0.5^{33,568,184}\\ &= 8.39663381928984×10^-10105024\\ &\approx 0\\ \end{split}$

( dihitung oleh Wolframalpha ) $8.39663381928984×10^-10105024$

Dan ini adalah probabilitas memiliki dari cuti suara populasi yang tidak pasti . $\ge 51.9\%$

— manusia gua
sumber