Sepertinya Anda membayangkan model pengambilan sampel yang sangat sederhana.
Model paling sederhana untuk pengambilan sampel disebut aptly Simple Random Sampling . Anda memilih subset dari populasi (misalnya, dengan memutar nomor telepon secara acak) dan bertanya siapa pun yang menjawab bagaimana mereka memberikan suara. Jika 487 mengatakan Clinton, 463 mengatakan Trump, dan sisanya memberi Anda jawaban aneh, maka perusahaan pemungutan suara akan melaporkan bahwa 49% pemilih lebih memilih Clinton, sementara 46% memilih Trump. Namun, perusahaan pemungutan suara melakukan lebih dari ini. Sampel acak sederhana memberikan bobot yang sama untuk setiap titik data. Namun, anggaplah sampel Anda mengandung - secara kebetulan - 600 pria dan 400 wanita, yang jelas tidak mewakili populasi secara keseluruhan. Jika pria sebagai kelompok condong ke satu arah, sementara wanita condong ke arah yang lain, ini akan membiasakan hasil Anda. Namun, karena kami memiliki statistik demografis yang cukup baik, Anda dapat mempertimbangkan *tanggapan dengan menghitung tanggapan perempuan sedikit lebih banyak dan laki-laki sedikit lebih sedikit, sehingga tanggapan tertimbang mewakili populasi yang lebih baik. Organisasi pemungutan suara memiliki model penimbangan yang lebih rumit yang dapat membuat sampel yang tidak representatif menyerupai yang lebih representatif.
Gagasan untuk menimbang respons sampel didasarkan pada landasan statistik yang cukup kuat, tetapi ada beberapa fleksibilitas dalam memilih faktor apa yang berkontribusi terhadap bobot. Sebagian besar lembaga survei melakukan reweight berdasarkan faktor demografis seperti jenis kelamin, usia, dan ras. Dengan ini, Anda mungkin berpikir bahwa identifikasi partai (Demokrat, Republik, dll) juga harus dimasukkan, tetapi ternyata sebagian besar perusahaan pemungutan suara tidak menggunakannya dalam bobot mereka: identifikasi partai (diri) dihimpit dengan pilihan pemilih. dengan cara yang membuatnya kurang bermanfaat.
Banyak pakaian pemungutan suara juga melaporkan hasilnya di antara "kemungkinan pemilih". Dalam hal ini, responden dipilih atau dibobot berdasarkan kemungkinan bahwa mereka akan benar-benar muncul ke tempat pemungutan suara. Model ini tidak diragukan lagi didorong oleh data, tetapi pilihan faktor yang tepat memungkinkan fleksibilitas. Sebagai contoh, termasuk interaksi antara kandidat dan ras pemilih (atau gender) bahkan tidak masuk akal sampai 2008 atau 2016, tetapi saya menduga mereka memiliki kekuatan prediksi sekarang.
Secara teori, Anda dapat memasukkan segala macam hal sebagai faktor penimbangan: preferensi musik, warna mata, dll. Namun, faktor demografis adalah pilihan populer untuk faktor penimbangan karena:
- Secara empiris, mereka berkorelasi baik dengan perilaku pemilih. Jelas, tidak ada hukum berbahan besi yang 'memaksa' orang kulit putih untuk menjadi ramping, tetapi selama lima puluh tahun terakhir, mereka cenderung melakukannya.
- Nilai populasi diketahui dengan baik (misalnya, dari sensus atau Catatan Penting)
Namun, lembaga survei juga melihat berita yang sama dengan yang dilakukan orang lain, dan dapat menyesuaikan variabel bobot jika perlu.
Ada juga beberapa "faktor fudge" yang kadang-kadang digunakan untuk menjelaskan hasil jajak pendapat. Misalnya, responden terkadang enggan memberikan jawaban yang "tidak diinginkan secara sosial". The Bradley Effect berpendapat bahwa pemilih kulit putih kadang-kadang mengecilkan dukungan mereka bagi calon putih berjalan terhadap minoritas untuk menghindari muncul rasis. Ini dinamai Tom Bradley, seorang kandidat gubernur Afrika-Amerika yang kalah tipis dalam pemilihan meskipun memimpin dengan nyaman dalam pemilihan.
Akhirnya, Anda sepenuhnya benar bahwa tindakan meminta pendapat seseorang dapat mengubahnya. Perusahaan polling mencoba menulis pertanyaan mereka dengan cara yang netral. Untuk menghindari masalah dengan urutan respons yang mungkin, nama kandidat mungkin dicantumkan dalam urutan acak. Beberapa versi pertanyaan juga terkadang diuji satu sama lain. Efek ini juga dapat dieksploitasi untuk tujuan jahat dalam jajak pendapat push , di mana pewawancara sebenarnya tidak tertarik untuk mengumpulkan tanggapan tetapi dalam mempengaruhi mereka. Misalnya, jajak pendapat push mungkin bertanya "Apakah Anda memilih [Calon A] bahkan jika dilaporkan bahwa ia adalah penganiaya anak-anak?".
* Anda juga dapat menetapkan target eksplisit untuk sampel Anda, seperti termasuk 500 pria dan 500 wanita. Ini disebut
pengambilan sampel bertingkat - populasi dikelompokkan menjadi kelompok-kelompok yang berbeda, dan setiap kelompok kemudian dijadikan sampel secara acak. Dalam praktiknya, ini tidak sering dilakukan untuk pemungutan suara, karena Anda perlu stratifikasi menjadi banyak kelompok lengkap (misalnya, pria berpendidikan tinggi antara 18-24 di Urban Texas).