Memahami paradoks Simpson: teladan Andrew Gelman dengan merosotnya pendapatan untuk jenis kelamin dan tinggi badan


22

Andrew Gelman dalam salah satu posting blognya mengatakan:

  1. Saya tidak berpikir kontrafaktual atau hasil potensial diperlukan untuk paradoks Simpson. Saya mengatakan ini karena seseorang dapat mengatur paradoks Simpson dengan variabel yang tidak dapat dimanipulasi, atau manipulasi yang tidak secara langsung menarik.

  2. Paradoks Simpson adalah bagian dari masalah yang lebih umum bahwa koefisien regresi berubah jika Anda menambahkan lebih banyak prediktor, membalik tanda tidak terlalu diperlukan.

Berikut adalah contoh yang saya gunakan dalam pengajaran saya yang menggambarkan kedua poin:

Saya bisa menjalankan regresi memprediksi pendapatan dari jenis kelamin dan tinggi badan. Saya menemukan bahwa koefisien seks adalah $ 10.000 (yaitu, membandingkan pria dan wanita dengan tinggi yang sama, rata-rata pria akan menghasilkan $ 10.000 lebih) dan koefisien tinggi adalah $ 500 (yaitu, membandingkan dua pria atau dua wanita dari ketinggian yang berbeda, rata-rata orang yang lebih tinggi akan menghasilkan $ 500 lebih tinggi per inci).

Bagaimana saya bisa menafsirkan koefisien ini? Saya merasa bahwa koefisien tinggi badan mudah untuk ditafsirkan (mudah untuk membayangkan membandingkan dua orang dari jenis kelamin yang sama dengan ketinggian yang berbeda), memang tampaknya entah bagaimana “salah” untuk mundur pada ketinggian tanpa mengendalikan seks, seperti kebanyakan bahan mentah lainnya. perbedaan antara orang pendek dan tinggi bisa "dijelaskan" dengan menjadi perbedaan antara pria dan wanita. Tetapi koefisien seks dalam model di atas tampaknya sangat sulit untuk ditafsirkan: mengapa membandingkan pria dan wanita yang keduanya 66 inci, misalnya? Itu akan menjadi perbandingan pria pendek dengan wanita tinggi. Semua alasan ini agaknya kausal, tetapi saya rasa tidak masuk akal untuk memikirkannya menggunakan hasil yang potensial.

Saya merenungkannya (dan bahkan mengomentari pos itu) dan berpikir ada sesuatu yang ingin dipahami dengan lebih jelas di sini.

Sampai pada bagian penafsiran gender itu sangat oke. Tapi saya tidak melihat apa masalah di balik membandingkan pria pendek dan wanita tinggi. Inilah poin saya: Sebenarnya lebih masuk akal (mengingat asumsi bahwa pria lebih tinggi rata-rata). Anda tidak dapat membandingkan 'pria pendek' dan wanita 'pendek' untuk alasan yang persis sama, bahwa perbedaan pendapatan dijelaskan di beberapa bagian oleh perbedaan ketinggian. Hal yang sama berlaku untuk pria jangkung dan wanita jangkung dan bahkan lebih untuk wanita jangkung dan pria jangkung (yang lebih jauh dari pertanyaan, jadi untuk berbicara). Jadi pada dasarnya efek tinggi badan dihilangkan hanya dalam kasus ketika pria pendek dan wanita tinggi dibandingkan (dan ini membantu dalam menafsirkan koefisien pada gender). Bukankah itu membunyikan lonceng pada konsep yang mendasari serupa di balik model pencocokan populer?

Gagasan di balik paradoks Simpson adalah bahwa efek populasi mungkin berbeda dari efek bijaksana sub-kelompok. Ini dalam beberapa hal terkait dengan poin 2 dan fakta bahwa ia mengakui bahwa ketinggian tidak boleh dikontrol sendirian (apa yang kita katakan dihilangkan bias variabel). Tapi saya tidak bisa menghubungkan ini dengan kontroversi pada koefisien pada gender.

Mungkin Anda bisa mengekspresikannya dengan lebih jelas? Atau mengomentari pemahaman saya?


Validasi silang terlihat pada himpunan bagian acak dari populasi, mencoba untuk memiliki kelebihan pas minimum, dan generalisasi terbaik.
EngrStudent

1
Jika saya memahami kekhawatiran Anda dengan benar, saya pikir Anda mungkin mendapat manfaat dari juga melihat paradoks Tuhan. @artikel {lord67, penulis = {Lord, FM}, title = {Paradoks dalam penafsiran perbandingan kelompok}, jurnal = {Buletin Psikologis}, tahun = {1967}, volume = {68}, halaman = {304- -305}, kata kunci = {ubah skor}} @artikel {lord69, penulis = {Tuhan, FM}, judul = {Penyesuaian statistik saat membandingkan grup yang sudah ada}, jurnal = {Buletin Psikologis}, tahun = {1969}, volume = {72}, pages = {336--337}, kata kunci = {ubah skor}}
mdewey

1
Judea Pearl membuat posting lain tentang paradoks Simpson baru-baru ini . Saya cukup yakin dia tidak setuju dengan presentasi Gelman. Untuk sekali, poin kedua bukanlah "paradoks". Pembalikan estimasi sebagai konsekuensi dari kondisi Anda adalah fakta matematika. Apa yang membuatnya berpotensi paradoksal adalah ketika Anda membuat interpretasi kausal dari kedua perkiraan tersebut. Kedua, mengapa pembatasan terhadap penyebab yang dapat dimanipulasi ini hanya?
NRH

Jawaban:


9

Saya tidak sepenuhnya yakin dengan pertanyaan Anda , tetapi dapat mengomentari klaimnya dan kebingungan Anda dalam contoh model.

Andrew tidak cukup jelas apakah kebohongan kepentingan ilmiah di ketinggian disesuaikan asosiasi seks berpenghasilan atau seks disesuaikan asosiasi tinggi berpenghasilan. Dalam model sebab akibat, kerangka seks menyebabkan tinggi badan tetapi tinggi badan tidak menyebabkan seks. Jadi, jika kita menginginkan dampak seks, menyesuaikan ketinggian akan menimbulkan bias mediator (mungkin juga bias collider, karena orang kaya lebih tinggi!). Saya merasa membingungkan dan lucu ketika saya melihat penelitian terapan yang menafsirkan yang lain"kovariat" (variabel perancu dan presisi) yang termasuk dalam model. Mereka omong kosong, tetapi hanya memberikan stratifikasi yang memadai untuk membuat perbandingan yang diperlukan. Menyesuaikan tinggi badan, jika Anda tertarik pada kesimpulan tentang perbedaan berdasarkan jenis kelamin dalam pendapatan, adalah hal yang salah untuk dilakukan.

Saya setuju kontrafaktual tidak perlu untuk menjelaskan paradoks Simpson. Mereka bisa menjadi sifat intrinsik data. Saya pikir RR mentah dan disesuaikan dalam beberapa hal benar tanpa menjadi penyebab. Tentu saja, ini lebih bermasalah ketika tujuannya adalah analisis sebab-akibat, dan penyesuaian yang berlebihan mengungkapkan masalah ketidakberpisahan (yang mengembang OR) dan ukuran sampel yang tidak mencukupi.

Sebagai pengingat bagi para pembaca: Paradoks Simpson adalah fenomena yang sangat spesifik yang merujuk pada sebuah contoh di mana sebuah asosiasi membalik arah setelah mengendalikan variabel pengganggu. Data Penerimaan Berkeley adalah contoh yang memotivasi. Di sana, RR kasar menunjukkan bahwa perempuan lebih kecil kemungkinannya diterima di Berkeley. Namun, setelah dikelompokkan berdasarkan departemen , RR menunjukkan bahwa perempuan lebih mungkin diterima di setiap departemen . Mereka hanya lebih mungkin berlaku untuk departemen yang sulit yang menolak banyak orang.

Sekarang dalam teori inferensi kausal, kita akan bingung untuk memahami bahwa departemen yang diterapkan menyebabkan gender. Gender adalah hak intrinsik? Ya dan tidak. Miettenen berpendapat untuk pendekatan "basis studi" untuk masalah seperti: siapa populasi? Tidak semua siswa yang memenuhi syarat, itu adalah orang-orang yang secara khusus berlaku untuk Berkeley. Departemen yang lebih kompetitif telah menarik para wanita untuk melamar ke Berkeley ketika mereka tidak akan menerapkan sebaliknya. Untuk berkembang: seorang wanita yang sangat pandai ingin mencapai yang terbaik, katakanlah, program teknik. Jika Berkeley tidak memiliki program teknik yang hebat, ia tidak akan mendaftar ke Berkeley, ia akan melamar ke MIT atau CalPoly. Jadi dalam hal itu, populasi "siswa yang melamar", departemen menyebabkan gender dan merupakan perancu. (peringatan: Saya mahasiswa gen pertama jadi tidak tahu banyak tentang program mana yang terkenal untuk apa).

Jadi bagaimana kita meringkas data ini? Memang benar bahwa Berkeley lebih cenderung mengakui pria yang melamar daripada wanita. Dan memang benar bahwa departemen Berkeley lebih cenderung menerima wanita daripada mengakui pria. RR kasar dan bertingkat adalah langkah-langkah yang masuk akal bahkan jika mereka non-kausal. Ini menggarisbawahi betapa pentingnya untuk tepat dengan kata-kata kita sebagai ahli statistik (penulis yang rendah hati tidak menganggap dirinya tepat dari jarak jauh).

Perancu adalah fenomena yang berbeda dari non-kolapsibilitas, bentuk lain dari bias variabel yang dihilangkan tetapi satu yang diketahui menghasilkan efek yang lebih ringan pada perkiraan. Tidak seperti regresi logistik, non-collapsibilty tidak menyebabkan bias dalam regresi linier dan pertimbangan kontinu dalam contoh Gelman seharusnya dijelaskan lebih teliti.

Interpretasi Andrew terhadap koefisien jenis kelamin dalam model pendapatan yang disesuaikan jenis kelamin / tinggi badannya mengungkapkan sifat asumsi model: asumsi linearitas. Memang dalam model linier, perbandingan antara pria dan wanita dimungkinkan karena untuk wanita tertentu, kita dapat memprediksibetapa tinggi yang sama dengan yang diperoleh pria, bahkan jika dia tidak diamati. Ini juga terjadi jika seseorang memungkinkan modifikasi efek, sehingga kemiringan tren pada wanita berbeda dari pada pria. Di sisi lain, saya tidak berpikir itu gila untuk membayangkan pria dan wanita dengan tinggi yang sama, 66 inci memang akan menjadi wanita tinggi dan pria pendek. Sepertinya ini proyeksi ringan bagi saya, bukan ekstrapolasi kasar. Selain itu, karena asumsi model dapat dinyatakan dengan jelas, ini membantu pembaca memahami bahwa asosiasi bertingkat-jenis kelamin bertanggal informasi yang dipinjam melintasi atau dirata-ratakan antarasampel jantan dan betina. Jika hubungan seperti itu adalah objek inferensi, ahli statistik yang sungguh-sungguh akan mempertimbangkan kemungkinan modifikasi efek.


2
Diskusi yang bagus. Sebagai ahli statistik, itu membuat saya jengkel tanpa henti ketika orang berbicara tentang hasil penelitian, tetapi tidak yakin apakah mereka berbicara tentang efek marjinal atau bersyarat.
Cliff AB

1

"Mengapa membandingkan pria dan wanita yang tingginya 66 inci, misalnya? Itu akan menjadi perbandingan antara pria pendek dengan wanita tinggi "

Model ini mengasumsikan bahwa pendapatan tergantung pada jenis kelamin dan tinggi badan. Namun, cara tinggi badan menghasilkan pendapatan yang lebih tinggi mungkin tidak sama untuk pria dan wanita. Wanita mungkin dianggap tinggi "cukup" pada ketinggian di mana pria mungkin masih dianggap pendek.

Menyederhanakan model dengan cara berikut mungkin bermanfaat.

Asumsikan bahwa Anda ingin mengurangi kemungkinan dipekerjakan sebagai asisten toko di toko pengecer pakaian besar dan pertimbangkan strategi identifikasi berikut.

Anda mengamati bahwa majikan lebih cenderung mempekerjakan pekerja yang memenuhi tinggi minimum tertentu, di mana "minimum" relatif terhadap gender.

Alih-alih mengukur tinggi dalam cm, anggaplah ada dua nilai ambang yang menentukan tinggi masing-masing pria dan wanita "tinggi":> = 180 cm untuk pria dan> = 170 cm untuk wanita.

Dengan asumsi bahwa ambang ada dalam kenyataan (yaitu majikan membuat perbedaan nyata antara perempuan dan tinggi 169cm atau 171cm), dan bahwa mereka adalah yang benar, Anda dapat membangun boneka yang mendefinisikan laki-laki tinggi / pendek jantan dan betina. Pria dan wanita dengan ketinggian berbeda mungkin masih termasuk dalam kategori dummy yang sama dan pada saat yang sama ukuran Anda konsisten dengan dinamika nyata pasar tenaga kerja tersebut.


-1

Apakah Anda akan mengatakan (dengan kata-kata yang lebih jelas) bahwa pertarungan gender yang khas yang mengatakan bahwa pria memiliki lebih banyak peluang daripada wanita karena pendapatan mereka p% lebih tinggi akan bias secara paradoks?

Mungkin itu intinya. Kita cenderung melihat hal-hal seperti apa penampilan mereka dan tidak menganalisis implikasi yang mendasarinya.

untuk melampaui paradoks Simpson, kita harus menjawab pertanyaan "berapa banyak uang yang membuat seorang wanita melakukan jumlah pekerjaan yang sama dan tidak memihak dibandingkan dengan pria?" maka seseorang dapat mengatakan bahwa mereka harus hamil dan membesarkan anak-anak lebih banyak daripada rekan-rekan mereka yang benar tetapi masalah penting adalah bahwa hal itu agak menghela nafas hanya dengan mengatakan, "perempuan karena kenyataan menjadi perempuan memiliki lebih sedikit peluang" dan yang mendalam Analisis dengan statistik bersyarat akan mengarahkan kita untuk melihat bahwa pada dasarnya cenderung ada kesempatan yang sama dan mereka adalah faktor-faktor lain yang tidak berhubungan dengan seks yang membuat statistik terlihat seperti diskriminasi terkait dengan masalah seks.


Mungkin bermanfaat untuk memahami bahwa analisis semacam itu tidak harus bersifat kausal atau penjelasan, tetapi deskriptif terhadap fenomena yang ada.
AdamO
Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.