Berikut ini adalah pendekatan umum untuk memahami Paradox Simpson secara aljabar untuk menghitung data.
Misalkan kita memiliki data survival untuk eksposur dan kita membuat tabel kontingensi 2x2. Untuk mempermudah, kita akan memiliki jumlah yang sama di setiap sel. Kita bisa santai ini, tetapi itu akan membuat aljabarnya cukup berantakan.
ExposedUnexposedDiedXXSurvivedXXDeath Rate0.50.5
Dalam hal ini, Angka Kematian adalah sama di kedua kelompok Terkena dan Tidak Terkena.
Sekarang, jika kita membagi data, katakanlah menjadi satu kelompok untuk wanita dan kelompok lain untuk pria, kita mendapatkan 2 tabel, dengan jumlah berikut:
Laki-laki:
ExposedUnexposedDiedXaXcSurvivedXbXdDeath Rateaa+bcc+d
dan untuk wanita:
ExposedUnexposedDiedX(a−1)X(c−1)SurvivedX(b−1)X(d−1)Death Ratea−1a+b−2c−1c+d−2
di mana a,b,c,d∈[0,1] adalah proporsi dari masing-masing sel dalam tabel data agregat yang adalah laki-laki.
Paradox Simpson akan terjadi ketika tingkat kematian untuk pria yang terpapar lebih besar dari tingkat kematian untuk pria yang tidak terpapar DAN tingkat kematian untuk wanita yang terpapar lebih besar dari tingkat kematian untuk wanita yang tidak terpapar. Atau, itu juga akan terjadi ketika tingkat kematian untuk pria yang terpapar kurang dari tingkat kematian untuk pria yang tidak terpapar DAN tingkat kematian untuk wanita yang terpapar kurang dari tingkat kematian untuk wanita yang tidak terpapar. Saat itulah
(aa+b<cc+d) and (a−1a+b−2<c−1c+d−2)
Or
(aa+b>cc+d) and (a−1a+b−2>c−1c+d−2)
X=100a=0.5,b=0.8,c=0.9
(0.50.8+0.9<0.90.9+d) and (0.5−10.5+0.8−2<0.9−10.9+d−2)
(−9<d<1.44) and (0.96<d<1.1)
(0.96,1]
Set ketidaksetaraan ke-2 memberi:
(0.50.8+0.9>0.90.9+d) and (0.5−10.5+0.8−2>0.9−10.9+d−2)
(d<−0.9 or d>1.44) and (0.96<d or d>1.44)
d∈[0,1]
a,b,cd0,99
0,5 / ( 0,5 + 0,8 ) = 38 % pada kelompok yang terpapar
0,9 / ( 0,9 + 0,99 ) = 48 % pada kelompok yang tidak terpapar
dan untuk Wanita:
( 0,5 - 1 ) / ( 0,5 + 0,8 - 2 ) = 71 % pada kelompok yang terpapar
( 0,9 - 1 ) / ( 0,9 + 0,99 - 2 ) = 91 % pada kelompok yang tidak terpapar
Jadi, laki-laki memiliki tingkat kematian yang lebih tinggi pada kelompok yang tidak terpapar daripada kelompok yang terpapar, dan perempuan juga memiliki tingkat kematian yang lebih tinggi pada kelompok yang tidak terpapar daripada kelompok yang terpapar, namun tingkat kematian dalam data agregat sama untuk terpapar dan tidak terpajan. .