Seberapa besar kemungkinan saya akan diturunkan dari orang yang lahir pada tahun 1300?


26

Dengan kata lain, berdasarkan hal berikut, apa itu p?

Untuk menjadikan ini masalah matematika daripada antropologi atau ilmu sosial, dan untuk menyederhanakan masalah, asumsikan bahwa pasangan dipilih dengan probabilitas yang sama di seluruh populasi, kecuali bahwa saudara kandung dan sepupu pertama tidak pernah kawin, dan pasangan selalu dipilih dari yang sama generasi.

  • n1 - populasi awal
  • g - jumlah generasi.
  • c - jumlah rata-rata anak per pasangan. (Jika perlu untuk jawabannya, anggaplah bahwa setiap pasangan memiliki jumlah anak yang persis sama.)
  • z - persentase orang yang tidak memiliki anak, dan yang tidak dianggap sebagai bagian dari pasangan.
  • n2 - populasi pada generasi akhir. (Entahn2 atauz harus diberikan, dan (saya pikir) yang lain dapat dihitung.)
  • p - probabilitas seseorang dalam generasi akhir menjadi keturunan orang tertentu pada generasi awal.

Variabel-variabel ini dapat diubah, dihilangkan, atau ditambahkan, tentu saja. Saya mengasumsikan untuk kesederhanaan bahwa c dan z tidak berubah seiring waktu. Saya menyadari ini akan mendapatkan perkiraan yang sangat kasar, tetapi ini adalah titik awal.

Bagian 2 (saran untuk penelitian lebih lanjut):

Bagaimana Anda dapat mempertimbangkan bahwa pasangan tidak dipilih dengan probabilitas yang seragam secara global? Pada kenyataannya, pasangan lebih cenderung memiliki wilayah geografis yang sama, latar belakang sosial ekonomi, ras, dan latar belakang agama. Tanpa meneliti probabilitas aktual untuk ini, bagaimana variabel untuk faktor-faktor ini ikut bermain? Seberapa pentingkah ini?


2
apakah ini pertanyaan pekerjaan rumah? Kalau tidak, apa konteksnya?
David LeBauer

1
@ John: Terima kasih atas hasil edit Anda. Saya percaya konsensus yang berlaku (di situs ini dan lainnya) adalah bahwa kami tidak mengedit pertanyaan hanya untuk menambahkan homeworktag. Lebih baik bagi semua yang terlibat untuk membiarkan OP melakukan itu. Anda mungkin tertarik pada utas meta ini jika Anda belum melihatnya.
kardinal

Saya hanya ingin tahu. Saya bukan mahasiswa dan ini bukan pekerjaan rumah siapa pun. Saya hanya bercanda tentang kredit tambahan, meskipun saya bisa melihat bagaimana itu menyiratkan pekerjaan rumah.
xpda

3
Untuk mendapatkan jawaban awal, pertimbangkan fraksi dari populasi yang tidak terkait dengan leluhur berdasarkan keturunan. Awalnya f = ( n - 1 ) / n untuk populasi n . Dengan random pencampuran, f adalah squared setelah setiap generasi. Dalam populasi awal n = 10 8 , katakanlah, ini menyiratkan f hampir pasti 0 setelah 32 generasi (sekitar 600 - 800 tahun). ff=(n1)/nnfn=108f032600800
whuber

1
Saya percaya ada beberapa penelitian akademik tentang kemungkinan nama keluarga yang unik akan punah. Meskipun tidak identik dengan masalah yang ditimbulkan, itu mungkin memberikan beberapa wawasan yang menarik (tapi sayangnya saya tidak ingat dari mana asalnya). Anehnya, saya percaya studi-studi itu mengarah pada beberapa wawasan dalam matematika di balik penyebaran penyakit menular ...
Michael McGowan

Jawaban:


13

Karena pertanyaan ini menerima jawaban yang bervariasi dari yang kecil hingga hampir 100%, saya ingin menawarkan simulasi untuk dijadikan referensi dan inspirasi untuk solusi yang lebih baik.

Saya menyebutnya "plot api." Masing-masing mendokumentasikan penyebaran materi genetik dalam suatu populasi saat ia bereproduksi dalam generasi yang berbeda. Plot adalah array segmen vertikal tipis yang menggambarkan orang. Setiap baris mewakili generasi, dengan yang mulai di atas. Keturunan setiap generasi berada di barisan tepat di bawahnya.

Pada awalnya, hanya satu orang dalam populasi berukuran n ditandai dan plot berwarna merah. (Sulit dilihat, tetapi mereka selalu diplot di sebelah kanan barisan paling atas.) Keturunan langsung mereka juga digambarkan dalam warna merah; mereka akan muncul dalam posisi yang sepenuhnya acak. Keturunan lainnya diplot sebagai putih. Karena ukuran populasi dapat bervariasi dari satu generasi ke generasi berikutnya, perbatasan abu-abu di sebelah kanan digunakan untuk mengisi ruang kosong.

Berikut ini adalah 20 hasil simulasi independen.

Flame plots

Materi genetik merah akhirnya mati dalam sembilan dari simulasi ini, meninggalkan yang selamat di 11 yang tersisa (55%). (Dalam satu skenario, bagian kiri bawah, sepertinya seluruh populasi akhirnya mati.) Di mana pun ada yang selamat, hampir semua populasi mengandung materi genetik merah. Ini memberikan bukti bahwa peluang individu yang dipilih secara acak dari generasi terakhir yang mengandung gen merah adalah sekitar 50%.

Simulasi ini bekerja dengan secara acak menentukan angka bertahan hidup dan angka kelahiran rata-rata pada awal setiap generasi. Survivorship diambil dari distribusi Beta (6,2): rata-rata 75%. Angka ini mencerminkan angka kematian sebelum dewasa dan orang-orang yang tidak memiliki anak. Tingkat kelahiran diambil dari distribusi Gamma (2,8, 1), sehingga rata-rata 2,8. Hasilnya adalah kisah brutal kapasitas reproduksi yang tidak mencukupi untuk mengimbangi kematian yang umumnya tinggi. Ini mewakili model kasus terburuk yang sangat pesimistis - tetapi (seperti yang telah saya kemukakan dalam komentar) kemampuan populasi untuk tumbuh tidaklah penting. Yang penting di setiap generasi adalah proporsi merah dalam populasi.

Untuk memodelkan reproduksi, populasi saat ini dipersempit menjadi korban dengan mengambil sampel acak sederhana dari ukuran yang diinginkan. Penyintas ini dipasangkan secara acak (penyintas aneh yang tersisa setelah berpasangan tidak dapat mereproduksi). Setiap pasangan menghasilkan sejumlah anak yang diambil dari distribusi Poisson yang rata-rata adalah tingkat kelahiran generasi. Jika salah satu dari orang tua berisi spidol merah, semua anak mewarisinya: ini memodelkan gagasan keturunan langsung melalui salah satu orangtua.

Contoh ini dimulai dengan populasi 512 dan menjalankan simulasi selama 11 generasi (12 baris termasuk awal). Variasi dari simulasi ini dimulai dengan sesedikit dan sebanyak 2 14 = 16 , 384 orang, menggunakan jumlah yang berbeda dari tingkat kesintasan dan kelahiran, semuanya menunjukkan karakteristik yang serupa: pada akhir log 2 ( n ) generasi (sembilan) dalam kasus ini), ada sekitar 1/3 peluang bahwa semua merah telah mati, tetapi jika tidak, maka mayoritas populasi adalah merah. Dalam dua atau tiga generasi lagi, hampir semua populasi berwarna merah dan akan tetap merah (atau populasi akan mati sama sekali).n=8214=16,384log2(n)

Omong-omong, bertahannya 75% atau kurang dalam satu generasi tidaklah fantastis. Pada akhir 1347, tikus-tikus yang diserang oleh penyakit pes pertama-tama berjalan dari Asia ke Eropa; selama tiga tahun berikutnya, di suatu tempat antara 10% dan 50% dari populasi Eropa mati sebagai akibatnya. Tulah ini kambuh hampir sekali dalam satu generasi selama ratusan tahun sesudahnya (tetapi biasanya tidak dengan kematian ekstrim yang sama).


Kode

Simulasi dibuat dengan Mathematica 8:

randomPairs[s_List] := Partition[s[[Ordering[RandomReal[{0, 1}, Length[s]]]]], 2];

next[s_List, survive_, nKids_] := Flatten[ConstantArray[Max[#], 
   RandomVariate[PoissonDistribution[nKids]]] & /@ 
   randomPairs[RandomSample[s, Ceiling[survive Length[s]]]]] 

Partition[Table[
   With[{n = 6}, ArrayPlot[NestList[next[#, RandomVariate[BetaDistribution[6, 2]], 
        RandomVariate[GammaDistribution[3.2, 1]]] &, 
        Join[ConstantArray[0, 2^n - 1], ConstantArray[1, 1]], n + 2], 
     AspectRatio -> 2^(n/3)/(2 n), 
     ColorRules -> {1 -> RGBColor[.6, .1, .1]},  
     Background -> RGBColor[.9, .9, .9]]
    ], {i, 1, 20}
   ], 4] // TableForm

1
Saya pikir pemodelan seperti ini mungkin merupakan pendekatan terbaik. Ini jauh lebih sederhana dan lebih menyenangkan (bagi saya) daripada matematika, dan itu akan membuatnya lebih mudah untuk memperkenalkan faktor-faktor yang membatasi pemilihan pasangan. Apakah Anda punya rekomendasi, peringatan, atau saran lain sebelum saya selami ini?
xpda

3
@xpda Solusi matematis akan memberikan wawasan tentang apa yang penting dan apa yang tidak. Misalnya, mereka akan menunjukkan bahwa Anda tidak perlu memodelkan populasi besar. Mereka juga akan menunjukkan peran yang dimainkan oleh variabilitas, yang lebih sulit untuk ditangani secara analitis dan tampil ke depan dalam sebuah simulasi.
whuber

1
@whuber Apakah Anda menjalankan simulasi di Mathematica? Apakah Anda keberatan memposting kode?
Diasumsikan normal

1
@ Max Kode sekarang. Saya minta maaf atas kurangnya komentar. Jika Anda menjalankan masing-masing randomPairsdan nextpada data uji, fungsinya akan menjadi jelas. Perhatikan penggunaan NestListuntuk beralih nextuntuk menghasilkan beberapa generasi.
Whuber

3

Apa yang terjadi ketika Anda mencoba menghitung leluhur?

Anda memiliki 2 orang tua, kakek-nenek 4, 8 kakek-nenek besar, ... Jadi, jika Anda kembali generasi maka Anda memiliki 2 n nenek moyang. Mari kita asumsikan panjang generasi rata-rata 25 tahun. Lalu ada sekitar 28 generasi sejak 1300, yang memberi kita sekitar 268 juta leluhur pada waktu itu.n2n2528

Ini adalah stadion baseball yang tepat, tetapi ada yang salah dengan perhitungan ini, karena populasi Bumi pada tahun 1300 tidak bercampur secara seragam, dan kami mengabaikan perkawinan campur dalam "pohon" leluhur Anda, yaitu kami menghitung dua kali beberapa leluhur.

Namun, saya pikir, ini dapat mengarah pada batas atas yang benar pada probabilitas bahwa orang yang dipilih secara acak pada tahun 1300 adalah leluhur Anda dengan mengambil rasio terhadap populasi pada tahun 1300228


2
Sangat signifikan mengingat banyak populasi saat itu agak terisolasi satu sama lain, sehingga ada jauh lebih sedikit kesempatan untuk menghindari pernikahan antar.
dcl

2
Jadi mari kita asumsikan bahwa OP berasal dari keturunan Inggris dan sekitar 1300, populasi Inggris lebih dari satu juta. (Katakanlah sebelum kelaparan hebat). Bagaimana hal itu mengubah analisis Anda?
dassouki

juta, bukan miliar. Ini stadion baseball yang tepat. 228268
whuber

228/34

2

Semakin jauh Anda pergi, semakin besar kemungkinan Anda berhubungan dengan seseorang yang berhasil meneruskan gen mereka yang hidup pada masa itu. Dari 1/4 miliar leluhur yang Anda miliki yang hidup pada tahun 1300, banyak dari mereka akan muncul ratusan (jika tidak ribuan, jutaan) kali di silsilah keluarga Anda. Penyimpangan genetik dan berapa kali kita berhubungan langsung dengan seseorang cenderung lebih relevan dengan perbedaan dalam kode genetik kita daripada siapa leluhur kita.


0

Probabilitasnya adalah = 1-z, setiap keturunan dalam masalah ini terkait dengan leluhur di atas. Berapapun tingkat reproduksi awal (1-z) adalah probabilitas Anda untuk menjadi keturunan dari seseorang dalam populasi awal. Satu-satunya kemungkinan yang tidak pasti adalah peluang hidup dalam populasi akhir.

Saya setuju dengan jawaban Erad, meskipun saya sekarang berpikir itu menjawab pertanyaan yang tidak ditanyakan - yaitu berapa probabilitas Anda masih hidup mengingat kendala reproduktif dan populasi tertentu yang diketahui mengenai pembawa depan Anda.


n1z=.2, then the probability wouldn't be 1-z at, for example, g=1.
xpda

Also, to clarify, the question is to find the probability of a particular person in the final generation being descended from a particular person in the initial generation.
xpda

1
@xpda That's a strange interpretation, because everybody either is, or is not, descended from any particular individual, as can be established through DNA testing. I think the way many people may have been understanding your question is if we pick an arbitrary person "A" in the year 1300 and we select a random person alive today, what is the chance they are descended from A? This is answered by estimating the proportion of today's population that is descended from A. We could also take A to be randomly selected.
whuber

@Wipa Descartes' cogito, ergo sum strongly suggests the probability I'm alive given any constraints on my forebears is 100% :-)
whuber

@whuber, you are correct. I believe we are talking about the same problem. The thing I wanted to clarify is that I am not looking for the likelihood of someone in the first generation having a descendant alive in the last generation. I was afraid that's where Wipa came up with (1-z) for the answer.
xpda

0

My updated short answer is:

p>(1z)×1n1(1z)2=2n1

Answer explained:
Given a particular person today, it is certain that they are a descendant of at least 2 people in 1300.

When picking a particular person in 1300, there is (1-z) chance that person never reproduced, and the other term is for the number of 'parent couples', and the probability for the person to be related to this couple (1 / number of couples).

The (1-z) ends up cancelling out, leaving us with

p>2n1

Now just for fun but not necessary for solving the probability question
Here is the population of any given generation k in the chain between then and today.

nk+1=nk(1z)×c2=n1(1z)kck2k

Lets plug in some numbers as an example. For assumptions, I use:
g = 28 (25-year generations between 1300 and 2011)
n = 360M (world population estimate in 1300 from wikipedia)
z = 0.2, c = 2.77=8 (not real data, but does end up with about 7B people in 2011)

Resulting in:

p>2/360,000,000=5.56×109
or over one in 180M.

Thanks for reading, Erad


What is c? And what is z?
mpiktas

Based on the original question above: c = the average number of children per couple, and z = the percentage of people who have no children
Erad

2
Hm, how come your probability is less than 1/n=1/360M109?
mpiktas

3
The answer given here holds for each member of the original population, no matter who they were. Summing over all members gives an upper bound for the probability that we are descended today from some person in the year 1300 of 360,000,000/(2.66×10249)1, which is obviously way wrong (unless alien clones were introduced along the way...).
whuber

1
@Erad In your comment you appear to assume that all of today's population is descended from a tiny fraction of the world in 1300. That's just not plausible. However, suppose for the sake of argument--and to examine an extreme case--that everyone today is known to have descended solely from one couple, "Adam" and "Eve", alive in 1300. Then the chance of descent is either 100% if Adam or Eve are the "particular person" of the question or else is 0%. This chance, averaged over the population in 1300, is still about 108, far higher than you compute.
whuber

0

This is a very interesting question as it is asking us to mathematically solve a fractal. Such as the famous game of life.

The % of the population which each generation related to will grow over each iteration, starting at p1=2n1 and at the limit generation will approach limkpk=(1z).

If we denote pk as the probability of someone in generation k to be related to the initial population. And for simplicity lets relax the siblings & cousins rule (can be added later). Then:

p1=2n1

As each person in the new generation has exactly 2 ancestors in the initial population.

p2=relatives×2n2+non.relatives×4n2
In this case relatives could be calculated as:
relatives=(c2)×nc(n2)=c1n1
Or in other words, the number of sibling combinations, times the number of siblings family, divided by the total mating combinations.
p3=immediate.relatives×4n3+cousins×6n3+non.relatives×8n3

With each generation, the probability to be related to someone at the initial population will undoubtedly grow, but at a decreasing pace. This is because the probability to draw "relatives" which are coming from the same or similar tree will grow.

Lets use ethnicity as an example. Lets say we know for a fact someone is 100% Caucasian. At generation 28 he is most likely related to a significant portion of the Caucasian population in 1300 (As shown by @whuber simulation). Lets say he is marrying someone who is 100% of a different ethnicity. Their offspring will be linked to approximately double the number of people they are linked to from 1300.

Another interesting thought is that given the human (homosapien) race started from ~600 people in Africa, then we are most likely a genetic permutation of all of them who successfully mated.

Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.