Anda tampaknya berasumsi dalam pertanyaan Anda bahwa konsep distribusi normal sudah ada sebelum distribusi diidentifikasi, dan orang-orang mencoba mencari tahu apa itu. Tidak jelas bagi saya bagaimana cara kerjanya. [Sunting: setidaknya ada satu indra yang mungkin kami anggap sebagai "pencarian distribusi" tapi itu bukan "pencarian distribusi yang menggambarkan banyak dan banyak fenomena"]
Ini bukan kasusnya; distribusi diketahui sebelum disebut distribusi normal.
bagaimana Anda membuktikan kepada orang tersebut bahwa fungsi kepadatan probabilitas semua data yang terdistribusi normal memiliki bentuk bel
Fungsi distribusi normal adalah benda yang memiliki apa yang biasanya disebut "bentuk lonceng" - semua distribusi normal memiliki "bentuk" yang sama (dalam arti bahwa mereka hanya berbeda dalam skala dan lokasi).
Data dapat terlihat kurang lebih "berbentuk lonceng" dalam distribusi tetapi itu tidak membuatnya normal. Banyak distribusi tidak normal terlihat serupa "berbentuk lonceng".
Distribusi populasi aktual yang diambil dari data kemungkinan tidak pernah benar - benar normal, meskipun kadang-kadang perkiraan yang cukup masuk akal.
Ini biasanya berlaku untuk hampir semua distribusi yang kami terapkan pada hal-hal di dunia nyata - mereka adalah model , bukan fakta tentang dunia. [Sebagai contoh, jika kita membuat asumsi tertentu (yang untuk proses Poisson), kita dapat memperoleh distribusi Poisson - distribusi yang banyak digunakan. Tetapi apakah asumsi-asumsi itu pernah benar - benar dipenuhi? Secara umum yang terbaik yang bisa kita katakan (dalam situasi yang tepat) adalah bahwa mereka hampir benar.]
apa yang sebenarnya kita anggap data terdistribusi normal? Data yang mengikuti pola probabilitas distribusi normal, atau sesuatu yang lain?
Ya, untuk benar - benar terdistribusi secara normal, populasi sampel diambil dari harus memiliki distribusi yang memiliki bentuk fungsional yang tepat dari distribusi normal. Akibatnya, populasi terbatas apa pun tidak dapat menjadi normal. Variabel yang harus dibatasi tidak boleh normal (misalnya, waktu yang diambil untuk tugas-tugas tertentu, panjang hal-hal tertentu tidak boleh negatif, sehingga mereka sebenarnya tidak dapat didistribusikan secara normal).
mungkin akan lebih intuitif bahwa fungsi probabilitas dari data yang terdistribusi normal memiliki bentuk segitiga sama kaki
Saya tidak mengerti mengapa ini selalu lebih intuitif. Ini tentu saja lebih sederhana.
Ketika pertama kali mengembangkan model untuk distribusi kesalahan (khusus untuk astronomi pada periode awal), matematikawan mempertimbangkan berbagai bentuk dalam kaitannya dengan distribusi kesalahan (termasuk pada satu titik awal distribusi segitiga), tetapi dalam banyak pekerjaan ini adalah matematika (bukan dari intuisi) yang digunakan. Laplace melihat distribusi eksponensial ganda dan normal (antara beberapa lainnya), misalnya. Demikian pula Gauss menggunakan matematika untuk menurunkannya di sekitar waktu yang sama, tetapi dalam kaitannya dengan serangkaian pertimbangan yang berbeda dari yang dilakukan Laplace.
Dalam arti sempit bahwa Laplace dan Gauss sedang mempertimbangkan "distribusi kesalahan", kita bisa menganggapnya sebagai "pencarian distribusi", setidaknya untuk sementara waktu. Keduanya mendalilkan beberapa properti untuk distribusi kesalahan yang mereka anggap penting (Laplace dianggap sebagai urutan kriteria yang agak berbeda dari waktu ke waktu) menyebabkan distribusi yang berbeda.
Pada dasarnya pertanyaan saya adalah mengapa fungsi kepadatan probabilitas distribusi normal memiliki lonceng dan bukan yang lain?
Bentuk fungsional dari benda yang disebut fungsi kerapatan normal memberinya bentuk itu. Pertimbangkan standar normal (untuk kesederhanaan; setiap normal lainnya memiliki bentuk yang sama, hanya berbeda dalam skala dan lokasi):
fZ( z) = k ⋅ e- 12z2;- ∞ < z< ∞
(di mana hanyalah sebuah konstanta yang dipilih untuk membuat total area 1)k
ini mendefinisikan nilai kerapatan pada setiap nilai , sehingga itu benar-benar menggambarkan bentuk kerapatan. Objek matematika itulah yang kami lampirkan label "distribusi normal". Tidak ada yang istimewa dari namanya; itu hanya label yang kami lampirkan ke distribusi. Ada banyak nama (dan masih disebut hal yang berbeda oleh orang yang berbeda).x
Sementara beberapa orang menganggap distribusi normal sebagai sesuatu yang "biasa" itu sebenarnya hanya dalam set situasi tertentu yang Anda bahkan cenderung melihatnya sebagai perkiraan.
Penemuan distribusi biasanya dikreditkan ke de Moivre (sebagai perkiraan untuk binomial). Dia pada dasarnya memperoleh bentuk fungsional ketika mencoba untuk memperkirakan koefisien binomial (/ probabilitas binomial) untuk memperkirakan perhitungan yang membosankan, tetapi - sementara dia memang secara efektif menurunkan bentuk distribusi normal - dia tampaknya tidak memikirkan perkiraannya sebagai suatu distribusi probabilitas, meskipun beberapa penulis menyarankan agar ia melakukannya. Diperlukan sejumlah interpretasi tertentu sehingga ada ruang untuk perbedaan dalam interpretasi itu.
Gauss dan Laplace mengerjakannya pada awal 1800-an; Gauss menulis tentang itu pada 1809 (sehubungan dengan itu menjadi distribusi yang rerata adalah MLE pusat) dan Laplace pada 1810, sebagai perkiraan untuk distribusi jumlah variabel acak simetris. Satu dekade kemudian Laplace memberikan bentuk awal teorema limit pusat, untuk diskrit dan variabel kontinu.
Nama awal untuk distribusi termasuk hukum kesalahan , hukum frekuensi kesalahan , dan itu juga dinamai Laplace dan Gauss, kadang-kadang bersama-sama.
Istilah "normal" digunakan untuk menggambarkan distribusi secara independen oleh tiga penulis berbeda pada tahun 1870-an (Peirce, Lexis, dan Galton), yang pertama pada 1873 dan dua lainnya pada 1877. Ini lebih dari enam puluh tahun setelah karya Gauss dan Laplace dan lebih dari dua kali sejak aproksimasi de Moivre. Penggunaannya oleh Galton mungkin paling berpengaruh tetapi ia menggunakan istilah "normal" dalam kaitannya dengan itu hanya sekali dalam pekerjaan 1877 (kebanyakan menyebutnya "hukum penyimpangan").
Namun, pada tahun 1880-an Galton menggunakan kata sifat "normal" dalam kaitannya dengan distribusi berkali-kali (misalnya sebagai "kurva normal" pada tahun 1889), dan ia pada gilirannya memiliki banyak pengaruh pada ahli statistik kemudian di Inggris (terutama Karl Pearson ). Dia tidak mengatakan mengapa dia menggunakan istilah "normal" dengan cara ini, tetapi mungkin berarti dalam arti "khas" atau "biasa".
Penggunaan eksplisit pertama dari frasa "distribusi normal" tampaknya oleh Karl Pearson; dia pasti menggunakannya pada tahun 1894, meskipun dia mengaku telah menggunakannya jauh sebelumnya (klaim yang akan saya lihat dengan hati-hati).
Referensi:
Miller, Jeff
"Penggunaan Awal Beberapa Kata Matematika:"
Distribusi normal (Entri oleh John Aldrich)
http://jeff560.tripod.com/n.html
Stahl, Saul (2006),
"Evolusi Distribusi Normal",
Majalah Matematika , Vol. 79, No. 2 (April), hal 96-113
https://www.maa.org/sites/default/files/pdf/upload_library/22/Allendoerfer/stahl96.pdf
Distribusi normal, (2016, 1 Agustus).
Di Wikipedia, Ensiklopedia Gratis.
Diperoleh 12:02, 3 Agustus 2016, dari
https://en.wikipedia.org/w/index.php?title=Normal_distribution&oldid=732559095#History
Hald, A (2007),
"Perkiraan Normal De Moivre terhadap Binomial, 1733, dan Generalisasi-nya",
Dalam: Sejarah Kesimpulan Statistik Parametrik dari Bernoulli ke Fisher, 1713–1935; hlm 17-24
[Anda mungkin mencatat perbedaan besar antara sumber-sumber ini sehubungan dengan akun de Moivre mereka]