Saya memiliki tiga tautan / argumen pendukung yang mendukung tanggal ~ 1600-1650 untuk statistik yang dikembangkan secara formal dan jauh lebih awal hanya untuk penggunaan probabilitas.
Jika Anda menerima pengujian hipotesis sebagai dasar, probabilitas yang mendahului, maka Kamus Etimologi Online menawarkan ini:
" hipotesis (n.)
1590-an, "pernyataan tertentu;" 1650-an, "sebuah proposisi, diasumsikan dan diterima begitu saja, digunakan sebagai premis," dari hipotesis Perancis Tengah dan langsung dari hipotesis Latin Akhir, dari hipotesis Yunani "dasar, landasan, pondasi," maka dalam penggunaan jangka panjang "berdasarkan argumen, anggapan, "secara harfiah" suatu penempatan di bawah, "dari hypo-" under "(lihat hipotesis) + tesis" penempatan, proposisi "(dari bentuk reduplikasi dari akar PIE * dhe-" to set, put "). Suatu istilah dalam logika; pengertian ilmiah yang lebih sempit adalah dari tahun 1640 - an.
Wiktionary menawarkan:
"Direkam sejak 1596, dari hipotesis Perancis Tengah, dari hipotesis Latin Akhir, dari Yunani Kuno ὑπόθεσις (hupótesis," dasar, dasar argumen, anggapan "), secara harfiah" menempatkan di bawah ", itu sendiri dari ὑποτίθημι (hupotíthími," saya menetapkan sebelumnya, sarankan ”), dari ὑπό (hupó,“ bawah ”) + τίθημι (títhēmi,“ I put, place ”).
Hipotesis kata benda (hipotesis jamak)
(Ilmu) Digunakan secara longgar, dugaan tentatif menjelaskan pengamatan, fenomena atau masalah ilmiah yang dapat diuji dengan pengamatan lebih lanjut, investigasi dan / atau eksperimen. Sebagai istilah seni ilmiah, lihat kutipan terlampir. Bandingkan dengan teori, dan kutipan yang diberikan di sana. kutipan ▲
2005, Ronald H. Pine, http://www.csicop.org/specialarticles/show/intelligent_design_or_no_model_creationism , 15 Oktober 2005:
Terlalu banyak dari kita telah diajarkan di sekolah bahwa seorang ilmuwan, dalam upaya mencoba mencari tahu sesuatu, pertama-tama akan muncul dengan "hipotesis" (tebakan atau dugaan — bahkan tak perlu tebakan "berpendidikan"). ... [Tetapi] kata "hipotesis" harus digunakan, dalam sains, khusus untuk penjelasan yang beralasan, masuk akal, dan berdasarkan pengetahuan untuk mengapa suatu fenomena ada atau terjadi. Suatu hipotesis masih belum diuji; sudah bisa diuji; mungkin telah dipalsukan; mungkin belum dipalsukan, meskipun telah diuji; atau mungkin telah diuji dalam berbagai cara berkali-kali tanpa dipalsukan; dan itu bisa diterima secara universal oleh komunitas ilmiah. Pemahaman kata "hipotesis," seperti yang digunakan dalam sains, membutuhkan pemahaman tentang prinsip-prinsip yang mendasari Occam ' Gagasan Razor dan Karl Popper sehubungan dengan "kepalsuan" - termasuk gagasan bahwa setiap hipotesis ilmiah yang terhormat, pada prinsipnya, harus "mampu" dibuktikan salah (jika memang, pada kenyataannya, kebetulan saja salah), tetapi tidak ada yang bisa dibuktikan benar. Salah satu aspek dari pemahaman yang tepat dari kata "hipotesis," seperti yang digunakan dalam sains, adalah bahwa hanya sebagian kecil dari hipotesis yang berpotensi menjadi teori. ".
Pada probabilitas dan statistik Wikipedia penawaran:
" Pengumpulan data
Contoh
Ketika data sensus penuh tidak dapat dikumpulkan, ahli statistik mengumpulkan data sampel dengan mengembangkan desain eksperimen tertentu dan sampel survei. Statistik itu sendiri juga menyediakan alat untuk prediksi dan peramalan melalui model statistik. Ide membuat kesimpulan berdasarkan data sampel mulai sekitar pertengahan 1600-an sehubungan dengan memperkirakan populasi dan mengembangkan prekursor asuransi jiwa . (Referensi: Wolfram, Stephen (2002). Jenis Ilmu Baru. Wolfram Media, Inc. hal. 1082. ISBN 1-57955-008-8).
Untuk menggunakan sampel sebagai panduan untuk seluruh populasi, penting bahwa itu benar-benar mewakili keseluruhan populasi. Sampling representatif memastikan bahwa kesimpulan dan kesimpulan dapat dengan aman diperluas dari sampel ke populasi secara keseluruhan. Masalah utama terletak pada menentukan sejauh mana sampel yang dipilih benar-benar representatif. Statistik menawarkan metode untuk memperkirakan dan mengoreksi bias dalam sampel dan prosedur pengumpulan data. Ada juga metode desain eksperimental untuk eksperimen yang dapat mengurangi masalah ini pada awal studi, memperkuat kemampuannya untuk membedakan kebenaran tentang populasi.
Teori sampel adalah bagian dari disiplin matematika dari teori probabilitas. Probabilitas digunakan dalam statistik matematika untuk mempelajari distribusi sampling dari statistik sampel dan, lebih umum, sifat-sifat prosedur statistik. Penggunaan metode statistik apa pun valid ketika sistem atau populasi yang dipertimbangkan memenuhi asumsi metode tersebut. Perbedaan sudut pandang antara teori probabilitas klasik dan teori sampling adalah, secara kasar, bahwa teori probabilitas dimulai dari parameter yang diberikan dari total populasi untuk menyimpulkan probabilitas yang berkaitan dengan sampel. Inferensi statistik, bagaimanapun, bergerak dalam arah yang berlawanan - secara induktif menyimpulkan dari sampel ke parameter populasi yang lebih besar atau total .
Dari "Wolfram, Stephen (2002). Jenis Ilmu Baru. Wolfram Media, Inc. hal. 1082.":
" Analisis Statistik
• Sejarah. Beberapa perhitungan peluang untuk gim peluang telah dibuat pada zaman kuno. Mulai sekitar tahun 1200-an hasil yang semakin rumit berdasarkan pada pencacahan probabilitas kombinasi diperoleh oleh mistikus dan ahli matematika, dengan metode yang benar secara sistematis sedang dikembangkan pada pertengahan 1600-an dan awal 1700-an. Gagasan membuat kesimpulan dari data sampel muncul pada pertengahan 1600-an sehubungan dengan memperkirakan populasi dan mengembangkan prekursor asuransi jiwa. Metode rata-rata untuk mengoreksi apa yang dianggap sebagai kesalahan pengamatan acak mulai digunakan, terutama dalam astronomi, pada pertengahan 1700-an, sementara paling tidak kuadrat pas dan gagasan distribusi probabilitas menjadi didirikan sekitar 1800. Model probabilitas berdasarkan variasi acak antara individu mulai digunakan dalam biologi pada pertengahan 1800-an, dan banyak metode klasik yang sekarang digunakan untuk analisis statistik dikembangkan pada akhir 1800-an dan awal 1900-an dalam konteks penelitian pertanian. Dalam fisika, model probabilistik pada dasarnya adalah pusat pengenalan mekanika statistik pada akhir 1800-an dan mekanika kuantum pada awal 1900-an.
Sumber lain:
"Laporan ini, terutama dalam istilah non-matematis, mendefinisikan nilai p, merangkum asal-usul historis dari pendekatan nilai p untuk pengujian hipotesis, menjelaskan berbagai aplikasi p≤0,05 dalam konteks penelitian klinis, dan membahas munculnya p≤ 5 × 10−8 dan nilai-nilai lainnya sebagai ambang untuk analisis statistik genom. "
Bagian "Sejarah asal" menyatakan:
[ 1 ]
[1]. Arbuthnott J. Argumen untuk Penyelenggaraan Ilahi, diambil dari keteraturan yang diamati dalam kelahiran kedua jenis kelamin. Phil Trans 1710; 27: 186–90. doi: 10.1098 / rstl.1710.0011 diterbitkan 1 Januari 1710
1 - 45 - 78910 , 11
Saya akan menawarkan pertahanan terbatas nilai-P saja. ... "
Referensi
1 Hald A. A history of probability and statistics and their appli- cations before 1750. New York: Wiley, 1990.
2 Shoesmith E, Arbuthnot, J. In: Johnson, NL, Kotz, S, editors. Leading personalities in statistical sciences. New York: Wiley, 1997:7–10.
3 Bernoulli, D. Sur le probleme propose pour la seconde fois par l’Acadamie Royale des Sciences de Paris. In: Speiser D,
editor. Die Werke von Daniel Bernoulli, Band 3, Basle:
Birkhauser Verlag, 1987:303–26.
4 Arbuthnot J. An argument for divine providence taken from
the constant regularity observ’d in the births of both sexes. Phil Trans R Soc 1710;27:186–90.
5 Freeman P. The role of P-values in analysing trial results. Statist Med 1993;12:1443 –52.
6 Anscombe FJ. The summarizing of clinical experiments by
significance levels. Statist Med 1990;9:703 –8.
7 Royall R. The effect of sample size on the meaning of signifi- cance tests. Am Stat 1986;40:313 –5.
8 Senn SJ. Discussion of Freeman’s paper. Statist Med
1993;12:1453 –8.
9 Gardner M, Altman D. Statistics with confidence. Br Med J
1989.
10 Matthews R. The great health hoax. Sunday Telegraph 13
September, 1998.
11 Matthews R. Flukes and flaws. Prospect 20–24, November 1998.
@Martijn Weterings : "Apakah Pearson pada tahun 1900 kebangkitan atau apakah konsep (frequentist) ini muncul lebih awal? Bagaimana Jacob Bernoulli berpikir tentang 'teorema emas' dalam arti yang sering terjadi atau dalam pengertian Bayesian (apa yang dikatakan Ars Conjectandi dan ada lebih banyak sumber)?
American Statistics Association memiliki halaman web tentang History of Statistics yang, bersama dengan informasi ini, memiliki poster (direproduksi di bagian bawah) berjudul "Timeline of statistics".
2 M: Bukti sensus yang diselesaikan selama Dinasti Han bertahan.
1500-an: Girolamo Cardano menghitung probabilitas gulungan dadu yang berbeda.
1600-an: Edmund Halley menghubungkan angka kematian dengan usia dan mengembangkan tabel kematian.
1700-an: Thomas Jefferson mengarahkan Sensus AS pertama.
1839: Asosiasi Statistik Amerika dibentuk.
1894: Istilah "standar deviasi" diperkenalkan oleh Karl Pearson.
1935: RA Fisher menerbitkan Desain Eksperimen.
Di bagian "Sejarah" pada halaman web Wikipedia " Hukum angka besar " itu menjelaskan:
"Ahli matematika Italia Gerolamo Cardano (1501–1576)dinyatakan tanpa bukti bahwa keakuratan statistik empiris cenderung meningkat dengan jumlah uji coba. Ini kemudian diformalkan sebagai hukum sejumlah besar. Bentuk khusus LLN (untuk variabel acak biner) pertama kali dibuktikan oleh Jacob Bernoulli. Butuh waktu lebih dari 20 tahun untuk mengembangkan bukti matematika yang cukup ketat yang diterbitkan dalam Ars Conjectandi (The Art of Conjecturing) pada tahun 1713. Dia menamakannya ini "Teorema Emas" tetapi kemudian dikenal sebagai "Teorema Bernoulli". Ini tidak harus bingung dengan prinsip Bernoulli, dinamai setelah keponakan Jacob Bernoulli, Daniel Bernoulli. Pada tahun 1837, SD Poisson lebih lanjut menggambarkannya dengan nama "la loi des grands nombres" ("Hukum angka besar"). Setelah itu, itu dikenal dengan kedua nama, tetapi "
Setelah Bernoulli dan Poisson menerbitkan upaya mereka, matematikawan lain juga berkontribusi pada penyempurnaan hukum, termasuk Chebyshev, Markov, Borel, Cantelli dan Kolmogorov dan Khinchin. "
Pertanyaan: Apakah Pearson orang pertama yang mengandung nilai-p?
Tidak, mungkin juga tidak.
Dalam " Pernyataan ASA tentang p-Values: Konteks, Proses, dan Tujuan " (09 Jun 2016) oleh Wasserstein dan Lazar, doi: 10.1080 / 00031305.2016.1154108 ada pernyataan resmi tentang definisi nilai p (tidak ada keraguan tidak disetujui oleh semua disiplin ilmu yang menggunakan, atau menolak, nilai-p) yang berbunyi:
" . Apa itu Nilai-p?
Secara informal, nilai-p adalah probabilitas di bawah model statistik yang ditentukan sehingga ringkasan statistik dari data (misalnya, perbedaan rata-rata sampel antara dua kelompok yang dibandingkan) akan sama dengan atau lebih ekstrem daripada nilai yang diamati.
3. Prinsip
...
6. Dengan sendirinya, nilai-p tidak memberikan ukuran bukti yang baik mengenai model atau hipotesis.
Peneliti harus mengakui bahwa nilai-p tanpa konteks atau bukti lain memberikan informasi terbatas. Misalnya, nilai p mendekati 0,05 yang diambil dengan sendirinya hanya menawarkan bukti yang lemah terhadap hipotesis nol. Demikian juga, nilai-p yang relatif besar tidak menyiratkan bukti yang mendukung hipotesis nol; banyak hipotesis lain mungkin sama atau lebih konsisten dengan data yang diamati. Untuk alasan ini, analisis data tidak boleh diakhiri dengan perhitungan nilai p ketika pendekatan lain sesuai dan layak. "
Penolakan terhadap hipotesis nol kemungkinan terjadi jauh sebelum Pearson.
Halaman Wikipedia tentang contoh awal status pengujian hipotesis nol :
Pilihan awal hipotesis nol
Paul Meehl berpendapat bahwa kepentingan epistemologis dari pilihan hipotesis nol sebagian besar tidak diakui. Ketika hipotesis nol diprediksi oleh teori, percobaan yang lebih tepat akan menjadi ujian yang lebih berat dari teori yang mendasarinya. Ketika hipotesis nol default ke "tidak ada perbedaan" atau "tidak ada efek", percobaan yang lebih tepat adalah ujian yang kurang parah dari teori yang memotivasi melakukan percobaan. Oleh karena itu, pemeriksaan asal usul praktik terakhir ini mungkin bermanfaat:
1778: Pierre Laplace membandingkan angka kelahiran anak laki-laki dan perempuan di beberapa kota di Eropa. Dia menyatakan: "itu wajar untuk menyimpulkan bahwa kemungkinan ini hampir dalam rasio yang sama". Dengan demikian hipotesis nol Laplace bahwa angka kelahiran anak laki-laki dan perempuan harus sama dengan diberikan "kebijaksanaan konvensional".
1900: Karl Pearson mengembangkan uji chi kuadrat untuk menentukan "apakah bentuk kurva frekuensi tertentu akan secara efektif menggambarkan sampel yang diambil dari populasi tertentu." Dengan demikian hipotesis nol adalah bahwa suatu populasi digambarkan oleh suatu distribusi yang diprediksi oleh teori. Dia menggunakan sebagai contoh angka lima dan enam dalam data lemparan dadu Weldon.
1904: Karl Pearson mengembangkan konsep "kontingensi" untuk menentukan apakah hasil tidak tergantung pada faktor kategorikal tertentu. Di sini hipotesis nol secara default bahwa dua hal tidak terkait (misalnya pembentukan bekas luka dan tingkat kematian akibat cacar). Hipotesis nol dalam kasus ini tidak lagi diprediksi oleh teori atau kearifan konvensional, tetapi lebih merupakan prinsip ketidakpedulian yang membuat Fisher dan lainnya mengabaikan penggunaan "probabilitas terbalik".
Meskipun ada satu orang yang dikreditkan karena menolak hipotesis nol, saya pikir itu tidak masuk akal untuk menamai mereka " penemuan skeptisisme yang didasarkan pada posisi matematika yang lemah".