Apa perbedaan antara probabilitas dan statistik?


Jawaban:


114

Jawaban singkat untuk ini yang saya dengar dari Persi Diaconis adalah sebagai berikut: masalah yang dipertimbangkan oleh probabilitas dan statistik saling terbalik. Dalam teori probabilitas kami mempertimbangkan beberapa proses mendasar yang memiliki beberapa keacakan atau ketidakpastian dimodelkan oleh variabel acak, dan kami mencari tahu apa yang terjadi. Dalam statistik kami mengamati sesuatu yang telah terjadi, dan mencoba mencari tahu proses apa yang akan menjelaskan pengamatan itu.


2
Jadi statistik mengamati apa yang terjadi di dunia fisik, berteori tentang proses yang mendasarinya, dan kemudian setelah menemukan prosesnya, menggunakannya dalam arti probabilitas untuk memprediksi apa yang akan terjadi selanjutnya?
hslc

Saya bukan ahli statistik, tetapi dari pemahaman saya, saya akan mengatakan, ya, bagian dari apa yang dilakukan statistik.
Mark Meckes

16
Induksi vs Deduksi?
Paolo

6
Seperti kata Paolo, teori probabilitas terutama berkaitan dengan bagian deduktif, statistik dengan bagian induktif dari proses pemodelan dengan ketidakpastian. Mungkin menarik untuk menyebutkan bahwa jika seseorang berpikir bahwa penalaran induktif yang masuk akal harus konsisten, maka sebenarnya hasilnya adalah statistik bayesian, dan yang lebih menarik ini dapat diturunkan dari teori probabilitas. Jadi statistik bayesian pada dasarnya menerapkan teori probabilitas sehingga untuk berbicara.
Thies Heidecke

1
@Paolo Statistik Inferensi dianggap "Statistik Induktif"
kervin

77

Saya suka contoh toples jeli kacang merah dan hijau.

Seorang probabilis mulai dengan mengetahui proporsi masing-masing dan menanyakan kemungkinan menggambar jeli kacang merah. Seorang ahli statistik menyimpulkan proporsi biji jeli merah dengan mengambil sampel dari toples.


Tetapi bukankah itu hanya rumusan? Seorang probabilis mungkin bertanya "mengingat saya telah menggambar tiga kacang merah, berapa probabilitas bahwa proporsinya adalah fifty fifty?"
Thomas Ahle

2
@ThomasAhle: Itu bukan pertanyaan probabilitas yang didefinisikan dengan baik kecuali jika Anda mengasumsikan beberapa model probabilistik yang mendasari untuk distribusi warna asli.
Mark Meckes

55

Menyesatkan mengatakan bahwa statistik hanyalah kebalikan dari probabilitas. Ya, pertanyaan statistik adalah pertanyaan tentang probabilitas terbalik, tetapi itu adalah masalah terbalik yang salah , dan ini membuat perbedaan besar dalam hal bagaimana mereka ditangani.

Probabilitas adalah cabang matematika murni - pertanyaan probabilitas dapat diajukan dan diselesaikan menggunakan penalaran aksiomatik, dan oleh karena itu ada satu jawaban yang benar untuk setiap pertanyaan probabilitas.

Pertanyaan statistik dapat dikonversi menjadi pertanyaan probabilitas dengan menggunakan model probabilitas . Setelah kami membuat asumsi tertentu tentang mekanisme menghasilkan data, kami dapat menjawab pertanyaan statistik menggunakan teori probabilitas. NAMUN, formulasi yang tepat dan pengecekan model-model probabilitas ini sama pentingnya, atau bahkan lebih penting, daripada analisis masalah selanjutnya menggunakan model-model ini.

Dapat dikatakan bahwa statistik terdiri dari dua bagian. Bagian pertama adalah pertanyaan tentang bagaimana merumuskan dan mengevaluasi model probabilistik untuk masalah tersebut; usaha ini terletak dalam domain "filsafat ilmu". Bagian kedua adalah pertanyaan untuk mendapatkan jawaban setelah model tertentu diasumsikan. Bagian statistik ini memang masalah teori probabilitas terapan, dan dalam praktiknya, berisi banyak analisis numerik juga.

Lihat: http://bactra.org/reviews/error/


2
Aku mencintaimu untuk jawaban ini
badatmath

16

Saya suka ini dari Taruhan Terhitung Steve Skienna (lihat tautan untuk diskusi lengkap):

Singkatnya, teori probabilitas memungkinkan kita untuk menemukan konsekuensi dari dunia ideal yang diberikan, sementara teori statistik memungkinkan kita untuk mengukur sejauh mana dunia kita ideal.


13

Probabilitas adalah ilmu murni (matematika), statistik adalah tentang data. Mereka terhubung karena probabilitas membentuk semacam dasar untuk statistik, memberikan ide-ide dasar.


3
Jadi probabilitas matematika murni dan statistik diterapkan matematika?
hslc

4
Statistik dapat diterapkan dan mungkin tidak; tetap konsep datanya selalu hadir.

13

Tabel 3.1 dari Intuitif Biostatistik menjawab pertanyaan ini dengan diagram yang ditunjukkan di bawah ini. Perhatikan bahwa semua panah menunjuk ke kanan untuk probabilitas, dan menunjuk ke kiri untuk statistik.

KEMUNGKINAN; PELUANG; PROBABILITAS

Umum ---> Spesifik

Populasi ---> Sampel

Model ---> Data

STATISTIK

Umum <--- Spesifik

Populasi <--- Sampel

Model <--- Data


1
Jadi statistik identik dengan analisis data?
hslc

3
Saya tidak melihat perbedaan.
Harvey Motulsky

3
Beberapa analisis data tidak mengandalkan statistik frequentist.
Fr.

11

Probabilitas jawaban pertanyaan tentang apa yang akan terjadi, statistik menjawab pertanyaan tentang apa itu terjadi.


3
Namun, dengan definisi ini, interval prediksi adalah probabilitas daripada statistik.
Glen_b

10

Probabilitas adalah tentang mengukur ketidakpastian sedangkan statistik menjelaskan variasi dalam beberapa ukuran minat (misalnya, mengapa tingkat pendapatan bervariasi?) Yang kami amati di dunia nyata.

Kami menjelaskan variasi dengan menggunakan beberapa faktor yang dapat diamati (misalnya, jenis kelamin, tingkat pendidikan, usia dll untuk contoh pendapatan). Namun, karena kami tidak mungkin memperhitungkan semua faktor yang mungkin memengaruhi pendapatan, kami membiarkan variasi yang tidak dapat dijelaskan sebagai kesalahan acak (yang merupakan asal ketidakpastian yang masuk).

Karena, kami mengaitkan "Variasi = Pengaruh Faktor yang Dapat Diamati + Pengaruh Kesalahan Acak" kita memerlukan alat yang disediakan oleh probabilitas untuk menjelaskan pengaruh kesalahan acak pada variasi yang kami amati.

Beberapa contoh mengikuti:

Mengukur Ketidakpastian

Contoh 1: Anda menggulung dadu 6 sisi. Berapa probabilitas mendapatkan 1?

Contoh 2: Berapa probabilitas bahwa pendapatan tahunan orang dewasa yang dipilih secara acak dari Amerika Serikat kurang dari $ 40.000?

Menjelaskan Variasi

Contoh 1: Kami mengamati bahwa pendapatan tahunan seseorang bervariasi. Faktor-faktor apa yang menjelaskan variasi dalam pendapatan seseorang?

Jelas, kami tidak dapat menjelaskan semua faktor. Dengan demikian, kami menghubungkan pendapatan seseorang dengan beberapa faktor yang dapat diamati (misalnya, tingkat pendidikan, jenis kelamin, usia dll) dan membiarkan variasi yang tersisa untuk ketidakpastian (atau dalam bahasa statistik: untuk kesalahan acak).

Contoh 2: Kami mengamati bahwa beberapa konsumen memilih Tide sebagian besar waktu mereka membeli deterjen sedangkan beberapa konsumen lain memilih deterjen merek xyz. Apa yang menjelaskan variasi dalam pilihan? Kami mengaitkan variasi dalam pilihan dengan beberapa faktor yang dapat diobservasi seperti harga, nama merek, dll. Dan membiarkan variasi yang tidak dapat dijelaskan sebagai kesalahan acak (atau ketidakpastian).


1
Bagaimana jika kesalahan acak menjadi lebih besar dari faktor yang dapat diamati dari waktu ke waktu?
hslc

Dalam hal ini Anda bekerja kembali model Anda karena tidak lagi konsisten dengan kenyataan.

8

Probabilitas adalah pelukan dari ketidakpastian, sementara statistik adalah pengejaran empiris, kebenaran yang kejam (tentu saja pembohong terkucilkan dikecualikan).


Di sini saya sedang memikirkan semua probabilitas frequentist / bayesian dan semua statistik deskriptif / eksplorasi / inferensial.

7

Mirip dengan apa yang dikatakan Mark, Statistik secara historis disebut Inverse Probability , karena statistik mencoba menyimpulkan sebab-sebab peristiwa yang diamati, sementara probabilitas cenderung sebaliknya.


6

The probabilitas dari suatu peristiwa adalah frekuensi relatif jangka panjang. Jadi itu pada dasarnya memberi tahu Anda kesempatan , misalnya, mendapatkan 'kepala' pada flip koin berikutnya, atau mendapatkan '3' pada gulungan dadu berikutnya.

Sebuah statistik adalah setiap ukuran numerik dihitung dari sampel dari populasi. Misalnya, mean sampel. Kami menggunakan ini sebagai statistik yang memperkirakan rata-rata populasi, yang merupakan parameter. Jadi pada dasarnya itu memberi Anda semacam ringkasan sampel.

  • Anda hanya bisa mendapatkan statistik dari sampel, jika tidak, jika Anda menghitung ukuran numerik pada populasi, itu disebut parameter populasi.

6

Studi probabilitas, well, seberapa besar kemungkinan kejadian itu. Secara intuitif Anda tahu apa itu probabilitas.

Statistik adalah studi tentang data: menunjukkannya (menggunakan alat-alat seperti grafik), meringkasnya (menggunakan cara dan standar deviasi, dll.), Mencapai kesimpulan tentang dunia dari mana data itu diambil (pas garis ke data dll), dan - ini adalah kunci - mengukur seberapa yakin kita tentang kesimpulan kita.

Untuk mengukur seberapa yakin kita tentang kesimpulan kita, kita perlu menggunakan Probabilitas. Katakanlah Anda memiliki data tahun lalu tentang curah hujan di wilayah tempat Anda tinggal dan tempat saya tinggal. Tahun lalu hujan rata-rata 1/4 inci per minggu tempat tinggal Anda, dan 3/8 inci tempat tinggal saya. Jadi bisa dikatakan bahwa curah hujan di wilayah saya rata-rata 50% lebih besar dari tempat Anda tinggal, bukan? Tidak secepat itu, Sparky. Ini bisa jadi kebetulan: mungkin saja sering terjadi hujan tahun lalu di tempat saya tinggal. Kita dapat menggunakan Probabilitas untuk memperkirakan seberapa yakin kita dalam kesimpulan bahwa rumah saya 50% lebih soggier daripada milik Anda.

Jadi pada dasarnya Anda dapat mengatakan bahwa Probabilitas adalah dasar matematika untuk Teori Statistik.


5

Dalam teori probabilitas, kita diberi variabel acak X1, X2, ... dalam beberapa cara, dan kemudian kita mempelajari sifat-sifatnya, yaitu menghitung probabilitas P {X1 \ dalam B1}, mempelajari konvergensi X1, X2, ... dll .

Dalam statistik matematika, kita diberikan realisasi beberapa variabel acak X, dan set distribusi D; masalahnya adalah menemukan di antara distribusi dari D yang paling mungkin menghasilkan data yang kami amati.


Jadi kita hanya dapat menemukan pola yang kita cari sejak awal?
hslc

4

Dalam probabilitas, distribusi diketahui dan diketahui sebelumnya - Anda mulai dengan fungsi distribusi probabilitas yang diketahui (atau serupa), dan sampel darinya.

Dalam statistik, distribusi tidak diketahui sebelumnya. Bahkan mungkin tidak diketahui. Asumsi dihipotesiskan tentang distribusi probabilitas di balik data yang diamati, untuk dapat menerapkan teori probabilitas pada data tersebut untuk mengetahui apakah hipotesis nol tentang data tersebut dapat ditolak atau tidak.

Ada diskusi filosofis tentang apakah ada yang namanya probabilitas di dunia nyata, atau apakah itu isapan jempol ideal dari imajinasi matematika kita, dan semua pengamatan kita hanya bisa statistik.


3

Statistik adalah pengejaran kebenaran di tengah ketidakpastian. Probabilitas adalah alat yang memungkinkan kita untuk mengukur ketidakpastian.

(Saya telah memberikan jawaban lain yang lebih panjang, yang mengasumsikan bahwa apa yang ditanyakan adalah sesuatu seperti "bagaimana Anda akan menjelaskannya kepada nenek Anda?")


3

(Ω,F,P)θ(Ω,F,Pθ)θ

Jawaban # 2: Probabilitas adalah tentang melangkah maju; Statistik adalah tentang mundur. Probabilitas adalah tentang proses menghasilkan (mensimulasikan) data yang diberi nilai . Statistik adalah tentang proses pengambilan data untuk menarik kesimpulan tentang .θθθ

Penafian: jawaban di atas adalah matematika. Pada kenyataannya, banyak Statistik juga tentang merancang / menemukan model yang sesuai, mempertanyakan model yang ada, merancang eksperimen, berurusan dengan data yang tidak sempurna, dll. "Semua model salah."


4
Secara analogi, jika ditanya "apa itu kimia?" kita dapat menjawab bahwa itu adalah satu set persamaan diferensial. Penjelasan teori matematika dapat memberi kita ide kecil tentang apa subjeknya, tetapi itu bukan subjek itu sendiri.
whuber

3

Probabilitas : Diberikan parameter yang diketahui, temukan probabilitas mengamati sekumpulan data tertentu.

Statistik : Diberikan seperangkat data yang diamati, buat kesimpulan tentang apa parameternya.

Statistik "lebih subyektif" dan "lebih banyak seni daripada sains" (relatif terhadap probabilitas).

Example_

Kami memiliki koin yang dapat dibalik. Biarkan menjadi proporsi koin-membalik yang kepala.p

Probabilitas : Misalkan . Lalu berapa probabilitas mendapatkan (tiga kepala berturut-turut)? HHHp=12HHH

Kebanyakan probabilis akan memberikan jawaban yang sama dan sederhana: "Probabilitasnya adalah ."18

Statistik : Misalkan kita mendapatkan . Lalu apa yang ?pHHHp

Ahli statistik yang berbeda akan memberikan jawaban yang berbeda, sering kali bertele-tele.


3

Perbedaan antara probabilitas dan statistik adalah bahwa dalam probabilitas tidak ada kesalahan. Kami yakin akan kemungkinannya karena kami tahu persis berapa banyak pihak yang memiliki koin, atau berapa banyak karamel biru dalam vas. Tetapi dalam statistik kami memeriksa sebagian dari populasi apa pun yang kami periksa, dan dari sini, kami mencoba melihat kebenaran, tetapi selalu ada% dari kesimpulan yang salah. Satu-satunya hal dalam statistik yang benar, apakah ini% kesalahan, yang sebenarnya adalah probabilitas.


2

Teks Savage, Yayasan Statistik telah dikutip lebih dari 12.000 kali di Google Cendekia. [3] Ini menceritakan yang berikut.

Dengan suara bulat disepakati bahwa statistik entah bagaimana tergantung pada probabilitas. Tapi, seperti apa probabilitasnya dan bagaimana itu dihubungkan dengan statistik, jarang ada ketidaksepakatan dan gangguan komunikasi sejak Menara Babel. Tidak diragukan lagi, sebagian besar ketidaksepakatan hanyalah terminologis dan akan hilang di bawah analisis yang cukup tajam.

https://en.wikipedia.org/wiki/Foundations_of_statistics

Jadi poin yang Teori Probabilitas adalah Yayasan Statistik hampir tidak diperdebatkan. Yang lainnya adalah permainan yang adil.

Tetapi dalam mencoba menjadi lebih bermanfaat, praktis dengan jawaban ...

Namun, teori probabilitas mengandung banyak hal yang sebagian besar menarik matematika dan tidak secara langsung relevan dengan statistik. Selain itu, banyak topik dalam statistik tidak tergantung pada teori probabilitas

https://en.wikipedia.org/wiki/Probability_and_statistics

Hal di atas tidak lengkap atau otoritatif dengan cara apa pun, tapi saya yakin ini berguna.

Biasanya itu membantu saya untuk melihat hal-hal seperti ...

Descrete Matematika >> Teori Probabilitas >> Statistik

Dengan masing-masing sangat banyak digunakan, rata-rata, di dasar berikutnya. Itu adalah ada persimpangan besar dalam cara kita mempelajari fondasi berikutnya.

PS. Ada Statistik induktif dan deduktif, jadi di situlah perbedaannya.


0

Banyak orang dan ahli matematika mengatakan bahwa 'STATISTIK adalah kebalikan dari PROBABILITY', tetapi itu tidak terlalu benar. Cara pendekatan atau metode penyelesaian 2 ini sangat berbeda tetapi mereka TERHUBUNG .

saya ingin merujuk ke teman saya John D Cook .....

"Saya suka contoh toples jeli kacang merah dan hijau.

Probabilis mulai dengan mengetahui proporsi masing-masing dan katakanlah menemukan kemungkinan menggambar jeli kacang merah. Seorang ahli statistik menyimpulkan proporsi biji jeli merah dengan mengambil sampel dari toples. "

Sekarang proporsi kacang jeli merah yang diperoleh dengan sampling dari toples digunakan oleh probabilist untuk menemukan kemungkinan menggambar kacang merah dari toples.

Pertimbangkan contoh ini ---- >>>

Dalam ujian, 30% siswa gagal dalam fisika, 25% gagal dalam matematika, 12% gagal dalam fisika dan matematika. Seorang siswa yang dipilih secara acak menemukan kemungkinan bahwa siswa tersebut telah gagal dalam Fisika, jika diketahui bahwa ia gagal dalam matematika.

Jumlah di atas adalah masalah probabilitas, tetapi jika kita perhatikan dengan teliti kita akan menemukan bahwa jumlah tersebut diberikan dengan beberapa data statistik

30% siswa gagal dalam fisika, 25% "" "matematika '' 'Ini pada dasarnya adalah frekuensi jika persentase dihitung. Dengan demikian kita diberikan data statistik yang pada gilirannya membantu kita menemukan probabilitas

SO PROBABILITAS DAN STATISTIK SANGAT BANYAK TERKAIT ATAU SANGAT KITA BISA MENGATAKAN BAHWA PROBABILITAS TERGANTUNG BANYAK PADA STATISTIK


0

Istilah "statistik" dengan indah dijelaskan oleh JC Maxwell dalam artikel Molecules (dalam Nature 8, 1873, hlm. 437-441). Izinkan saya mengutip bagian yang relevan:

Ketika anggota kerja Bagian F mendapatkan Laporan Sensus, atau dokumen lain yang berisi data numerik Ilmu Ekonomi dan Sosial, mereka mulai dengan mendistribusikan seluruh populasi ke dalam kelompok-kelompok, sesuai dengan usia, pajak penghasilan, pendidikan, keyakinan agama, atau hukuman pidana. Jumlah individu terlalu besar untuk memungkinkan mereka melacak sejarah masing-masing secara terpisah, sehingga, untuk mengurangi tenaga kerja mereka dalam batas manusia, mereka memusatkan perhatian mereka pada sejumlah kecil kelompok buatan. Jumlah individu yang bervariasi dalam setiap kelompok, dan bukan status yang berbeda dari masing-masing individu, adalah datum primer tempat mereka bekerja.

Ini, tentu saja, bukan satu-satunya metode mempelajari sifat manusia. Kita dapat mengamati tingkah laku individu pria dan membandingkannya dengan tingkah laku yang karakter mereka sebelumnya dan keadaan mereka saat ini, menurut teori terbaik yang ada, akan menuntun kita untuk berharap. Mereka yang mempraktikkan metode ini berupaya untuk meningkatkan pengetahuan mereka tentang unsur-unsur sifat manusia, dengan cara yang sama seperti seorang astronom mengoreksi unsur-unsur planet dengan membandingkan posisi aktualnya dengan yang disimpulkan dari unsur-unsur yang diterima. Studi tentang sifat manusia oleh orang tua dan kepala sekolah, oleh sejarawan dan negarawan, karena itu harus dibedakan dari yang dilakukan oleh pendaftar dan tabulator, dan oleh negarawan yang menaruh kepercayaan mereka pada angka. Yang satu dapat disebut historis, dan yang lainnya metode statistik.

Persamaan dinamika sepenuhnya mengungkapkan hukum metode historis sebagaimana diterapkan pada materi, tetapi penerapan persamaan ini menyiratkan pengetahuan yang sempurna dari semua data. Tetapi bagian terkecil dari materi yang dapat kita eksperimen terdiri dari jutaan molekul, tidak satu pun di antaranya yang secara individu masuk akal bagi kita. Karena itu, kita tidak dapat memastikan gerakan sebenarnya dari salah satu molekul ini, sehingga kita berkewajiban untuk meninggalkan metode historis yang ketat, dan untuk mengadopsi metode statistik dalam berurusan dengan kelompok besar molekul.

Ia memberikan penjelasan tentang metode statistik ini dalam beberapa karya lainnya. Misalnya, "Dalam metode statistik penyelidikan, kami tidak mengikuti sistem selama gerakannya, tetapi kami memusatkan perhatian pada fase tertentu, dan memastikan apakah sistem berada dalam fase itu atau tidak, dan juga ketika memasuki fase dan ketika ia meninggalkannya "(Trans. Cambridge Philos. Soc. 12, 1879, hlm. 547–570).

Ada bagian lain yang indah dari Maxwell tentang "probabilitas" (dari sepucuk surat hingga Campbell, 1850, dicetak ulang dalam The Life of James Clerk Maxwell , hlm. 143):

ilmu Logika yang sebenarnya adalah fasih saat ini hanya dengan hal-hal yang pasti, tidak mungkin, atau sepenuhnya diragukan, tidak ada yang (untungnya) harus kita pertimbangkan. Oleh karena itu Logika yang benar untuk dunia ini adalah Kalkulus Probabilitas, yang memperhitungkan besarnya probabilitas (yang, atau yang seharusnya ada dalam pikiran manusia yang masuk akal).

Jadi kita dapat mengatakan:

- Dalam statistik kami "memusatkan perhatian kami pada sejumlah kecil kelompok buatan" atau jumlah; kami membuat semacam katalogisasi atau sensus.

- Kemungkinan kami menghitung ketidakpastian kami tentang beberapa peristiwa atau jumlah.

Keduanya berbeda, dan kita bisa melakukan yang satu tanpa yang lain.

Misalnya, jika kami membuat sensus lengkap dari seluruh populasi suatu negara dan menghitung jumlah pasti orang yang termasuk dalam kelompok tertentu seperti usia, jenis kelamin, dan sebagainya, kami sedang melakukan statistik. Tidak ada ketidakpastian - probabilitas - yang terlibat, karena angka yang kami temukan tepat dan diketahui.

Di sisi lain, bayangkan seseorang lewat di depan kita di jalan, dan kita bertanya-tanya tentang umur mereka. Dalam hal ini kami tidak pasti dan kami menggunakan probabilitas, tetapi tidak ada statistik yang terlibat, karena kami tidak membuat semacam sensus atau katalog.

Namun keduanya juga bisa terjadi bersamaan. Jika kita tidak dapat membuat sensus lengkap dari suatu populasi, kita harus menebak berapa banyak orang dalam kelompok gender usia tertentu. Karenanya kita menggunakan probabilitas saat melakukan statistik. Begitu juga sebaliknya, kita dapat mempertimbangkan data statistik yang tepat tentang usia orang, dan dari data tersebut cobalah membuat tebakan yang lebih baik tentang orang yang lewat di depan kita. Karenanya kami menggunakan statistik sambil memutuskan suatu kemungkinan.


Terima kasih atas kontribusi anda. Meskipun menarik, itu tidak sesuai dengan apa yang para ahli statistik yakini sebagai statistik atau dengan apa yang sebenarnya mereka lakukan, seperti yang ditunjukkan di stats.stackexchange.com/questions/140547/… .
Whuber

Ini poin yang bisa diperdebatkan. Saya kenal ahli statistik profesional yang tidak setuju dengan definisi ASA (yang sangat kabur) dan setuju dengan Maxwell.
pglpm
Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.