Jawaban:
Jawaban singkat untuk ini yang saya dengar dari Persi Diaconis adalah sebagai berikut: masalah yang dipertimbangkan oleh probabilitas dan statistik saling terbalik. Dalam teori probabilitas kami mempertimbangkan beberapa proses mendasar yang memiliki beberapa keacakan atau ketidakpastian dimodelkan oleh variabel acak, dan kami mencari tahu apa yang terjadi. Dalam statistik kami mengamati sesuatu yang telah terjadi, dan mencoba mencari tahu proses apa yang akan menjelaskan pengamatan itu.
Saya suka contoh toples jeli kacang merah dan hijau.
Seorang probabilis mulai dengan mengetahui proporsi masing-masing dan menanyakan kemungkinan menggambar jeli kacang merah. Seorang ahli statistik menyimpulkan proporsi biji jeli merah dengan mengambil sampel dari toples.
Menyesatkan mengatakan bahwa statistik hanyalah kebalikan dari probabilitas. Ya, pertanyaan statistik adalah pertanyaan tentang probabilitas terbalik, tetapi itu adalah masalah terbalik yang salah , dan ini membuat perbedaan besar dalam hal bagaimana mereka ditangani.
Probabilitas adalah cabang matematika murni - pertanyaan probabilitas dapat diajukan dan diselesaikan menggunakan penalaran aksiomatik, dan oleh karena itu ada satu jawaban yang benar untuk setiap pertanyaan probabilitas.
Pertanyaan statistik dapat dikonversi menjadi pertanyaan probabilitas dengan menggunakan model probabilitas . Setelah kami membuat asumsi tertentu tentang mekanisme menghasilkan data, kami dapat menjawab pertanyaan statistik menggunakan teori probabilitas. NAMUN, formulasi yang tepat dan pengecekan model-model probabilitas ini sama pentingnya, atau bahkan lebih penting, daripada analisis masalah selanjutnya menggunakan model-model ini.
Dapat dikatakan bahwa statistik terdiri dari dua bagian. Bagian pertama adalah pertanyaan tentang bagaimana merumuskan dan mengevaluasi model probabilistik untuk masalah tersebut; usaha ini terletak dalam domain "filsafat ilmu". Bagian kedua adalah pertanyaan untuk mendapatkan jawaban setelah model tertentu diasumsikan. Bagian statistik ini memang masalah teori probabilitas terapan, dan dalam praktiknya, berisi banyak analisis numerik juga.
Saya suka ini dari Taruhan Terhitung Steve Skienna (lihat tautan untuk diskusi lengkap):
Singkatnya, teori probabilitas memungkinkan kita untuk menemukan konsekuensi dari dunia ideal yang diberikan, sementara teori statistik memungkinkan kita untuk mengukur sejauh mana dunia kita ideal.
Probabilitas adalah ilmu murni (matematika), statistik adalah tentang data. Mereka terhubung karena probabilitas membentuk semacam dasar untuk statistik, memberikan ide-ide dasar.
Tabel 3.1 dari Intuitif Biostatistik menjawab pertanyaan ini dengan diagram yang ditunjukkan di bawah ini. Perhatikan bahwa semua panah menunjuk ke kanan untuk probabilitas, dan menunjuk ke kiri untuk statistik.
KEMUNGKINAN; PELUANG; PROBABILITAS
Umum ---> Spesifik
Populasi ---> Sampel
Model ---> Data
STATISTIK
Umum <--- Spesifik
Populasi <--- Sampel
Model <--- Data
Probabilitas jawaban pertanyaan tentang apa yang akan terjadi, statistik menjawab pertanyaan tentang apa itu terjadi.
Probabilitas adalah tentang mengukur ketidakpastian sedangkan statistik menjelaskan variasi dalam beberapa ukuran minat (misalnya, mengapa tingkat pendapatan bervariasi?) Yang kami amati di dunia nyata.
Kami menjelaskan variasi dengan menggunakan beberapa faktor yang dapat diamati (misalnya, jenis kelamin, tingkat pendidikan, usia dll untuk contoh pendapatan). Namun, karena kami tidak mungkin memperhitungkan semua faktor yang mungkin memengaruhi pendapatan, kami membiarkan variasi yang tidak dapat dijelaskan sebagai kesalahan acak (yang merupakan asal ketidakpastian yang masuk).
Karena, kami mengaitkan "Variasi = Pengaruh Faktor yang Dapat Diamati + Pengaruh Kesalahan Acak" kita memerlukan alat yang disediakan oleh probabilitas untuk menjelaskan pengaruh kesalahan acak pada variasi yang kami amati.
Beberapa contoh mengikuti:
Mengukur Ketidakpastian
Contoh 1: Anda menggulung dadu 6 sisi. Berapa probabilitas mendapatkan 1?
Contoh 2: Berapa probabilitas bahwa pendapatan tahunan orang dewasa yang dipilih secara acak dari Amerika Serikat kurang dari $ 40.000?
Menjelaskan Variasi
Contoh 1: Kami mengamati bahwa pendapatan tahunan seseorang bervariasi. Faktor-faktor apa yang menjelaskan variasi dalam pendapatan seseorang?
Jelas, kami tidak dapat menjelaskan semua faktor. Dengan demikian, kami menghubungkan pendapatan seseorang dengan beberapa faktor yang dapat diamati (misalnya, tingkat pendidikan, jenis kelamin, usia dll) dan membiarkan variasi yang tersisa untuk ketidakpastian (atau dalam bahasa statistik: untuk kesalahan acak).
Contoh 2: Kami mengamati bahwa beberapa konsumen memilih Tide sebagian besar waktu mereka membeli deterjen sedangkan beberapa konsumen lain memilih deterjen merek xyz. Apa yang menjelaskan variasi dalam pilihan? Kami mengaitkan variasi dalam pilihan dengan beberapa faktor yang dapat diobservasi seperti harga, nama merek, dll. Dan membiarkan variasi yang tidak dapat dijelaskan sebagai kesalahan acak (atau ketidakpastian).
The probabilitas dari suatu peristiwa adalah frekuensi relatif jangka panjang. Jadi itu pada dasarnya memberi tahu Anda kesempatan , misalnya, mendapatkan 'kepala' pada flip koin berikutnya, atau mendapatkan '3' pada gulungan dadu berikutnya.
Sebuah statistik adalah setiap ukuran numerik dihitung dari sampel dari populasi. Misalnya, mean sampel. Kami menggunakan ini sebagai statistik yang memperkirakan rata-rata populasi, yang merupakan parameter. Jadi pada dasarnya itu memberi Anda semacam ringkasan sampel.
Studi probabilitas, well, seberapa besar kemungkinan kejadian itu. Secara intuitif Anda tahu apa itu probabilitas.
Statistik adalah studi tentang data: menunjukkannya (menggunakan alat-alat seperti grafik), meringkasnya (menggunakan cara dan standar deviasi, dll.), Mencapai kesimpulan tentang dunia dari mana data itu diambil (pas garis ke data dll), dan - ini adalah kunci - mengukur seberapa yakin kita tentang kesimpulan kita.
Untuk mengukur seberapa yakin kita tentang kesimpulan kita, kita perlu menggunakan Probabilitas. Katakanlah Anda memiliki data tahun lalu tentang curah hujan di wilayah tempat Anda tinggal dan tempat saya tinggal. Tahun lalu hujan rata-rata 1/4 inci per minggu tempat tinggal Anda, dan 3/8 inci tempat tinggal saya. Jadi bisa dikatakan bahwa curah hujan di wilayah saya rata-rata 50% lebih besar dari tempat Anda tinggal, bukan? Tidak secepat itu, Sparky. Ini bisa jadi kebetulan: mungkin saja sering terjadi hujan tahun lalu di tempat saya tinggal. Kita dapat menggunakan Probabilitas untuk memperkirakan seberapa yakin kita dalam kesimpulan bahwa rumah saya 50% lebih soggier daripada milik Anda.
Jadi pada dasarnya Anda dapat mengatakan bahwa Probabilitas adalah dasar matematika untuk Teori Statistik.
Dalam teori probabilitas, kita diberi variabel acak X1, X2, ... dalam beberapa cara, dan kemudian kita mempelajari sifat-sifatnya, yaitu menghitung probabilitas P {X1 \ dalam B1}, mempelajari konvergensi X1, X2, ... dll .
Dalam statistik matematika, kita diberikan realisasi beberapa variabel acak X, dan set distribusi D; masalahnya adalah menemukan di antara distribusi dari D yang paling mungkin menghasilkan data yang kami amati.
Dalam probabilitas, distribusi diketahui dan diketahui sebelumnya - Anda mulai dengan fungsi distribusi probabilitas yang diketahui (atau serupa), dan sampel darinya.
Dalam statistik, distribusi tidak diketahui sebelumnya. Bahkan mungkin tidak diketahui. Asumsi dihipotesiskan tentang distribusi probabilitas di balik data yang diamati, untuk dapat menerapkan teori probabilitas pada data tersebut untuk mengetahui apakah hipotesis nol tentang data tersebut dapat ditolak atau tidak.
Ada diskusi filosofis tentang apakah ada yang namanya probabilitas di dunia nyata, atau apakah itu isapan jempol ideal dari imajinasi matematika kita, dan semua pengamatan kita hanya bisa statistik.
Statistik adalah pengejaran kebenaran di tengah ketidakpastian. Probabilitas adalah alat yang memungkinkan kita untuk mengukur ketidakpastian.
(Saya telah memberikan jawaban lain yang lebih panjang, yang mengasumsikan bahwa apa yang ditanyakan adalah sesuatu seperti "bagaimana Anda akan menjelaskannya kepada nenek Anda?")
Jawaban # 2: Probabilitas adalah tentang melangkah maju; Statistik adalah tentang mundur. Probabilitas adalah tentang proses menghasilkan (mensimulasikan) data yang diberi nilai . Statistik adalah tentang proses pengambilan data untuk menarik kesimpulan tentang .θ
Penafian: jawaban di atas adalah matematika. Pada kenyataannya, banyak Statistik juga tentang merancang / menemukan model yang sesuai, mempertanyakan model yang ada, merancang eksperimen, berurusan dengan data yang tidak sempurna, dll. "Semua model salah."
Probabilitas : Diberikan parameter yang diketahui, temukan probabilitas mengamati sekumpulan data tertentu.
Statistik : Diberikan seperangkat data yang diamati, buat kesimpulan tentang apa parameternya.
Statistik "lebih subyektif" dan "lebih banyak seni daripada sains" (relatif terhadap probabilitas).
Kami memiliki koin yang dapat dibalik. Biarkan menjadi proporsi koin-membalik yang kepala.
Probabilitas : Misalkan . Lalu berapa probabilitas mendapatkan (tiga kepala berturut-turut)? HHH
Kebanyakan probabilis akan memberikan jawaban yang sama dan sederhana: "Probabilitasnya adalah ."
Statistik : Misalkan kita mendapatkan . Lalu apa yang ?p
Ahli statistik yang berbeda akan memberikan jawaban yang berbeda, sering kali bertele-tele.
Perbedaan antara probabilitas dan statistik adalah bahwa dalam probabilitas tidak ada kesalahan. Kami yakin akan kemungkinannya karena kami tahu persis berapa banyak pihak yang memiliki koin, atau berapa banyak karamel biru dalam vas. Tetapi dalam statistik kami memeriksa sebagian dari populasi apa pun yang kami periksa, dan dari sini, kami mencoba melihat kebenaran, tetapi selalu ada% dari kesimpulan yang salah. Satu-satunya hal dalam statistik yang benar, apakah ini% kesalahan, yang sebenarnya adalah probabilitas.
Teks Savage, Yayasan Statistik telah dikutip lebih dari 12.000 kali di Google Cendekia. [3] Ini menceritakan yang berikut.
Dengan suara bulat disepakati bahwa statistik entah bagaimana tergantung pada probabilitas. Tapi, seperti apa probabilitasnya dan bagaimana itu dihubungkan dengan statistik, jarang ada ketidaksepakatan dan gangguan komunikasi sejak Menara Babel. Tidak diragukan lagi, sebagian besar ketidaksepakatan hanyalah terminologis dan akan hilang di bawah analisis yang cukup tajam.
https://en.wikipedia.org/wiki/Foundations_of_statistics
Jadi poin yang Teori Probabilitas adalah Yayasan Statistik hampir tidak diperdebatkan. Yang lainnya adalah permainan yang adil.
Tetapi dalam mencoba menjadi lebih bermanfaat, praktis dengan jawaban ...
Namun, teori probabilitas mengandung banyak hal yang sebagian besar menarik matematika dan tidak secara langsung relevan dengan statistik. Selain itu, banyak topik dalam statistik tidak tergantung pada teori probabilitas
https://en.wikipedia.org/wiki/Probability_and_statistics
Hal di atas tidak lengkap atau otoritatif dengan cara apa pun, tapi saya yakin ini berguna.
Biasanya itu membantu saya untuk melihat hal-hal seperti ...
Descrete Matematika >> Teori Probabilitas >> Statistik
Dengan masing-masing sangat banyak digunakan, rata-rata, di dasar berikutnya. Itu adalah ada persimpangan besar dalam cara kita mempelajari fondasi berikutnya.
PS. Ada Statistik induktif dan deduktif, jadi di situlah perbedaannya.
Banyak orang dan ahli matematika mengatakan bahwa 'STATISTIK adalah kebalikan dari PROBABILITY', tetapi itu tidak terlalu benar. Cara pendekatan atau metode penyelesaian 2 ini sangat berbeda tetapi mereka TERHUBUNG .
saya ingin merujuk ke teman saya John D Cook .....
"Saya suka contoh toples jeli kacang merah dan hijau.
Probabilis mulai dengan mengetahui proporsi masing-masing dan katakanlah menemukan kemungkinan menggambar jeli kacang merah. Seorang ahli statistik menyimpulkan proporsi biji jeli merah dengan mengambil sampel dari toples. "
Sekarang proporsi kacang jeli merah yang diperoleh dengan sampling dari toples digunakan oleh probabilist untuk menemukan kemungkinan menggambar kacang merah dari toples.
Pertimbangkan contoh ini ---- >>>
Dalam ujian, 30% siswa gagal dalam fisika, 25% gagal dalam matematika, 12% gagal dalam fisika dan matematika. Seorang siswa yang dipilih secara acak menemukan kemungkinan bahwa siswa tersebut telah gagal dalam Fisika, jika diketahui bahwa ia gagal dalam matematika.
Jumlah di atas adalah masalah probabilitas, tetapi jika kita perhatikan dengan teliti kita akan menemukan bahwa jumlah tersebut diberikan dengan beberapa data statistik
30% siswa gagal dalam fisika, 25% "" "matematika '' 'Ini pada dasarnya adalah frekuensi jika persentase dihitung. Dengan demikian kita diberikan data statistik yang pada gilirannya membantu kita menemukan probabilitas
SO PROBABILITAS DAN STATISTIK SANGAT BANYAK TERKAIT ATAU SANGAT KITA BISA MENGATAKAN BAHWA PROBABILITAS TERGANTUNG BANYAK PADA STATISTIK
Istilah "statistik" dengan indah dijelaskan oleh JC Maxwell dalam artikel Molecules (dalam Nature 8, 1873, hlm. 437-441). Izinkan saya mengutip bagian yang relevan:
Ketika anggota kerja Bagian F mendapatkan Laporan Sensus, atau dokumen lain yang berisi data numerik Ilmu Ekonomi dan Sosial, mereka mulai dengan mendistribusikan seluruh populasi ke dalam kelompok-kelompok, sesuai dengan usia, pajak penghasilan, pendidikan, keyakinan agama, atau hukuman pidana. Jumlah individu terlalu besar untuk memungkinkan mereka melacak sejarah masing-masing secara terpisah, sehingga, untuk mengurangi tenaga kerja mereka dalam batas manusia, mereka memusatkan perhatian mereka pada sejumlah kecil kelompok buatan. Jumlah individu yang bervariasi dalam setiap kelompok, dan bukan status yang berbeda dari masing-masing individu, adalah datum primer tempat mereka bekerja.
Ini, tentu saja, bukan satu-satunya metode mempelajari sifat manusia. Kita dapat mengamati tingkah laku individu pria dan membandingkannya dengan tingkah laku yang karakter mereka sebelumnya dan keadaan mereka saat ini, menurut teori terbaik yang ada, akan menuntun kita untuk berharap. Mereka yang mempraktikkan metode ini berupaya untuk meningkatkan pengetahuan mereka tentang unsur-unsur sifat manusia, dengan cara yang sama seperti seorang astronom mengoreksi unsur-unsur planet dengan membandingkan posisi aktualnya dengan yang disimpulkan dari unsur-unsur yang diterima. Studi tentang sifat manusia oleh orang tua dan kepala sekolah, oleh sejarawan dan negarawan, karena itu harus dibedakan dari yang dilakukan oleh pendaftar dan tabulator, dan oleh negarawan yang menaruh kepercayaan mereka pada angka. Yang satu dapat disebut historis, dan yang lainnya metode statistik.
Persamaan dinamika sepenuhnya mengungkapkan hukum metode historis sebagaimana diterapkan pada materi, tetapi penerapan persamaan ini menyiratkan pengetahuan yang sempurna dari semua data. Tetapi bagian terkecil dari materi yang dapat kita eksperimen terdiri dari jutaan molekul, tidak satu pun di antaranya yang secara individu masuk akal bagi kita. Karena itu, kita tidak dapat memastikan gerakan sebenarnya dari salah satu molekul ini, sehingga kita berkewajiban untuk meninggalkan metode historis yang ketat, dan untuk mengadopsi metode statistik dalam berurusan dengan kelompok besar molekul.
Ia memberikan penjelasan tentang metode statistik ini dalam beberapa karya lainnya. Misalnya, "Dalam metode statistik penyelidikan, kami tidak mengikuti sistem selama gerakannya, tetapi kami memusatkan perhatian pada fase tertentu, dan memastikan apakah sistem berada dalam fase itu atau tidak, dan juga ketika memasuki fase dan ketika ia meninggalkannya "(Trans. Cambridge Philos. Soc. 12, 1879, hlm. 547–570).
Ada bagian lain yang indah dari Maxwell tentang "probabilitas" (dari sepucuk surat hingga Campbell, 1850, dicetak ulang dalam The Life of James Clerk Maxwell , hlm. 143):
ilmu Logika yang sebenarnya adalah fasih saat ini hanya dengan hal-hal yang pasti, tidak mungkin, atau sepenuhnya diragukan, tidak ada yang (untungnya) harus kita pertimbangkan. Oleh karena itu Logika yang benar untuk dunia ini adalah Kalkulus Probabilitas, yang memperhitungkan besarnya probabilitas (yang, atau yang seharusnya ada dalam pikiran manusia yang masuk akal).
Jadi kita dapat mengatakan:
- Dalam statistik kami "memusatkan perhatian kami pada sejumlah kecil kelompok buatan" atau jumlah; kami membuat semacam katalogisasi atau sensus.
- Kemungkinan kami menghitung ketidakpastian kami tentang beberapa peristiwa atau jumlah.
Keduanya berbeda, dan kita bisa melakukan yang satu tanpa yang lain.
Misalnya, jika kami membuat sensus lengkap dari seluruh populasi suatu negara dan menghitung jumlah pasti orang yang termasuk dalam kelompok tertentu seperti usia, jenis kelamin, dan sebagainya, kami sedang melakukan statistik. Tidak ada ketidakpastian - probabilitas - yang terlibat, karena angka yang kami temukan tepat dan diketahui.
Di sisi lain, bayangkan seseorang lewat di depan kita di jalan, dan kita bertanya-tanya tentang umur mereka. Dalam hal ini kami tidak pasti dan kami menggunakan probabilitas, tetapi tidak ada statistik yang terlibat, karena kami tidak membuat semacam sensus atau katalog.
Namun keduanya juga bisa terjadi bersamaan. Jika kita tidak dapat membuat sensus lengkap dari suatu populasi, kita harus menebak berapa banyak orang dalam kelompok gender usia tertentu. Karenanya kita menggunakan probabilitas saat melakukan statistik. Begitu juga sebaliknya, kita dapat mempertimbangkan data statistik yang tepat tentang usia orang, dan dari data tersebut cobalah membuat tebakan yang lebih baik tentang orang yang lewat di depan kita. Karenanya kami menggunakan statistik sambil memutuskan suatu kemungkinan.