Jawaban:
Ini adalah dua fenomena yang berbeda:
-statistik
Memegang semua yang lain konstan, jika meningkatkan nilai- harus meningkat sebagai masalah aritmatika sederhana. Pertimbangkan fraksi dalam penyebut, , jika semakin besar, maka akan semakin besar juga (walaupun lebih lambat), karena akar kuadrat adalah transformasi monotonik. Karena akar kuadrat dari adalah penyebut dari fraksi itu, karena semakin besar, fraksi akan semakin kecil. Namun, fraksi ini, pada gilirannya, adalah penyebut. Akibatnya, ketika penyebutnya semakin kecil, fraksi kedua semakin besar. Dengan demikian, nilai- akan semakin besar karena semakin besar. (Dengan asumsi, sekali lagi, itu dan tetap sama.)
Apa artinya ini secara konseptual? Nah, semakin banyak data yang kita miliki / semakin dekat ukuran sampel dengan ukuran populasi, semakin sedikit rata-rata sampel akan cenderung bervariasi dari rata-rata populasi karena kesalahan pengambilan sampel (lih., Hukum jumlah besar ). Dengan populasi terbatas yang kecil, ini mudah dilihat, tetapi meskipun mungkin tidak intuitif, hal yang sama berlaku jika populasi tidak terbatas. Karena mean sampel () seharusnya tidak berfluktuasi sangat jauh dari nilai referensi (nol), kita dapat lebih yakin bahwa jarak rata-rata sampel yang diamati dari nol adalah karena nilai nol sebenarnya bukan rata-rata populasi dari mana sampel diambil. . Lebih tepatnya, semakin kecil kemungkinan untuk menemukan sampel rata-rata yang jauh atau lebih jauh dari nilai nol, jika nilai nol benar-benar merupakan rata-rata populasi dari mana sampel diambil.
distribusi
Ketika Anda melihat tabel- (katakanlah, di belakang buku statistik), apa yang sebenarnya Anda lihat adalah tabel nilai kritis . Artinya, nilai yang statistik yang diamati harus lebih besar daripada agar tes menjadi 'signifikan' pada alpha itu. (Biasanya, ini terdaftar untuk sejumlah kecil kemungkinan : .) Saya menduga jika Anda perhatikan tabel-tabel tersebut, mereka sebenarnya berpikir dalam hal derajat kebebasan yang terkait dengan statistik yang bersangkutan. Perhatikan bahwa derajat kebebasan untuk statistik- adalah fungsi dari , menjadiuntuk dua kelompok -test, atau untuk satu kelompok -test (contoh Anda tampaknya adalah yang terakhir). Ini berkaitan dengan fakta bahwa distribusi akan menyatu dengan distribusi normal standar ketika derajat kebebasan mendekati tak terhingga.
Cara untuk memahami ini secara konseptual adalah dengan memikirkan mengapa Anda perlu menggunakan distribusi- sejak awal. Anda tahu nilai rata-rata referensi yang Anda minati dan sampel yang Anda amati. Jika populasi dari mana sampel diambil berdistribusi normal (yang orang sering berasumsi secara implisit), maka kita tahu bahwa distribusi sampling dari mean akan terdistribusi secara normal juga. Jadi mengapa repot-repot dengan distribusi- ? Jawabannya adalah yang tidak yakin apa standar deviasi populasi. (Jika kami yakin, kami benar-benar akan menggunakan distribusi normal, yaitu, -test bukan -test.) Jadi kami menggunakan standar deviasi sampel kami, , sebagai proxy untuk nilai populasi yang tidak diketahui. Namun, semakin banyak data yang kita miliki, semakin yakin kami dapat bahwa adalah sebenarnya sekitar nilai yang tepat. Sebagai mendekati ukuran populasi (dan / atau tak terhingga), kita dapat yakin bahwa sebenarnya adalah persis nilai yang tepat. Dengan demikian, distribusi- menjadi distribusi normal .
Nah, jawaban singkatnya adalah itulah yang tidak masuk hitungan. Jawaban panjangnya adalah mengerjakan matematika . Sebagai gantinya saya akan mencoba untuk mengulangi penjelasan gung bahwa ini adalah dua hal yang berbeda (meskipun terkait)
Anda telah mengumpulkan sampel yang biasanya didistribusikan dengan varian tidak dikenal dan ingin tahu apakah rata-ratanya berbeda dari beberapa nilai yang ditentukan . Cara Anda melakukan ini adalah menghitung nilai yang mewakili seberapa "berbeda" pengamatan Anda dari asumsi bahwa . Dengan demikian rumus untuk -statistic Anda disajikan. Mungkin cara berpikir yang paling intuitif tentang mengapa ini meningkat dengan adalah bahwa Anda memiliki lebih banyak "kepercayaan diri" bahwa segala sesuatu berbeda ketika Anda memiliki lebih banyak sampel.
Selanjutnya, nilai ini mengikuti distribusi- dengan derajat kebebasan. Cara berpikir tentang ini adalah bahwa distribusi- sedikit berbeda tergantung pada ukuran sampel Anda. Anda dapat melihat plot distribusi ini dengan 2, 3, 5, dan 20 df di bawah ini. Anda akan melihat bahwa df yang lebih tinggi memiliki massa lebih banyak di tengah dan kurang di ekor distribusi (saya tidak memiliki alasan intuitif mengapa distribusi tersebut berperilaku seperti ini, maaf). Kritis-nilai adalah x-lokasi di mana area di bawah kurva sama dengan nilai yang agak sewenang-wenang yang Anda pilih (tradisional 0,05). Nilai-nilai ini ditandai pada grafik sebagai titik. Jadi untuk kurva hijau (df = 5), area di bawah kurva di sebelah kiri titik hijau kiri = 0,025, dan area di bawah kurva di sebelah kanan dari titik hijau kanan = 0,025, dengan total 0,05.
Inilah sebabnya mengapa nilai kritis menurun dengan meningkatnya derajat kebebasan - karena jika meningkat, nilai kritis harus mendekati nol untuk menjaga area yang sama di bawah kurva. Dan seperti yang disebutkan gung, ketika df pergi ke , kurva dan nilai kritis akan mendekati distribusi normal standar.
Jadi sekarang Anda memiliki nilai kritis dan statistik Anda, dan dapat melakukan uji- . Jika statistik- Anda lebih besar dari nilai kritis, Anda kemudian dapat membuat pernyataan bahwa jika benar-benar benar, maka Anda akan mengamati sampel Anda kurang dari 5% (atau persentase sewenang-wenang apa pun yang Anda pilih untuk menghitung nilai kritis untuk) waktu.
Mengapa kita menghitung nilai khusus ini dari banyak nilai arbitrer yang bisa kita hitung? Nah, inilah yang jatuh dari perhitungan uji rasio kemungkinan .
Jika Anda tahu varians sampel sebelumnya, -statistic (mengikuti distribusi normal) yang disebutkan oleh gung akan jatuh dari perhitungan ini sebagai gantinya, dan Anda akan melakukan -test Sekali lagi, inilah yang jatuh dari math Hasil bagus pertama dari google: http://math.arizona.edu/~jwatkins/ttest.pdf Ternyata uji-t bekerja bahkan jika asumsi itu tidak terpenuhi, tetapi itu adalah penyimpangan