Statistik deskriptif apa yang bukan ukuran efek?

Wikipedia mengatakan

ukuran efek adalah ukuran kekuatan suatu fenomena atau perkiraan berbasis sampel dari kuantitas itu. Ukuran efek yang dihitung dari data adalah statistik deskriptif yang menyampaikan perkiraan besarnya suatu hubungan tanpa membuat pernyataan tentang apakah hubungan nyata dalam data mencerminkan hubungan yang benar dalam populasi.

Untuk memahaminya dengan lebih baik, saya bertanya-tanya statistik deskriptif apa yang bukan ukuran efek, kecuali grafik dan plot.

effect-size

— Tim
sumber

Grafik dan plot sebenarnya bisa menjadi hebat untuk mengukur ukuran efek dengan cara yang lebih intuitif daripada ukuran ukuran efek. Jika Anda benar-benar melihat tumpang tindih antara dua kelompok pada beberapa ukuran (yang kira-kira sama dengan d yang lebih kecil ), mungkin lebih mudah untuk menyadari bahwa perbedaan yang signifikan tidak berarti bahwa anggota satu kelompok semua memiliki skor lebih rendah daripada anggota kelompok lainnya. , dll.

— Gala

Jawaban:

Ukuran efek

Ukuran efek terstandarisasi umum biasanya mengukur jumlah atau tingkat hubungan atau efek. Ukuran ukuran efek paling umum mungkin adalah cohen d, Pearson's r, dan rasio odds (terutama untuk prediktor biner).
Ukuran ukuran efek yang kurang umum:Yang mengatakan, Anda dapat memiliki ukuran ukuran efek standar dan tidak standar. Statistik apa pun yang mengkomunikasikan tingkat hubungan dan tidak terkontaminasi secara khusus oleh ukuran sampel mungkin merupakan ukuran ukuran efek. Dengan demikian, koefisien Beta, R-square, kovarian, perbedaan rata-rata baku antara kelompok, dan seterusnya semua menangkap tingkat efek. Yang mengatakan, saya menemukan bahwa beberapa peneliti menerapkan ukuran ukuran efek agak membabi buta dan lupa bahwa tujuan yang lebih luas adalah untuk memberi pembaca rasa tingkat efek. Dan dengan demikian, mereka sering tidak menyadari bahwa ukuran seperti perbedaan rata-rata atau koefisien regresi mentah dalam beberapa hal merupakan ukuran ukuran efek. Contoh lain penggunaan buta ukuran efek melibatkan penggunaan ukuran efek ukuran yang tidak memiliki interpretasi intuitif, tetapi telah direkomendasikan oleh beberapa buku teks.

Bukan ukuran efek:

Kebanyakan statistik pengujian bukan ukuran efek. Misal, uji Chi-square, uji-t, uji-z, uji-F. Mereka menjadi lebih besar baik ketika ukuran efek populasi meningkat dan seiring meningkatnya ukuran sampel. Dalam banyak hal, seluruh bahasa ukuran efek telah ditekankan dalam beberapa tahun terakhir karena para peneliti terlalu fokus pada seberapa besar statistik uji mereka daripada seberapa besar ukuran efeknya. Ini sangat penting di mana Anda memiliki ukuran sampel yang besar ketika efek kecil sekalipun bisa signifikan secara statistik.
Kebanyakan statistik univariat bukan ukuran efek. Untuk sebagian besar tujuan, ukuran efek khawatir tentang hubungan antara setidaknya dua variabel. Dengan demikian, mean sampel, standar deviasi, kemiringan, kurtosis, min, maks, dan sebagainya bukanlah ukuran ukuran efek.
Statistik yang tidak berkaitan dengan tingkat hubungan tidak mempengaruhi ukuran ukuran. Sebagai contoh, tes normalitas multivariat, nilai eigen dari sebuah matriks, dan sebagainya umumnya tidak secara langsung ditujukan untuk mengukur efek dalam arti kata yang biasa.

Pertimbangan yang lebih luas

Pertimbangan penskalaan: Utilitas statistik sebagai ukuran ukuran efek sebagian besar berkaitan dengan kemampuannya untuk mengkomunikasikan ukuran efek. Kadang-kadang ini dicapai dengan menggunakan ukuran efek standar yang sudah dikenal (misalnya, cohen d). Di lain waktu, pertimbangan scaling dari variabel dapat menghasilkan interpretasi yang lebih jelas dari ukuran efek. Sebagai contoh, katakanlah saya memiliki studi melihat program pelatihan pada tingkat pendapatan. Saya dapat melaporkan bahwa program pelatihan meningkatkan pendapatan sebesar .2 standar deviasi atau saya dapat mengatakan bahwa program tersebut meningkatkan pendapatan sebesar $ 3.500 dolar AS. Keduanya bermanfaat; keduanya adalah ukuran ukuran efek. Yang pertama adalah standar (cohen d), yang kedua tidak standar (perbedaan rata-rata kelompok mentah).
Ketepatan dalam memperkirakan ukuran efek: Kami sering mengekstraksi perkiraan sampel ukuran ukuran efek (misalnya, cohen d, pearson's r, dll.). Konteks ini dapat menyebabkan kontras pengujian signifikansi dengan ukuran ukuran efek. Meskipun demikian, tujuannya masih harus memperkirakan secara tepat dan tidak bias, ukuran efek populasi. Dari perspektif frequentist, interval kepercayaan di sekitar ukuran efek memberikan perkiraan presisi. Dari perspektif Bayesian, ada kepadatan posterior pada ukuran efek. Dalam banyak kasus, perawatan harus diambil untuk memastikan bahwa Anda menggunakan ukuran ukuran efek yang tidak bias.

— Jeromy Anglim
sumber

(+1) Jawaban yang bagus.

— chl

Poin ketiga dan terakhir mungkin menjelaskan dari mana penulis artikel Wikipedia berasal. Mengingat penekanan pada psikologi, saya pikir intinya tidak begitu banyak untuk membandingkan ukuran efek dengan statistik deskriptif lainnya tetapi dengan statistik uji dan nilai-p (yaitu statistik inferensial) dan untuk menekankan bahwa ukuran ukuran efek tidak mengatakan apa-apa tentang variabilitas sampel.

— Gala

Terima kasih banyak atas jawaban Anda yang baik. Saya punya pertanyaan: apakah maksud Anda interval kepercayaan tidak dapat digunakan sebagai ukuran ukuran efek, karena secara langsung terkait dengan ukuran sampel? (dengan interval kepercayaan, maksud saya nilai yang ditambahkan atau dikurangkan dari prevalensi, rata-rata, dll. - bukan batas atas dan bawah dari CI).

— Vic

@Vic Anda dapat memiliki interval kepercayaan pada ukuran ukuran efek, tetapi interval kepercayaan itu sendiri bukan ukuran efek.

— Jeromy Anglim

Terima kasih banyak, Jeromy sayang. Selama bertahun-tahun saya salah. :)

— Vic

Pertama, ukuran efek dapat digunakan secara inferensial maupun deskriptif. r dan OR semua ukuran efek dan tentu saja semua digunakan dalam statistik inferensial.

Statistik univariat biasanya tidak mempengaruhi ukuran, meskipun bisa saja. Misalnya, jika Anda membandingkan usia pria dan wanita yang menikah satu sama lain, usia rata-rata pria bukanlah ukuran efek (maka perbedaan rata-rata akan menjadi satu ukuran efek). Tetapi jika Anda ingin melihat apakah rata-rata sesuatu adalah 0, maka rata-rata akan menjadi ukuran efek.

Jika ini mengukur efek, ini adalah ukuran efek!

— Peter Flom - Pasang kembali Monica
sumber

Saya kira itu benar @Peter, tetapi ukuran efek adalah istilah yang lebih sempit didefinisikan oleh Cohen: (Mean1-Mean2) / PooledSD. Ini kedengarannya seperti perbedaan yang signifikan, atau hanya signifikan secara statistik - penggunaan kata-kata umum untuk mendefinisikan istilah statistik.

— doug.numbers

Di mana Cohen mendefinisikannya seperti itu? Jika Anda maksud bukunya tentang Analisis Daya, saya pikir dia menggunakannya sebagai semacam standar untuk mengkonversi ukuran efek lainnya. Tetapi setiap tabel analisis kekuatan dalam buku itu (dan ada BANYAK) menggunakan beberapa ukuran efek (dan tidak semua menggunakan yang)

— Peter Flom - Reinstate Monica

Cohen d selalu cara saya memahaminya. Mirip seperti yang dijelaskan en.wikipedia.org/wiki/Effect_size . Tetapi Anda benar sekali, ada banyak metode yang digambarkan sebagai efek ukuran.

— doug.numbers

Uji-t dan uji-z bukan ukuran efek. ukuran efek yang sama akan menghasilkan nilai t dan z yang berbeda secara substansial untuk ukuran sampel yang berbeda.

— Jeromy Anglim

@JeromyAnglim benar; +1. Saya mengedit jawaban saya

— Peter Flom - Reinstate Monica