Transformasi untuk mengubah kemiringan tanpa memengaruhi kurtosis?


11

Saya ingin tahu apakah ada transformasi yang mengubah kemiringan variabel acak tanpa mempengaruhi kurtosis. Ini akan analog dengan bagaimana transformasi affine dari RV mempengaruhi rerata dan varians, tetapi tidak condong dan kurtosis (sebagian karena condong dan kurtosis didefinisikan tidak berubah dengan perubahan skala). Apakah ini masalah yang diketahui?


Apakah Anda mengharuskan deviasi standar tetap konstan dengan transformasi ini juga?
russellpierce

tidak, saya berharap tidak akan, tetapi kelebihan kurtosis harus tetap. Saya berharap transformasi itu monoton, dan lebih disukai deterministik.
shabbychef

1
Astaga - celakalah orang yang ingin membuktikan fungsi non-deterministik adalah monoton.
russellpierce

Jawaban:


6

Jawaban saya adalah awal dari peretasan total, tetapi saya tidak mengetahui adanya cara yang mapan untuk melakukan apa yang Anda minta.

Langkah pertama saya adalah menentukan urutan urutan dataset Anda, Anda dapat menemukan posisi proporsional dalam dataset Anda dan kemudian mengubahnya menjadi distribusi normal, metode ini digunakan dalam Reynolds & Hewitt, 1996. Lihat contoh kode R di bawah ini dalam PROCMiracle.

Setelah distribusinya normal, maka masalahnya telah teratasi - masalah menyesuaikan kurtosis tetapi tidak miring. Pencarian google menyarankan bahwa seseorang dapat mengikuti prosedur John & Draper, 1980 untuk menyesuaikan kurtosis tetapi tidak condong - tetapi saya tidak bisa meniru hasil itu.

Upaya saya untuk mengembangkan fungsi penyempitan / penyempitan mentah yang mengambil nilai input (dinormalisasi) dan menambah atau mengurangi nilai dari itu sebanding dengan posisi variabel pada skala normal memang menghasilkan penyesuaian monotonik, tetapi dalam praktiknya cenderung menciptakan distribusi bimodal meskipun memiliki kemiringan dan nilai kurtosis yang diinginkan.

Saya menyadari ini bukan jawaban yang lengkap, tetapi saya pikir ini mungkin memberikan langkah ke arah yang benar.

PROCMiracle <- function(datasource,normalrank="BLOM")
  {
     switch(normalrank,
      "BLOM" = {
                  rmod <- -3/8
                  nmod <- 1/4
                },
      "TUKEY" = {
                  rmod <- -1/3
                  nmod <- 1/3
                },
      "VW" ={
                  rmod <- 0
                  nmod <- 1
            },
      "NONE" = {
                  rmod <- 0
                  nmod <- 0
                }
    )
    print("This may be doing something strange with NA values!  Beware!")
    return(scale(qnorm((rank(datasource)+rmod)/(length(datasource)+nmod))))
  }

Saya telah melakukan sesuatu seperti ini: pangkat, lalu gunakan transformasi g-and-h untuk mendapatkan kurtosis dan kemiringan yang tetap. Namun, teknik ini mengasumsikan saya benar-benar mengetahui kurtosis populasi, yang dapat saya perkirakan, tetapi saya tertarik, secara filosofis, jika ada transformasi yang mempertahankan kurtosis tanpa saya harus tahu apa itu ...
shabbychef

@shabbychef: Oh, baiklah maaf karena tidak menambahkan sesuatu yang baru. Namun, Anda menambahkan sesuatu yang baru, saya belum pernah mendengar formula g-and-h sebelumnya. Apakah Anda memiliki kutipan yang dapat diakses secara bebas yang menyediakannya? Saya menemukan satu kertas dengan tulisannya ( fic.wharton.upenn.edu/fic/papers/02/0225.pdf ) tetapi gagasan itu agak asing bagi saya (khususnya adalah bahwa e ^ Z ^ g atau sesuatu yang lain )? Saya mencobanya seperti ini ... tetapi hasilnya tampak aneh ... a + b * (e ^ g ^ z-1) * (exp ((h * z ^ 2) / 2) / g).
russellpierce

1
@drnexus: Saya tidak ingin bias hasil dengan menyebutkan teknik saya. Saya belajar tentang distribusi g-dan-h dan g-dan-k dari Haynes et. al, dx.doi.org/10.1016/S0378-3758(97)00050-5 , dan Fisher & Klein, econstor.eu/bitstream/10419/29578/1/614055873.pdf
shabbychef

1

Teknik menarik lainnya yang mungkin muncul dalam pikiran, meskipun ini tidak cukup menjawab pertanyaan, adalah untuk mengubah sampel untuk memiliki sampel tetap L-miring dan sampel L-kurtosis (serta mean tetap dan skala-L). Keempat kendala ini linear dalam statistik urutan. Untuk menjaga transformasi monoton pada sampel pengamatan maka akan membutuhkan persamaan . Ini kemudian dapat diajukan sebagai masalah optimasi kuadratik: minimalkann - 1 2nn12norma antara statistik pesanan sampel dan subjek versi yang diubah dengan batasan yang diberikan. Ini adalah semacam pendekatan aneh. Dalam pertanyaan awal, saya mencari sesuatu yang lebih mendasar dan mendasar. Saya juga secara implisit mencari teknik yang dapat diterapkan pada pengamatan individu, terlepas dari memiliki seluruh kohort sampel.


0

Saya lebih suka memodelkan kumpulan data ini menggunakan distribusi leptokurtik daripada menggunakan transformasi data. Saya suka distribusi sinh-arcsinh dari Jones dan Pewsey (2009), Biometrika.

Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.