Misalkan saya punya variabel suka X
dengan distribusi tidak dikenal. Dalam Mathematica, dengan menggunakan SmoothKernelDensity
fungsi kita dapat memiliki fungsi kerapatan yang diperkirakan. Perkiraan fungsi kerapatan ini dapat digunakan bersama dengan PDF
fungsi untuk menghitung probabilitas fungsi kerapatan dari suatu nilai seperti X
dalam bentuk PDF[density,X]
asumsi bahwa "kerapatan" adalah hasil dari SmoothKernelDensity
. Akan lebih baik jika ada fitur seperti itu di R. Ini adalah cara kerjanya di Mathematica
http://reference.wolfram.com/mathematica/ref/SmoothKernelDistribution.html
Sebagai contoh (berdasarkan fungsi Mathematica):
data = RandomVariate[NormalDistribution[], 100]; #generates 100 values from N(0,1)
density= SmoothKernelDistribution[data]; #estimated density
PDF[density, 2.345] returns 0.0588784
Di sini Anda dapat menemukan informasi lebih lanjut tentang PDF:
http://reference.wolfram.com/mathematica/ref/PDF.html
Saya tahu bahwa saya dapat memplot fungsi kerapatan menggunakan density(X)
dalam R dan dengan menggunakan ecdf(X)
saya dapat memperoleh fungsi distribusi kumulatif empirisnya. Apakah mungkin untuk melakukan hal yang sama dalam R berdasarkan pada apa yang saya jelaskan tentang Mathematica?
Setiap bantuan dan ide sangat dihargai.
ecdf(X)
memberi saya persentil setara 7,5 tetapi bukan itu yang saya cari.
density(x)
memberikan perkiraan pdf, seperti yang telah Anda catat, tetapi kesesuaiannya tergantung pada tujuan yang Anda inginkan memiliki kepadatan. Perhatikan, misalnya, bahwa varians menjadi bias (dalam melakukan konvolusi, Anda menambahkan varians kernel ke varians data, itu sendiri merupakan estimasi yang tidak bias) - pengorbanan varians-varians semacam itu ada di mana-mana. Ada alternatif lain, seperti estimasi kepadatan log-spline, misalnya - tetapi sekali lagi, kesesuaiannya sebagian tergantung pada apa yang ingin Anda lakukan dengannya.