(Sangat) cerita pendek
Singkatnya, dalam beberapa hal, statistik seperti bidang teknis lainnya: Tidak ada jalur cepat .
Cerita panjang
Program gelar sarjana dalam statistik relatif jarang di AS. Salah satu alasan saya percaya ini benar adalah bahwa cukup sulit untuk mengemas semua yang diperlukan untuk belajar statistik dengan baik ke dalam kurikulum sarjana. Hal ini berlaku terutama di universitas yang memiliki persyaratan pendidikan umum yang signifikan.
Mengembangkan keterampilan yang diperlukan (matematika, komputasi, dan intuitif) membutuhkan banyak upaya dan waktu. Statistik dapat mulai dipahami pada tingkat "operasional" yang cukup layak begitu siswa telah menguasai kalkulus dan sejumlah aljabar linier dan matriks yang layak. Namun, setiap ahli statistik yang berlaku tahu bahwa cukup mudah untuk menemukan diri sendiri di wilayah yang tidak sesuai dengan pendekatan cookie-cutter atau pendekatan berbasis resep untuk statistik. Untuk benar-benar memahami apa yang terjadi di bawah permukaan diperlukan sebagai prasyaratmatematika dan, di dunia saat ini, kematangan komputasi yang benar-benar dapat dicapai pada tahun-tahun berikutnya pelatihan sarjana. Ini adalah salah satu alasan bahwa pelatihan statistik yang benar sebagian besar dimulai pada tingkat MS di AS (India, dengan ISI khusus mereka adalah cerita yang sedikit berbeda. Argumen serupa mungkin dibuat untuk beberapa pendidikan berbasis Kanada. Saya tidak cukup akrab dengan Statistik pendidikan sarjana berbasis di Eropa atau Rusia untuk memiliki pendapat yang terinformasi.)
Hampir semua pekerjaan (menarik) akan membutuhkan pendidikan tingkat MS dan pekerjaan yang benar - benar menarik (menurut saya) pada dasarnya membutuhkan pendidikan tingkat doktor.
Melihat Anda memiliki gelar doktor dalam matematika, meskipun kami tidak tahu di bidang apa, berikut adalah saran saya untuk sesuatu yang lebih dekat dengan pendidikan tingkat MS. Saya menyertakan beberapa komentar kurung untuk menjelaskan pilihan.
- D. Huff, Cara Berbohong dengan Statistik . (Sangat cepat, mudah dibaca. Menunjukkan banyak gagasan konseptual dan jebakan, khususnya, dalam menyajikan statistik kepada orang awam.)
- Mood, Graybill, dan Boes, Pengantar Teori Statistik , edisi ke-3, 1974. ( Pengantar MS-level untuk statistik teoretis. Anda akan belajar tentang distribusi sampling, estimasi titik, dan pengujian hipotesis dalam kerangka kerja klasik yang sering terjadi. My pendapat adalah bahwa ini umumnya lebih baik, dan sedikit lebih maju, daripada rekan-rekan modern seperti Casella & Berger atau Rice.)
- Seber & Lee, Analisis Regresi Linier , edisi ke-2. (Menjabarkan teori di balik estimasi titik dan pengujian hipotesis untuk model linier, yang mungkin merupakan topik paling penting untuk dipahami dalam statistik terapan. Karena Anda mungkin memiliki latar belakang aljabar linier yang baik, Anda harus segera dapat memahami apa yang sedang terjadi secara geometris. , yang menyediakan banyak intuisi. Juga memiliki informasi yang baik terkait dengan masalah penilaian dalam pemilihan model, penyimpangan dari asumsi, prediksi, dan versi kuat dari model linier.)
- Hastie, Tibshirani, dan Friedman, Elemen Pembelajaran Statistik , edisi ke-2, 2009. (Buku ini memiliki perasaan yang jauh lebih terapan daripada yang terakhir dan secara luas mencakup banyak topik pembelajaran mesin modern. Kontribusi utama di sini adalah dalam menyediakan interpretasi statistik dari banyak ide pembelajaran mesin, yang terbayar terutama dalam mengukur ketidakpastian dalam model-model semacam itu. Ini adalah sesuatu yang cenderung tidak dibahas dalam buku-buku pembelajaran mesin yang khas. Secara hukum tersedia secara gratis di sini .)
- A. Agresti, Analisis Data Kategorikal , edisi ke-2. (Presentasi yang baik tentang bagaimana menangani data diskrit dalam kerangka statistik. Teori yang baik dan contoh-contoh praktis yang baik. Mungkin dalam sisi tradisional dalam beberapa hal.)
- Boyd & Vandenberghe, Optimasi Cembung . (Banyak estimasi statistik modern yang paling populer dan masalah pengujian hipotesis dapat dirumuskan sebagai masalah optimisasi cembung. Ini juga berlaku untuk berbagai teknik pembelajaran mesin, misalnya, SVM. Memiliki pemahaman yang lebih luas dan kemampuan untuk mengenali masalah seperti program cembung. cukup berharga, saya pikir. Secara hukum tersedia secara gratis di sini .)
- Efron & Tibshirani, Pengantar Bootstrap . (Anda setidaknya harus terbiasa dengan bootstrap dan teknik terkait. Untuk buku teks, ini cepat dan mudah dibaca.)
- J. Liu, Strategi Monte Carlo dalam Komputasi Ilmiah atau P. Glasserman, Metode Monte Carlo dalam Rekayasa Keuangan . (Yang terakhir terdengar sangat diarahkan ke area aplikasi tertentu, tapi saya pikir itu akan memberikan gambaran yang baik dan contoh-contoh praktis dari semua teknik yang paling penting. Aplikasi rekayasa keuangan telah mendorong cukup banyak penelitian Monte Carlo selama dekade terakhir atau lebih .)
- E. Tufte, Tampilan Visual Informasi Kuantitatif . (Visualisasi dan penyajian data yang baik [sangat] diremehkan, bahkan oleh para ahli statistik.)
- J. Tukey, Analisis Data Eksplorasi . (Standar. Oldie, tapi selamat. Beberapa mungkin mengatakan sudah ketinggalan zaman, tetapi masih layak untuk dilihat.)
Komplemen
Berikut adalah beberapa buku lain, sebagian besar yang sedikit lebih maju, teoretis dan / atau tambahan, yang sangat membantu.
- FA Graybill, Teori dan Penerapan Model Linear . (Kuno pengaturan huruf yang mengerikan, tetapi mencakup semua bidang yang sama dari Seber & Lee, dan banyak lagi. Saya katakan kuno karena perawatan yang lebih modern mungkin cenderung menggunakan SVD untuk menyatukan dan menyederhanakan banyak teknik dan bukti.)
- FA Graybill, Matriks dengan Aplikasi dalam Statistik . (Teks pendamping untuk yang di atas. Banyak hasil aljabar matriks yang baik berguna untuk statistik di sini. Referensi meja yang hebat.)
- Devroye, Gyorfi, dan Lugosi, Teori Probabilistik Pengenalan Pola . (Teks yang keras dan teoritis tentang mengukur kinerja dalam masalah klasifikasi.)
- Brockwell & Davis, Seri Waktu: Teori dan Metode . (Analisis deret waktu klasik. Perlakuan teoretis. Untuk yang lebih banyak diterapkan, teks Box, Jenkins & Reinsel atau Ruey Tsay layak.)
- Motwani dan Raghavan, Algoritma Acak . (Metode dan analisis probabilistik untuk algoritma komputasi.)
- D. Williams, Probabilitas dan Martingales dan / atau R. Durrett, Probabilitas: Teori dan Contoh . (Jika Anda pernah melihat teori ukuran, katakanlah, pada level DL Cohn, tapi mungkin bukan teori probabilitas. Keduanya baik untuk mempercepat dengan cepat jika Anda sudah tahu teori ukuran.)
- F. Harrell, Strategi Pemodelan Regresi . (Tidak sebagus Elemen Pembelajaran Statistik [ESL], tetapi memiliki hal-hal yang berbeda, dan menarik, mencakup banyak hal. Meliputi lebih banyak topik statistik terapan "tradisional" daripada ESL dan tentu saja layak untuk diketahui.)
Teks Lebih Lanjut (Tingkat Doktor)
Lehmann dan Casella, Teori Estimasi Titik . (Perlakuan tingkat estimasi poin PhD. Bagian dari tantangan buku ini adalah membacanya dan mencari tahu apa yang salah ketik dan apa yang tidak. Ketika Anda melihat diri Anda mengenali mereka dengan cepat, Anda akan tahu Anda mengerti. Ada banyak latihan dari jenis ini di sana, terutama jika Anda menyelam ke masalah.)
Lehmann dan Romano, Menguji Hipotesis Statistik . (Pengobatan tingkat hipotesis pengujian PhD. Tidak banyak kesalahan ketik seperti TPE di atas.)
A. van der Vaart, Statistik Asimptotik . (Sebuah buku yang indah tentang teori statistik asimptotik dengan petunjuk yang baik tentang bidang aplikasi. Namun bukan buku terapan. Satu-satunya pertanda saya adalah bahwa beberapa notasi yang agak aneh digunakan dan detail kadang-kadang disikat di bawah karpet.)