Statistik dan Big Data panel-data

1

Data Panel: Pooled OLS vs RE vs. FE Effects

Kami memiliki beberapa diskusi tentang kegunaan Pooled-OLS dan RE Estimator dibandingkan dengan FE. Sejauh yang saya tahu, estimasi Pooled OLS hanyalah teknik OLS yang dijalankan pada data Panel. Oleh karena itu semua efek spesifik indivudual sepenuhnya diabaikan. Karena itu banyak asumsi dasar seperti ortogonalitas dari istilah kesalahan dilanggar. RE memecahkan …

8 panel-data random-effects-model fixed-effects-model pooling

4

Negara Berkembang Regresi: PDB-Pertumbuhan atau PDB

Untuk tesis master saya, pada dasarnya saya ingin mencari tahu, mengapa negara-negara berkembang stagnan. Di samping aspek teoretis, saya juga ingin membuat regresi. Saya ingin mengurangi PDB atau pertumbuhan PDB sebagai variabel dependen pada banyak variabel independen, seperti masa jabatan kepala negara, harapan hidup, pembatasan jam kerja, melek huruf orang …

8 regression econometrics panel-data macroeconomics

3

Temukan distribusi dan ubah ke distribusi normal

Saya memiliki data yang menggambarkan seberapa sering suatu peristiwa berlangsung selama satu jam ("angka per jam", nph) dan berapa lama acara berlangsung ("durasi dalam detik per jam", dph). Ini adalah data asli: nph <- c(2.50000000003638, 3.78947368414551, 1.51456310682008, 5.84686774940732, 4.58823529414907, 5.59999999993481, 5.06666666666667, 11.6470588233699, 1.99999999998209, NA, 4.46153846149851, 18, 1.05882352939726, 9.21739130425452, 27.8399999994814, 15.3750000002237, …

8 normal-distribution data-transformation logistic generalized-linear-model ridge-regression t-test wilcoxon-signed-rank paired-data naive-bayes distributions logistic goodness-of-fit time-series eviews ecm panel-data reliability psychometrics validity cronbachs-alpha self-study random-variable expected-value median regression self-study multiple-regression linear-model forecasting prediction-interval normal-distribution excel bayesian multivariate-analysis modeling predictive-models canonical-correlation rbm time-series machine-learning neural-networks fishers-exact factorisation-theorem svm prediction linear reinforcement-learning cdf probability-inequalities ecdf time-series kalman-filter state-space-models dynamic-regression index-decomposition sampling stratification cluster-sample survey-sampling distributions maximum-likelihood gamma-distribution

1

Bagaimana cara menggunakan tes Hausman untuk diskriminasi gender?

Saya mencoba memperkirakan kesenjangan upah gender untuk pekerja kantoran pria dan wanita di sebuah perusahaan besar Swedia untuk menguji apakah ada diskriminasi gender. Tes Hausman menolak nol bahwa efek tetap individu adalah acak dan karena itu saya tidak dapat mengandalkan OLS gabungan atau efek acak. Masalahnya adalah bahwa saya tidak …

8 econometrics panel-data random-effects-model fixed-effects-model hausman

2

Skor Kecocokan Pencocokan dengan perawatan yang bervariasi waktu

Prosedur pencocokan skor kecenderungan dasar bekerja dengan data penampang (yaitu dikumpulkan pada titik waktu tertentu). Perintah psmatch2 populer menggunakan variabel dummy yang menunjukkan bahwa pengamatan milik kelompok perlakuan atau kontrol. Namun, dalam dataset saya, fungsi indikator ini beragam waktu. Data terlihat sebagai berikut: Saya mengidentifikasi individu dan melacak mereka selama …

8 stata panel-data propensity-scores

1

Spesifikasi data panel

Saya mencoba mencari tahu spesifikasi terbaik untuk dataset saya. Saya mencoba menyelidiki efektivitas zona ekonomi khusus di Polandia dalam arti pertumbuhan ekonomi dalam tiga model panel data yang sama untuk variabel yang dijelaskan: a) tingkat pengangguran terdaftar b) PDB per kapita c) pembentukan modal tetap bruto per kapita . Data …

8 stata econometrics panel-data fixed-effects-model

2

Mengapa model statistik cocok jika diberi set data yang sangat besar?

Proyek saya saat ini mungkin mengharuskan saya untuk membuat model untuk memprediksi perilaku sekelompok orang tertentu. set data pelatihan hanya berisi 6 variabel (id hanya untuk tujuan identifikasi): id, age, income, gender, job category, monthly spend di mana monthly spendadalah variabel respon. Tetapi dataset pelatihan berisi sekitar 3 juta baris, …

8 modeling large-data overfitting clustering algorithms error spatial r regression predictive-models linear-model average measurement-error weighted-mean error-propagation python standard-error weighted-regression hypothesis-testing time-series machine-learning self-study arima regression correlation anova statistical-significance excel r regression distributions statistical-significance contingency-tables regression optimization measurement-error loss-functions image-processing java panel-data probability conditional-probability r lme4-nlme model-comparison time-series probability probability conditional-probability logistic multiple-regression model-selection r regression model-based-clustering svm feature-selection feature-construction time-series forecasting stationarity r distributions bootstrap r distributions estimation maximum-likelihood garch references probability conditional-probability regression logistic regression-coefficients model-comparison confidence-interval r regression r generalized-linear-model outliers robust regression classification categorical-data r association-rules machine-learning distributions posterior likelihood r hypothesis-testing normality-assumption missing-data convergence expectation-maximization regression self-study categorical-data regression simulation regression self-study self-study gamma-distribution modeling microarray synthetic-data

1

Memvisualisasikan data longitudinal dengan hasil biner

Untuk data longitudinal dengan hasil numerik, saya bisa menggunakan plot spageti untuk memvisualisasikan data. Misalnya sesuatu seperti ini (diambil dari situs Statistik UCLA): tolerance<-read.table("http://www.ats.ucla.edu/stat/r/faq/tolpp.csv",sep=",", header=T) head(tolerance, n=10) interaction.plot(tolerance$time, tolerance$id, tolerance$tolerance, xlab="time", ylab="Tolerance", legend=F) Tetapi bagaimana jika hasil saya adalah biner 0 atau 1? Misalnya, dalam data "ohio" di R, variabel …

8 data-visualization repeated-measures binary-data panel-data

3

Uji akar unit untuk data panel di R

Saya memiliki plmpaket dan ingin menjalankan tes unit root pada beberapa variabel. Saya mendapatkan kesalahan berikut: > purtest(data$tot.emp) Error in data.frame(baldwin = c(59870, 61259, 60397, 58919, 57856, 57227, : arguments imply differing number of rows: 14, 19, 11, 12, 1, 20, 18, 10, 13 Saya berasumsi bahwa saya mendapatkan kesalahan …

8 r panel-data unit-root

1

Memperbaiki kesalahan standar ketika variabel independen terkait otomatis

Saya punya pertanyaan tentang bagaimana cara memperbaiki kesalahan standar ketika variabel independen memiliki korelasi. Dalam pengaturan deret waktu yang sederhana, kita dapat menggunakan matriks kovarians Newey-West dengan banyak lag dan itu akan menangani masalah korelasi dalam residu. Apa yang dilakukan seseorang dalam pengaturan data panel? Bayangkan situasi di mana Anda …

8 clustering standard-error panel-data

3

Model longitudinal dalam R dan WINBUGS atau JAGS

Saya sudah mencoba menggunakan R agar sesuai dengan beberapa model longitudinal, kebanyakan melalui lmerdan nlmepaket. Namun, tampaknya banyak model standar yang kurang, seperti model antedependensi atau model analitik faktor untuk matriks kovarian. Model-model ini sudah tersedia di SAS. Adakah yang akan merekomendasikan paket lain untuk pekerjaan di R? Saya tidak …

8 r jags panel-data

1

Dapatkah lereng dalam regresi linier digunakan sebagai variabel independen atau dependen dalam model regresi lainnya?

Saya memiliki 100 pasien dan setiap pasien memiliki 10 pengukuran kreatinin serum longitudinal. Perkiraan laju filtrasi glomerulus (eGFR) dihitung dari formula MDRD yang terdiri dari jenis kelamin, usia, dan kreatinin serum. eGFR adalah variabel dependen dan waktu adalah variabel independen dalam regresi linier untuk setiap pasien. Apakah regresi linier melanggar …

8 regression mixed-model repeated-measures panel-data

Pertanyaan yang diberi tag «panel-data»