Pertama-tama mari kita mendefinisikan objek berikut: Dalam model statistik M yang digunakan untuk memodelkan Y sebagai fungsi dari X, Ada p parameter dilambangkan dengan vektor θ. Parameter ini diperbolehkan bervariasi di dalam ruang parameterΘ⊂Rp. Kami tidak tertarik pada estimasi semua parameter ini, tetapi hanya sebagian saja, katakan sajaq≤p dari parameter yang kami tunjukkan θ0 dan itu bervariasi dalam ruang parameter Θ0⊂Rq. Dalam model kamiM variabel X dan parameternya θ sekarang akan dipetakan seperti untuk menjelaskan Y. Pemetaan ini didefinisikan olehM dan parameternya.
Dalam pengaturan ini, pengidentifikasian mengatakan sesuatu tentang Kesetaraan Observasional . Secara khusus, jika parameterθ0 dapat diidentifikasi wrt M maka itu akan menahannya ∄θ1∈Θ0:θ1≠θ0,M(θ0)=M(θ1). Dengan kata lain, tidak ada vektor parameter yang berbedaθ1 yang akan menginduksi proses menghasilkan data yang sama, mengingat spesifikasi model kami M. Untuk membuat konsep-konsep ini lebih masuk akal, saya memberikan dua contoh.
Contoh 1 : Tentukan untukθ=(a,b); X∼N(μ,σ2In);ε∼N(0,σ2eIn) model statistik sederhana M:
Y=a+Xb+ε
dan anggap itu
(a,b)∈R2 (begitu
Θ=R2). Jelas bahwa apakah
θ0=(a,b) atau
θ0=a, itu akan selalu berlaku
θ0 dapat diidentifikasi: Proses menghasilkan
Y dari
X mempunyai sebuah
1:1 hubungan dengan parameter
a dan
b. Pemasangan
(a,b), tidak mungkin menemukan tuple kedua di
R menggambarkan Proses Pembuatan Data yang sama.
Contoh 2 : Tentukan untukθ=(a,b,c); X∼N(μ,σ2In);ε∼N(0,σ2eIn) model statistik yang lebih rumit M′:
Y=a+X(bc)+ε
dan anggap itu
(a,b)∈R2 dan
c∈R∖{0} (begitu
Θ=R3∖{(l,m,0)|(l,m)∈R2}). Sementara untuk
θ0, ini akan menjadi model statistik yang dapat diidentifikasi, ini tidak berlaku jika seseorang memasukkan parameter lain (yaitu,
b atau
c). Mengapa? Karena untuk setiap pasangan
(b,c), ada banyak pasangan lain yang tak terhingga dalam set
B:={(x,y)|(x/y)=(b/c),(x,y)∈R2}. Solusi yang jelas untuk masalah dalam hal ini adalah memperkenalkan parameter baru
d=b/cmengganti fraksi untuk mengidentifikasi model. Namun, orang mungkin tertarik
b dan
csebagai parameter yang terpisah untuk alasan teoretis - parameter dapat sesuai dengan parameter yang menarik dalam pengertian teori (ekonomi). (Misalnya,
b bisa menjadi 'kecenderungan untuk mengkonsumsi' dan
cbisa jadi 'kepercayaan diri', dan Anda mungkin ingin memperkirakan dua kuantitas ini dari model regresi Anda. Sayangnya, ini tidak mungkin dilakukan.)