Penting untuk dipahami bahwa satu-satunya masalah di sini adalah mendapatkan parameter ekstrinsik. Intrinsik kamera dapat diukur secara off-line dan ada banyak aplikasi untuk tujuan itu.
Apa itu intrinsik kamera?
Kamera parameter intrinsik biasanya disebut matriks kalibrasi kamera, . Kita bisa menulisK
K=⎡⎣⎢αu00sαv0u0v01⎤⎦⎥
dimana
α v u v f α u = k u f α v = k v f k u k v u vαu dan adalah faktor skala dalam arah koordinat dan , dan sebanding dengan panjang fokus kamera: dan . dan adalah jumlah piksel per satuan jarak dalam arah dan .αvuvfαu=kufαv=kvfkukvuv
disebut titik utama, biasanya koordinat pusat gambar.c=[u0,v0]T
adalah condong, hanya non-nol jika u danadalah non-tegak lurus.suv
Sebuah kamera dikalibrasi saat intrinsik diketahui. Ini dapat dilakukan dengan mudah sehingga tidak mempertimbangkan tujuan dalam visi komputer, tetapi langkah sepele yang off-line.
Apa itu ekstrinsik kamera?
Ekstrinsik Kamera atau Parameter Eksternal adalah matriks 3 × 4 yang sesuai dengan transformasi euclidean dari sistem koordinat dunia ke sistem koordinat kamera. R merupakan 3 × 3 matriks rotasi dan t terjemahan.[R|t]3×4R3×3t
Aplikasi visi komputer fokus pada memperkirakan matriks ini.
[R|t]=⎡⎣⎢R11R21R31R12R22R32R13R23R33TxTyTz⎤⎦⎥
Bagaimana cara saya menghitung homografi dari penanda planar?
Homografi adalah matriks 3 × homogen yang menghubungkan bidang 3D dan proyeksi gambarnya. Jika kita memiliki bidang Z = 0 homografi H yang memetakan titik M = ( X , Y , 0 ) T ke pesawat ini dan titik 2D yang sesuai m di bawah proyeksi P = K [ R | t ] adalah3×3Z=0HM=(X,Y,0)TmP=K[R|t]
m~=K[R1R2R3t]⎡⎣⎢⎢⎢XY01⎤⎦⎥⎥⎥
=K[R1R2t]⎡⎣⎢XY1⎤⎦⎥
H=K[R1R2t]
Untuk menghitung homografi, kita perlu pasangan dunia berpasangan. Jika kami memiliki penanda planar, kami dapat memproses gambarnya untuk mengekstrak fitur dan kemudian mendeteksi fitur-fitur tersebut di layar untuk mendapatkan kecocokan.
Kami hanya perlu 4 pasang untuk menghitung homografi menggunakan Direct Linear Transform.
Jika saya memiliki homografi, bagaimana saya bisa mendapatkan pose kamera?
Homografi dan kamera berpose K [ R | t ] berisi informasi yang sama dan mudah untuk berpindah dari satu ke yang lain. Kolom terakhir dari keduanya adalah vektor terjemahan. Kolom satu H 1 dan dua H 2 dari homografi juga merupakan kolom satu R 1 dan dua R 2 dari matriks pose kamera. Hanya tersisa kolom tiga R 3 dari [ R | t ] , dan karena harus ortogonal, dapat dihitung sebagai produk-silang dari kolom satu dan dua:HK[R|t]H1H2R1R2R3[R|t]
R3=R1⊗R2
Karena redundansi perlu dinormalisasi membaginya dengan, misalnya, elemen [3,4] dari matriks.[R|t]