Bisakah saya menggunakan bootstrap, mengapa atau mengapa tidak?


10

Saat ini saya sedang mengerjakan estimasi biomassa menggunakan citra satelit. Saya akan dengan cepat menentukan latar belakang pertanyaan saya, dan kemudian menjelaskan pertanyaan statistik yang saya kerjakan.

Latar Belakang

Masalah

Saya mencoba memperkirakan biomassa di suatu daerah di Perancis. Tanggapan saya adalah kepadatan volume kayu bakar (dalam ), yang lebih atau kurang sebanding dengan biomassa (tergantung pada kepadatan kayu ...).m3/ha

Variabel independen yang saya miliki adalah indeks vegetasi yang berasal dari pantulan yang diukur pada area ini (satelit yang digunakan dalam penelitian ini adalah MODIS bagi mereka yang mengetahuinya). Indeks-indeks ini misalnya NDVI, EVI, dll. Saya punya peta indeks, dan resolusi peta adalah 250m.

Ada korelasi kuat antara indeks-indeks ini dan volume dalam tipe hutan yang sama (bioma dan iklim). Jadi saya mencoba untuk mengurangi kepadatan volume terhadap indikator-indikator ini (sebenarnya seri waktu mereka) pada plot inventaris di mana saya tahu volumenya.

Inventarisasi hutan

Volume pada plot ini diperkirakan dengan metode pengambilan sampel berikut:

  1. Node inventaris ditempatkan pada kisi-kisi reguler yang meliputi area.
  2. Plot dilampirkan ke setiap node, dan proses inventarisasi (jenis pohon, volume, tinggi kanopi, dll) terjadi pada plot ini. Tentu saja saya hanya tertarik pada plot inventaris dan nilai indeks vegetasi saya adalah nilai pixel yang mengandung plot.
  3. Proses inventaris pada plot adalah sebagai berikut:

    http://i.stack.imgur.com/DeHdC.png

    • Ukur pohon-pohon yang memiliki diameter> 37,5cm dalam lingkaran radius 15m
    • Ukur pohon yang memiliki diameter> 22,5 cm dalam lingkaran radius 9m
    • Ukur pohon-pohon yang memiliki diameter> 7,5cm dalam lingkaran radius 6m

Kepadatan volume kemudian dihitung menggunakan faktor ekspansi.

Untuk setiap plot saya memiliki akses ke data untuk semua pohon yang diukur.

Selain itu, untuk setiap pohon tunggal, saya memiliki ketidakpastian pada volume karena penggunaan persamaan alometrik (katakanlah 10%).

Di mana statistik penting ...

Agar regresi saya lebih akurat, saya perlu setiap perkiraan volume varians / CI dari ukuran ini. Ini tergantung, IMO, pada jumlah pohon sampel dan kepadatan volume yang ditemukan.

Jadi saya punya dua masalah:

  1. Bagaimana cara menghitung fakta bahwa indeks vegetasi saya diukur lebih dari satu piksel 250m?

    Saya dapat berasumsi bahwa kerapatan volume konstan di atas satu piksel, dan bahwa saya mencicipi piksel ini dengan satu plot inventaris.

  2. Bagaimana cara memperkirakan variabilitas kepadatan volume saya?

    Saya pikir saya bisa menggunakan bootstrap pada populasi pohon. Tetapi jumlah pohon saya yang diukur bisa sangat kecil (dari 7 hingga 20 ...). Selain itu, bagaimana saya bisa memperhitungkan fakta bahwa saya mengukur pohon pada lingkaran yang berbeda tergantung pada ukurannya? Dan bagaimana seharusnya variabilitas berubah jika saya melihat seluruh piksel?

Saya juga berpikir bahwa saya dapat menggunakan Simulasi Monte Carlo untuk mensimulasikan hutan, dan kemudian secara acak mencicipi hutan ini dengan plot untuk melihat apa yang sedang terjadi ...

Saya tidak memiliki latar belakang statistik yang kuat, jadi saya sedikit tersesat!

Jawaban:


1

Saya tidak memahami data Anda dengan sangat baik, tetapi saya dapat memberi tahu Anda bahwa alternatif untuk bootstrap multinomial yang berfungsi lebih baik untuk kejadian langka adalah perturbation / wild bootstrap. Perturbasi sangat fleksibel dan sering dapat menangani data non-iid, namun kadang-kadang diperlukan banyak kecakapan untuk memperkirakan cdf dengan benar. Jika Anda berhasil menentukan formula bootstrap dengan benar, Anda akan membuat lebih sedikit asumsi dan cenderung lebih bias daripada metode penghalusan yang disarankan sebelumnya, terutama mengingat dataset jarang Anda, yang dapat membuat estimasi kepadatan tidak stabil.


0

Jika saya harus mendekati masalah ini, saya akan mulai dengan:

  1. melihat peta data sumber
  2. mencoba semacam smoothing 2d di permukaan, coba informasikan dengan AIC
  3. menghitung turunan dari smooth di lokasi dan menghubungkan variasi input ke variasi output menggunakan metode delta
  4. Bandingkan hasil ini dengan beberapa nilai "diketahui" untuk memverifikasi / memvalidasi pendekatan

Tautan yang relevan: http://www.stanford.edu/class/cme308/notes/TaylorAppDeltaMethod.pdf http://www.ingentaconnect.com/content/klu/stco/2010/00000020/00000004/00009140?crawler=true

Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.