Permainan koalisi dan nilai Shapley digunakan untuk menilai kontribusi variabel penjelas


1

Saya memiliki masalah yang pada pandangan pertama tampaknya bukan sebagai permainan koalisi, melainkan dapat digambarkan sebagai regresi logistik dengan semua variabel dikotomi: 1 variabel respons Y (Saya akan menyebutnya nanti sebagai fitur / bintang ungu) dan 5 variabel penjelas A, B, C, D dan E (juga biner).

Saya mencoba menyimpulkan variabel penjelas mana yang paling berkontribusi terhadap Y dan lebih disukai entah bagaimana menilai tingkat keparahannya secara kuantitatif (sesuatu seperti prediktor peringkat, pemilihan variabel, dll.) dan saya menemukan kesamaan kuat dengan nilai Shapley.

Ini sangat mirip dengan permainan koalisi, karena sifat kooperatifnya yang kuat, tapi saya tidak yakin apakah saya bisa menggunakannya dalam kasus khusus ini. Masalah utama dengan pendekatan ini dinyatakan paling bawah dalam huruf tebal.

Bisakah Anda melihat situasi di bawah ini dan merekomendasikan beberapa metode bagaimana menggunakan nilai Shapley untuk menyimpulkan yang jelas dan sejauh mana berkontribusi paling besar terhadap respons Y (bintang fitur / violet).

Katakanlah, kita memiliki lima objek berbeda yang dilambangkan sebagai bola berlabel: A, B, C, D, E membuat beberapa himpunan bagian dan fitur khusus menarik. ditandai sebagai bintang ungu. Jika bintang diisi, fitur hadir dalam set tertentu, sedangkan bintang berongga menunjukkan ketidakhadirannya.

enter image description here

Setiap himpunan bagian dari lima objek ini (ada $ 2 ^ 5 - 1 $ kemungkinan jenis himpunan bagian yang kosong seperti itu) dapat muncul berkali-kali, kadang-kadang dengan fitur yang ada dan kadang-kadang tanpanya, seperti yang digambarkan di bawah ini, di mana ada enam contoh set lengkap dan $ \ frac {2} {3} $ dari mereka memiliki fitur.

Kita dapat mengasumsikan (jika diperlukan) selalu ada setidaknya satu instance dari set lengkap dengan Fitur hadir (misalnya yang ditandai dengan amplop merah tebal).

Untuk setiap subset nonempty $ 2 ^ 5 - 1 $ yang mungkin, kami memiliki tiga nilai, mis. untuk (A, C, E):

  • $ F_ {ACE} $ - jumlah semua kemunculan dari himpunan bagian (A, C, E) \ textbf {with} fitur.
  • $ N_ {ACE} $ - jumlah semua kemunculan dari himpunan bagian (A, C, E) \ textbf {tanpa} fitur.
  • $ T_ {ACE} = F_ {ACE} + N_ {ACE} $ - cukup jumlah total semua penampilan subset (A, C, E)

Kardinalitas instance $ T_X $ dari setiap subset jenis $ X $ bisa berbeda, tetapi ada aturan yang sangat jelas dan agak sepele yang       jika $ X \ subset Y $ maka $ T_X \ geq T_Y $. Misalnya, $ (A, C, E) \ subset (A, B, C, D, E) $ dengan demikian $ T_ {ACE} \ geq T_ {ABCDE} $.       Itu karena setiap instance dari himpunan bagian (A, B, C, D, E) pada saat yang sama merupakan instance dari (A, C, E), tetapi untuk penyempitan (A, C, E)       kita dapat memiliki lebih banyak contoh.

Dalam uraian ini saya menggunakan enam contoh untuk setiap jenis subset hanya dengan membaca ruang terbatas untuk gambar dan keenamnya               instance dimaksudkan untuk mencerminkan proporsi keseluruhan antara instance yang memiliki dan kurang fitur.

Di antara semua jenis $ 2 ^ 5 - 1 $ ini, beberapa di antaranya lebih mungkin untuk dimiliki fitur (untuk subset / tipe khusus ini, ada lebih banyak contoh dengan fitur daripada tanpa itu), sedangkan jenis lainnya lebih rentan untuk tidak memilikinya. Silakan lihat dua angka di bawah ini dan nomor-nomor berikut:

enter image description here enter image description here $$ \ frac {F_ {ACE}} {T_ {ACE}} = \ frac {5} {6}, ~~ \ frac {F_ {BD}} {T_ {BD}} = \ frac {1} {6}, ~~ \ frac {F_ {ABCDE}} {T_ {ABCDE}} = \ frac {4} {6} ~ \ text {(situasi gambar pertama)} $$ Properti yang jelas-jelas jelas adalah bahwa dalam model saya rasio $ \ frac {F} {T} $ tidak monoton (tidak ada arah) sehubungan dengan hubungan inklusi.

Dan akhirnya properti paling penting yang saya ingin membuat model saya miliki, adalah semacam interaksi kooperatif antara objek dalam subset, yang merupakan hal terakhir yang akan saya uraikan di bawah ini. Sesaat sebelumnya, kami telah melihat bahwa subset (A, C, D) sangat disukai untuk penampilan fitur, jadi kami akan memberikan perhatian khusus pada singleton penyusunnya dan rasio yang sesuai: $$ \ frac {F_A} {T_A} = \ frac {2} {6} ~~ \ text {(2nd & amp; 4th)}, ~~ \ frac {F_C} {T_C} = \ frac {2} {6} ~ ~ \ text {(2 & amp; 3)}, ~~ \ frac {F_E} {T_E} = \ frac {1} {6} ~~ \ text {(hanya ke-2)} $$ enter image description here enter image description here enter image description here

Bahkan sekarang, kita dapat dengan jelas melihat semacam koperasi, karena ketiga lajang (A), (C) dan (E) bersama-sama hanya mencakup tiga himpunan bagian {2, 3, 4} = {2, 4} $ \ cup $ {2nd, 3} $ \ cup $ {2nd}, sedangkan subset (A, C, E) memicu fitur di sebagian besar subset kecuali yang pertama.

Selain itu, menggabungkan A dengan E atau C dengan E tidak memberikan efek koalisi tambahan, sehingga E sendiri memberikan kontribusi yang buruk untuk efek keseluruhan.

enter image description here enter image description here

Namun, menggabungkan A dengan C memberikan interaksi yang signifikan yang dihasilkan dengan penampilan fitur dalam lebih banyak contoh daripada hanya mengikuti menjumlahkan instance: $ \ {2, 3, 4, 6th \} $ vs $ \ {2, 3, 4 \} $. Kejadian dalam instance ke-6 adalah efek koalisi ini.

enter image description here

Meskipun demikian, E diperlukan untuk memicu potensi penuh dan mengungkapkan fitur juga dalam instance ke-5, seperti yang digambarkan pada gambar kedua.

Singkatnya, saya ingin menyimpulkan dari data mana objek tunggal yang menguntungkan untuk penampilan fitur. Dalam contoh kita, kita bisa jelas melihat bahwa A dan C sangat kondusif (bekerja sama dengan yang lain), E tidak begitu berguna, tetapi dituntut untuk mencapai potensi penuh, sedangkan B dan D tampaknya tidak memiliki efek kooperatif pada fitur.

Masalah utama dengan memasukkan nilai Shapley: Saya ingin menggunakan rasio $ \ frac {F_X} {T_X} $ sebagai fungsi karakteristik $ v (X) $ untuk subset tertentu $ X $ ($ v: 2 ^ {5} \ mapsto \ mathbb {R} $), tetapi rasio ini tidak monoton sehubungan dengan hubungan inklusi dan total koalisi $ (A, B, C, D, E) $ akan mendapatkan nilai lebih kecil daripada $ sempit (A, C, E) $ (bandingkan angka 1 dan 2). Saya tidak berpikir bahwa B atau C harus membawa kontribusi negatif, lebih netral.

Apakah Anda melihat bagaimana saya dapat memberikan kontribusi seperti itu?

Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.