Sementara saya setuju pada jawaban ncasas di sebagian besar poin (+1), saya mohon berbeda pada beberapa:
- Pohon Keputusan dapat digunakan sebagai model kotak hitam juga. Bahkan, saya katakan dalam banyak kasus mereka digunakan sebagai model kotak hitam. Jika Anda memiliki 10.000 fitur dan pohon kedalaman 50, Anda tidak bisa mengharapkan manusia untuk memahaminya.
- Jaringan Saraf Tiruan dapat dipahami. Ada banyak teknik analisis (lihat bab 2.5 dari tesis master saya untuk beberapa yang ditujukan untuk meningkatkan model). Terutama analisis oklusi (Gambar 2.10), Visualisasi filter (Gambar 2.11). Juga Mengapa Saya Harus Memercayai Anda? kertas ( catatan saya ).
Menjelaskan prediksi model kotak hitam dengan analisis oklusi mewah (dari "Mengapa saya harus mempercayai Anda?"):
Saya ingin menunjukkan The Mythos of Model Interpretability . Ini merumuskan beberapa ide tentang interpretabilitas dalam cara yang ringkas.
Pertanyaanmu
Mengapa model Machine Learning disebut kotak hitam?
Bagaimana orang menggunakannya : Karena mereka tidak memodelkan masalah dengan cara yang memungkinkan manusia untuk secara langsung mengatakan apa yang terjadi untuk setiap masukan yang diberikan.
Pikiran pribadi
Saya tidak berpikir gagasan "model kotak hitam" ini masuk akal. Misalnya, pikirkan ramalan cuaca. Anda tidak bisa mengharapkan manusia mengatakan cuaca mana yang akan diprediksi jika dia hanya diberi data. Namun kebanyakan orang tidak akan mengatakan bahwa model cuaca fisik adalah model kotak hitam. Jadi di mana perbedaannya? Apakah hanya fakta bahwa satu model dihasilkan menggunakan data dan yang lainnya dihasilkan dengan menggunakan wawasan fisika?
Ketika orang berbicara tentang model kotak hitam, mereka biasanya mengatakannya seolah itu adalah hal yang buruk. Tetapi manusia juga adalah model kotak hitam. Perbedaan kritis yang saya lihat di sini adalah bahwa kelas kesalahan yang dibuat manusia lebih mudah diprediksi untuk manusia. Karenanya ini adalah masalah pelatihan (contoh-contoh permusuhan di sisi NN) dan masalah pendidikan (mengajar manusia bagaimana NN bekerja).
Bagaimana istilah 'model kotak hitam' harus digunakan : Suatu pendekatan yang lebih masuk akal bagi saya adalah menyebut masalah itu sebagai "masalah kotak hitam", mirip dengan apa yang ditulis pengguna144410 (+1). Oleh karena itu setiap model yang hanya memperlakukan masalah sebagai kotak hitam - maka sesuatu yang dapat Anda masukkan input dan keluar output - adalah model kotak hitam. Model yang memiliki wawasan (tidak hanya berasumsi!) Tentang masalahnya bukan model kotak hitam. Bagian wawasannya rumit. Setiap model membuat batasan pada fungsi yang mungkin dapat dimodelkan (ya, saya tahu tentang masalah perkiraan universal. Selama Anda menggunakan NN ukuran tetap, itu tidak berlaku). Saya akan mengatakan sesuatu adalah wawasan masalah jika Anda tahu sesuatu tentang hubungan input dan output tanpa menyodok masalah (tanpa melihat data).
Apa yang mengikuti dari ini:
- Neural Networks dapat berupa non-kotak hitam (papan tulis?)
- Regresi Logistik dapat menjadi model kotak hitam.
- Ini lebih tentang masalah dan wawasan Anda tentang itu, lebih sedikit tentang model.