Bin adalah rentang yang mewakili lebar satu batang histogram di sepanjang sumbu X. Anda juga bisa menyebutnya sebagai interval. (Wikipedia mendefinisikannya secara lebih formal sebagai "kategori terpisah".)
Fungsi Numpy histogram
tidak menggambar histogram, tetapi menghitung kemunculan data input yang termasuk dalam setiap nampan, yang pada gilirannya menentukan luas (tidak harus tingginya jika nampan tidak memiliki lebar yang sama) dari setiap batang.
Dalam contoh ini:
np.histogram([1, 2, 1], bins=[0, 1, 2, 3])
Ada 3 bin, untuk nilai mulai dari 0 hingga 1 (tidak termasuk 1.), 1 hingga 2 (tidak termasuk 2) dan 2 hingga 3 (termasuk 3), masing-masing. Cara Numpy mendefinisikan bins ini jika dengan memberikan daftar pembatas ( [0, 1, 2, 3]
) dalam contoh ini, meskipun Numpy juga mengembalikan bins dalam hasil, karena ia dapat memilihnya secara otomatis dari input, jika tidak ada yang ditentukan. Jika bins=5
, misalnya, akan menggunakan 5 bin dengan lebar yang sama tersebar antara nilai input minimum dan nilai input maksimum.
Nilai inputnya adalah 1, 2 dan 1. Oleh karena itu, bin "1 hingga 2" berisi dua kemunculan (dua 1
nilai), dan bin "2 hingga 3" berisi satu kemunculan (the 2
). Hasil ini pada item pertama dalam tuple kembali: array([0, 2, 1])
.
Karena kotak di sini memiliki lebar yang sama, Anda dapat menggunakan jumlah kemunculan untuk tinggi setiap batang. Saat digambar, Anda akan memiliki:
- batang dengan tinggi 0 untuk range / bin [0,1] pada sumbu X,
- batang dengan tinggi 2 untuk rentang / bin [1,2],
- batang dengan tinggi 1 untuk jangkauan / bin [2,3].
Anda dapat memplot ini secara langsung dengan Matplotlib ( hist
fungsinya juga mengembalikan bin dan nilainya):
>>> import matplotlib.pyplot as plt
>>> plt.hist([1, 2, 1], bins=[0, 1, 2, 3])
(array([0, 2, 1]), array([0, 1, 2, 3]), <a list of 3 Patch objects>)
>>> plt.show()