Saya pemula di pembelajaran mesin dan keras dan sekarang bekerja masalah klasifikasi gambar multi-kelas menggunakan keras. Input ditandai gambar. Setelah beberapa pra-pemrosesan, data pelatihan diwakili dalam daftar Python sebagai:
[["dog", "path/to/dog/imageX.jpg"],["cat", "path/to/cat/imageX.jpg"], ["bird", "path/to/cat/imageX.jpg"]]
"anjing", "kucing", dan "burung" adalah label kelas. Saya pikir pengkodean satu-panas harus digunakan untuk masalah ini, tetapi saya tidak begitu jelas tentang bagaimana menghadapinya dengan label string ini. Saya sudah mencoba LabelEncoder () sklearn dengan cara ini:
encoder = LabelEncoder()
trafomed_label = encoder.fit_transform(["dog", "cat", "bird"])
print(trafomed_label)
Dan hasilnya adalah [2 1 0], yang berbeda dengan yang saya harapkan dari sesuatu seperti [[1,0,0], [0,1,0], [0,0,1]]. Itu dapat dilakukan dengan beberapa pengkodean, tetapi saya ingin tahu apakah ada beberapa cara "standar" atau "tradisional" untuk menghadapinya?