Apa perbedaan antara fitur dan label?


100

Saya mengikuti tutorial tentang dasar-dasar pembelajaran mesin dan disebutkan bahwa sesuatu dapat berupa fitur atau label .

Dari yang saya tahu, fitur adalah properti dari data yang sedang digunakan. Saya tidak tahu apa labelnya, saya tahu arti kata itu, tapi saya ingin tahu artinya dalam konteks pembelajaran mesin.


Fitur adalah bidang yang digunakan sebagai masukan dan label digunakan sebagai keluaran. Sebagai contoh sederhana, pertimbangkan bagaimana cara memprediksi apakah seseorang harus menjual mobil berdasarkan jarak tempuh mobil, tahun, dll. Ya / tidak adalah labelnya sedangkan jarak tempuh dan tahun adalah fiturnya.
amcneil206

Jawaban:


200

Singkatnya, feature adalah input; label adalah keluaran. Ini berlaku untuk masalah klasifikasi dan regresi.

Fitur adalah satu kolom data di set input Anda. Misalnya, jika Anda mencoba memprediksi jenis hewan peliharaan yang akan dipilih seseorang, fitur masukan Anda mungkin termasuk usia, wilayah rumah, pendapatan keluarga, dll. Label adalah pilihan terakhir, seperti anjing, ikan, iguana, batu, dll.

Setelah Anda melatih model Anda, Anda akan memberikan set input baru yang berisi fitur-fitur tersebut; ini akan mengembalikan prediksi "label" (jenis hewan peliharaan) untuk orang itu.


1
Jadi [usia, wilayah rumah, pendapatan keluarga] akan menjadi "3 vektor fitur". Dan di Keras, array NumPy Anda untuk jaringan LSTM Anda akan menjadi [sampel, langkah waktu, 3]?
naisanza

1
@naisanza: itu pasti satu kemungkinan. Saya tidak terbiasa dengan Keras, tetapi organisasi tingkat tinggi ini tentunya bisa menjadi awal dari implementasi yang valid.
Pangkas

apakah fitur dan variabel itu sama?
Debadatta

Saya ingin menyatakan bahwa "label" juga bergantung pada konteksnya; misalnya, untuk melatih model, Anda akan menggunakan data "berlabel". Dalam hal ini, label adalah kebenaran dasar yang dibandingkan dengan data keluaran Anda.
N. Atanasov

Wow. jawaban yang bagus, terima kasih ini menyelesaikan banyak pertanyaan tersisa tentang ruang topik ini.
Andrew Ray

31

Fitur:

Dalam fitur Machine Learning berarti properti data pelatihan Anda. Atau Anda dapat mengucapkan nama kolom di set data pelatihan Anda.

Misalkan ini adalah set data pelatihan Anda

Height   Sex   Age
 61.5     M     20
 55.5     F     30
 64.5     M     41
 55.5     F     51
 .     .     .
 .     .     .
 .     .     .
 .     .     .

Lalu di sini Height, Sexdan Ageadalah fitur-fiturnya.

label:

Output yang Anda peroleh dari model setelah pelatihan itu disebut label.

Misalkan Anda memasukkan kumpulan data di atas ke beberapa algoritme dan menghasilkan model untuk memprediksi jenis kelamin sebagai Pria atau Wanita, Dalam model di atas Anda meneruskan fitur seperti age, heightdll.

Jadi setelah dihitung, itu akan mengembalikan jenis kelamin sebagai Pria atau Wanita. Itu disebut Label


5

Di sinilah pendekatan yang lebih visual untuk menjelaskan konsep tersebut. Bayangkan Anda ingin mengklasifikasikan hewan yang ditampilkan di foto.

Kelas hewan yang mungkin adalah misalnya kucing atau burung. Jika demikian, labelnya adalah kemungkinan asosiasi kelas, misalnya kucing atau burung, yang akan diprediksi oleh algoritme pembelajaran mesin Anda.

The fitur yang pola, warna, bentuk yang merupakan bagian dari gambar Anda misalnya furr, bulu, atau lebih rendah tingkat interpretasi, nilai-nilai pixel.

Burung Label:
Fitur Burung : Bulu

Kucing

Label:
Fitur Cat : Bulu


5

Mari kita ambil contoh di mana kita ingin mendeteksi alfabet menggunakan foto tulisan tangan. Kami memberi makan gambar contoh ini dalam program dan program mengklasifikasikan gambar ini berdasarkan fitur yang mereka dapatkan.

Contoh ciri dalam konteks ini adalah: huruf 'C'dapat dianggap seperti cekung menghadap ke kanan.

Sekarang muncul pertanyaan tentang bagaimana menyimpan fitur-fitur ini. Kita perlu memberi nama mereka. Inilah peran label yang muncul. Sebuah label yang diberikan untuk fitur tersebut membedakan mereka dari fitur-fitur lainnya.

Jadi, kami mendapatkan label sebagai keluaran jika dilengkapi dengan fitur sebagai masukan .

Label tidak terkait dengan pembelajaran tanpa pengawasan.


4

Prasyarat: Statistik Dasar dan eksposur ke ML (Regresi Linier)

Itu bisa dijawab dengan kalimat -

Mereka sama tetapi definisi mereka berubah sesuai dengan kebutuhan.

Penjelasan

Izinkan saya menjelaskan pernyataan saya. Misalkan Anda memiliki kumpulan data, untuk tujuan ini pertimbangkan exercise.csv. Setiap kolom dalam dataset disebut sebagai fitur. Jenis Kelamin, Usia, Tinggi, Denyut Jantung, Suhu_badan, dan Kalori mungkin merupakan satu di antara berbagai kolom. Setiap kolom mewakili fitur atau properti yang berbeda.

exercise.csv

User_ID  Gender Age  Height  Weight Duration    Heart_Rate  Body_Temp   Calories
14733363 male   68  190.0   94.0    29.0           105.0    40.8        231.0
14861698 female 20  166.0   60.0    14.0            94.0    40.3        66.0
11179863 male   69  179.0   79.0    5.0             88.0    38.7        26.0

Untuk memperkuat pemahaman dan menjernihkan teka-teki, mari kita ambil dua masalah yang berbeda (kasus prediksi).

KASUS1: Dalam kasus ini kami mungkin mempertimbangkan untuk menggunakan - Jenis Kelamin, Tinggi, dan Berat untuk memprediksi Kalori yang terbakar selama latihan. Prediksi itu (Y) Kalori di sini adalah Label . Kalori adalah kolom yang ingin Anda prediksi menggunakan berbagai fitur seperti - x1: Jenis kelamin, x2: Tinggi dan x3: Berat .

KASUS2: Dalam kasus kedua di sini kita mungkin ingin memprediksi Heart_rate dengan menggunakan Jenis Kelamin dan Berat sebagai fitur. Di sini Heart_Rate adalah Label yang diprediksi menggunakan fitur - x1: Jenis kelamin dan x2: Berat .

Setelah Anda memahami penjelasan di atas, Anda tidak akan bingung lagi dengan Label dan Fitur.


3

Sebuah fitur yang dijelaskan secara singkat adalah masukan yang telah Anda masukkan ke sistem dan labelnya adalah keluaran yang Anda harapkan. Misalnya, Anda telah memberi makan banyak fitur anjing seperti tinggi badannya, warna bulunya, dll, jadi setelah menghitung, ia akan mengembalikan jenis anjing yang ingin Anda ketahui.


0

Misalkan Anda ingin memprediksi iklim maka fitur yang diberikan kepada Anda akan menjadi data iklim historis, cuaca saat ini, suhu, kecepatan angin, dll. Dan label akan berbulan-bulan. Kombinasi di atas dapat membantu Anda mendapatkan prediksi.

Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.