Apa perbedaan antara data diskrit dan data kontinu?
Apa perbedaan antara data diskrit dan data kontinu?
Jawaban:
Data diskrit hanya dapat mengambil nilai tertentu. Mungkin ada kemungkinan nilai-nilai itu tak terhingga, tetapi masing-masing berbeda dan tidak ada area abu-abu di antaranya. Data diskrit bisa berupa angka seperti apel - tetapi juga bisa kategorikal - seperti merah atau biru, atau pria atau wanita, atau baik atau buruk.
Data kontinu tidak terbatas pada nilai-nilai terpisah yang ditentukan, tetapi dapat menempati nilai apa pun pada rentang kontinu. Antara dua nilai data kontinu mungkin ada jumlah yang tak terbatas dari yang lain. Data kontinu pada dasarnya selalu berupa angka.
Kadang-kadang masuk akal untuk memperlakukan data numerik yang benar dari satu jenis sebagai yang lain. Misalnya, sesuatu seperti tinggi terus-menerus, tetapi sering kali kita tidak terlalu peduli tentang perbedaan kecil dan malah mengelompokkan ketinggian menjadi sejumlah tempat sampah terpisah . Sebaliknya, jika kita menghitung sejumlah besar entitas diskrit - butiran beras, atau rayap, atau uang dalam perekonomian - kita dapat memilih untuk tidak menganggap 2.000.006 dan 2.000.008 sebagai nilai yang sangat berbeda tetapi sebagai titik terdekat pada suatu perkiraan kontinum.
Kadang-kadang juga bermanfaat untuk memperlakukan data numerik sebagai kategori, misalnya: kurang berat badan, normal, obesitas. Ini biasanya hanya jenis lain dari binning.
Jarang masuk akal untuk menganggap data kategorikal sebagai berkelanjutan.
Data selalu terpisah. Diberikan sampel n
nilai pada suatu variabel, jumlah maksimum dari nilai berbeda yang dapat diambil variabel adalah sama dengan n
. Lihat kutipan ini
Semua ruang sampel aktual adalah diskrit, dan semua variabel acak yang dapat diamati memiliki distribusi diskrit. Distribusi kontinu adalah konstruksi matematika, cocok untuk perawatan matematika, tetapi tidak dapat diamati secara praktis. EJG Pitman (1979, hal. 1).
Data pada suatu variabel biasanya diasumsikan diambil dari variabel acak. Variabel acak adalah kontinu pada rentang jika ada jumlah tak terhingga dari nilai yang mungkin bahwa variabel dapat mengambil antara dua titik berbeda dalam rentang. Misalnya, tinggi, berat, dan waktu biasanya dianggap berkelanjutan. Tentu saja, setiap pengukuran variabel-variabel ini akan akurat secara akurat dan dalam beberapa hal terpisah.
Berguna untuk membedakan antara
variabel yang diurutkan (yaitu, ordinal), tidak berurutan (yaitu, nominal), dan biner.
Beberapa buku teks pengantar membingungkan variabel kontinu dengan variabel numerik. Misalnya, skor pada permainan komputer terpisah meskipun itu numerik.
Beberapa buku teks pengantar membingungkan variabel rasio dengan variabel kontinu. Variabel jumlah adalah variabel rasio, tetapi tidak kontinu.
Dalam praktik aktual, suatu variabel sering diperlakukan sebagai kontinu ketika variabel tersebut dapat mengambil sejumlah besar nilai yang berbeda.
Temperatur kontinu. Itu bisa 23 derajat, 23.1 derajat, 23.100004 derajat.
Seks itu terpisah. Anda hanya bisa pria atau wanita (dalam pemikiran klasik). Sesuatu yang bisa Anda wakili dengan bilangan bulat seperti 1, 2, dll
Perbedaannya penting karena banyak algoritma statistik dan data mining dapat menangani satu jenis tetapi tidak yang lain. Misalnya dalam regresi reguler, Y harus kontinu. Dalam regresi logistik Y adalah diskrit.
Data Diskrit hanya dapat mengambil nilai tertentu.
Contoh: jumlah siswa dalam satu kelas (Anda tidak dapat memiliki setengah siswa).
Data Kontinu adalah data yang dapat mengambil nilai apa pun (dalam kisaran)
Contoh:
Dalam kasus basis data, kami akan selalu menyimpan data dalam diskrit bahkan sifat data kontinu. Mengapa saya harus menekankan sifat data? Kita harus mengambil distribusi data yang dapat membantu kita menganalisis data. JIKA sifat data kontinu, saya sarankan Anda menggunakannya dengan analisis kontinu.
Ambil contoh berkelanjutan dan diskrit: MP3. Bahkan jenis "suara" adalah analogi, jika disimpan dengan format digital. Kita harus menganalisanya selalu dengan cara analogi.
Di satu sisi, dari sudut pandang praktis saya setuju dengan jawaban Jeromy Anglim. Pada akhirnya kita sering berurusan dengan variabel diskrit - meskipun dari sudut pandang teoretis, variabel tersebut kontinu - dan itu memiliki dampak nyata misalnya untuk klasifikasi. Ingat kertas Strobl yang menunjukkan bahwa Hutan Acak bias terhadap variabel dengan beberapa titik potong (akurasi yang lebih tinggi tetapi berpotensi serupa). Dari pengalaman pribadi saya, jaringan neural probabilistik dapat juga menimbulkan bias ketika variabel menghadirkan akurasi yang berbeda kecuali jika jenisnya sama (yaitu, kontinu). Di sisi lain, dari sudut pandang teoritis klasifikasi klasik (misalnya, kontinu, diskrit, nominal, dll.) Adalah, IMHO, benar. Sesuai menurut saya bahwa nama sumber dari makalah Quinlan yang menggambarkan algoritma M5, yang merupakan 'regressor', adalah pilihan yang bagus. Jadi definisi dan implikasi berkelanjutan vs diskrit relevan tergantung pada 'lingkungan'.
Referensi:
Quinlan JR (1992). Belajar dengan kelas berkelanjutan. Dalam: Konferensi Gabungan ke-5 Australia tentang AI. Sydney (Australia), 343–348.
Strobl C., Boulesteix A.-L., Zeileis A., & Hothorn T. (2007). Bias dalam variabel acak ukuran hutan yang penting: ilustrasi, sumber, dan solusi. BMC Bioinformatics, 8, 25. doi: 10.1186 / 1471-2105-8-25
Data diskrit mengambil nilai tertentu, sementara data kontinu tidak terbatas pada nilai yang terpisah.
Data diskrit berbeda dan tidak ada area abu-abu di antaranya, sedangkan data kontinu menempati nilai apa pun di atas nilai data kontinu.
Data diskrit hanya dapat mengambil nilai integer sedangkan data kontinu dapat mengambil nilai apa pun. Misalnya, jumlah pasien kanker yang dirawat oleh rumah sakit setiap tahun berbeda tetapi berat badan Anda terus menerus. Beberapa data kontinu tetapi diukur dengan cara yang berbeda misalnya usia Anda. Adalah umum untuk melaporkan usia Anda seperti, 31.
Diskrit data secara khusus berbicara tentang nilai-nilai terbatas dan pembicaraan data terus-menerus tentang nilai-nilai ifinite .....