Algoritma pembelajaran mesin mana yang dapat digunakan untuk mengidentifikasi pola dalam dataset kinerja cache dari CPU?


9

Saya membutuhkan algoritma pembelajaran mesin untuk mengidentifikasi pola dalam dataset (disimpan dalam file CSV) yang berisi rincian kinerja cache CPU. Lebih khusus lagi, dataset berisi kolom seperti Readhits, Readmissatau Writehits.

Pola-pola yang diidentifikasi algoritma harus membantu dengan cara-cara berikut.

  1. membantu pengguna untuk meningkatkan kinerja beban kerja lain kali,

  2. membantu mengidentifikasi masalah apa pun berdasarkan fitur, atau

  3. membantu pengguna untuk memprediksi nilai data masa depan atau peristiwa di masa depan yang mungkin terjadi berdasarkan pola.

Algoritma ML mana yang dapat saya gunakan?

Jawaban:


0

Mesin Boltzmann Terbatas (RBM) dapat mengidentifikasi pola dalam file CSV tanpa pengguna menentukan kondisi apa pun. Mereka sangat cocok untuk menghasilkan, "representasi terdistribusi dan bertingkat," dari, "serangkaian fitur kompleks yang menyusun data dimensi tinggi nyata sangat penting untuk mencapai kinerja tinggi dalam tugas pembelajaran mesin." 1

Karena format CSV dirancang khusus untuk merepresentasikan instance dalam baris dan sekumpulan atribut statis dalam kolom, pengaturan pelatihan menjadi mudah. Jika tujuannya adalah untuk mengidentifikasi pola temporal, strategi windowing mungkin diperlukan.

K-RBM adalah penggabungan pendekatan k-mean dengan RBM. Pilihan pendekatan banyak berkaitan dengan jenis pola apa yang dicari. Pola jangka dapat berlaku untuk tren sederhana dalam jumlah dari waktu ke waktu, pola umum ditemukan di kolom tekstual, atau pola kompleks disimpulkan dari banyak kolom.

Referensi

[1] Munculnya Representasi Komposisi dalam Mesin Boltzmann Terbatas , J. Tubiana, R. Monasson, 2017)

[2] Belajar Beberapa Sub-Spasi Non-Linear menggunakan K-RBM , Siddhartha Chandra, Shailesh Kumar & CV Jawahar


0

Saya pribadi akan menggunakan k-means clustering. Ini dirancang untuk masalah seperti ini.


0

Saya memerlukan algoritma pembelajaran mesin untuk mengidentifikasi pola dalam file CSV

Anda ingin melakukan pembelajaran tanpa pengawasan . Definisi Wikipedia yang sama adalah:

Pembelajaran mesin tanpa pengawasan adalah tugas pembelajaran mesin untuk menyimpulkan fungsi untuk menggambarkan struktur tersembunyi dari data "tidak berlabel" (klasifikasi atau kategorisasi tidak termasuk dalam pengamatan).

Saya akan merekomendasikan Anda untuk pergi melalui daftar algoritma pembelajaran yang tidak diawasi di sini dan menggunakan yang sesuai dengan kebutuhan Anda.

Jika Anda memulai, maka saya akan merekomendasikan memulai dengan mempelajari algoritma pengelompokan K-means .


0

Pertama, Anda harus mengklasifikasikan setiap potongan file CSV dan memberi label berdasarkan situasi saat ini, seperti A) situasi optimal B) kritis.

Kemudian Anda mengelompokkan data Anda dengan algoritma pembelajaran yang tidak diawasi, seperti SOM atau k-means, dan kemudian Anda cukup mengklasifikasikan kelas yang akan Anda dapatkan.


0

Pada dasarnya yang Anda cari adalah pembelajaran tanpa pengawasan (UL). Ada banyak teknik UL di sekitar, tetapi saya tidak yakin Anda akan menemukan yang melakukan persis apa yang Anda inginkan tanpa input pengguna sama sekali. Namun, jika Anda membaca literatur tentang pendekatan ini, Anda mungkin menemukan sesuatu yang bermanfaat.

Salah satu pilihan adalah DBSCAN , algoritma pengelompokan yang sangat populer yang tidak mengharuskan pengguna untuk memasukkan jumlah target awal dari kluster (sesuatu yang dibutuhkan sebagian besar algoritma pengelompokan). Tetapi meskipun demikian, Anda masih harus memberikan nilai-nilai algoritma untuk epsilon(jarak yang digunakan dalam menghitung cluster) dan minPts(jumlah minimum poin yang diperlukan untuk membentuk wilayah "padat").

Anda mungkin juga melihat peta yang mengatur diri sendiri , sebuah pendekatan untuk pembelajaran tanpa pengawasan untuk jaringan saraf.

Beberapa istilah pencarian lain yang mungkin mengarahkan Anda ke arah yang bermanfaat termasuk "penambangan data" dan "penemuan pengetahuan dalam database" (KDD).

Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.