Pertama, beberapa peringatan
Saya tidak yakin mengapa Anda tidak dapat menggunakan paradigma pemrograman pilihan (sub-) *, Pemrograman Logika Induktif (ILP) , atau apa yang ingin Anda klasifikasikan. Memberi lebih banyak detail mungkin akan menghasilkan jawaban yang jauh lebih baik; terutama karena agak tidak biasa untuk mendekati pemilihan algoritma klasifikasi berdasarkan paradigma pemrograman yang terkait dengannya. Jika contoh dunia nyata Anda bersifat rahasia, maka buatlah contoh fiksi tapi analog.
Klasifikasi Big Data tanpa ILP
Karena itu, setelah mengesampingkan ILP kami memiliki 4 paradigma pemrograman logika lainnya dalam pertimbangan kami:
- Abduktif
- Set Jawaban
- Paksaan
- Fungsional
selain lusinan paradigma dan sub-paradigma di luar pemrograman logika.
Dalam Pemrograman Logika Fungsional misalnya, terdapat ekstensi ILP yang disebut Pemrograman Logika Fungsional Induktif , yang didasarkan pada penyempitan inversi (yaitu inversi mekanisme penyempitan). Pendekatan ini mengatasi beberapa keterbatasan ILP dan ( menurut beberapa sarjana, setidaknya ) sesuai untuk penerapan dalam hal representasi dan memiliki manfaat memungkinkan masalah diungkapkan dengan cara yang lebih alami.
Tanpa mengetahui lebih lanjut tentang spesifikasi basis data Anda dan hambatan yang Anda hadapi untuk menggunakan ILP, saya tidak bisa tahu apakah ini menyelesaikan masalah Anda atau menderita masalah yang sama. Karena itu, saya akan membuang pendekatan yang sama sekali berbeda.
ILP kontras dengan pendekatan "klasik" atau "proposisional" untuk data mining . Pendekatan tersebut termasuk daging dan tulang Machine Learning seperti pohon keputusan, jaringan saraf, regresi, mengantongi dan metode statistik lainnya. Daripada menyerah pada pendekatan ini karena ukuran data Anda, Anda dapat bergabung dengan jajaran banyak Ilmuwan Data, insinyur Big Data dan ahli statistik yang memanfaatkan High Performance Computing (HPC) untuk menggunakan metode ini dengan kumpulan data besar (ada juga pengambilan sampel dan teknik statistik lainnya yang dapat Anda gunakan untuk mengurangi sumber daya komputasi dan waktu yang diperlukan untuk menganalisis Big Data dalam basis data relasional Anda).
HPC mencakup hal-hal seperti memanfaatkan beberapa inti CPU, meningkatkan analisis Anda dengan penggunaan elastis server dengan memori tinggi dan sejumlah besar inti CPU cepat, menggunakan peralatan gudang data berkinerja tinggi, menggunakan kelompok atau bentuk lain dari komputasi paralel, dll. Saya tidak yakin bahasa apa atau rangkaian statistik yang Anda analisis dengan data Anda, tetapi sebagai contoh, CRAN Task View ini mencantumkan banyak sumber daya HPC untuk bahasa R yang akan memungkinkan Anda untuk meningkatkan algoritme proposisional.