Gambar VM untuk proyek ilmu data


24

Karena ada banyak alat yang tersedia untuk tugas-tugas ilmu data, dan rumit untuk menginstal semuanya dan membangun sistem yang sempurna.

Apakah ada gambar Linux / Mac OS dengan Python, R dan alat sains data open-source lainnya diinstal dan tersedia untuk digunakan orang sekarang juga? Ubuntu atau OS ringan dengan versi terbaru Python, R (termasuk IDE), dan alat visualisasi data open source lainnya yang diinstal akan ideal. Saya belum menemukan satu di pencarian cepat saya di Google.

Tolong beri tahu saya jika ada atau apakah seseorang dari Anda telah membuat sendiri? Saya berasumsi beberapa universitas mungkin memiliki gambar VM mereka sendiri. Silakan bagikan tautan tersebut.


Meskipun pertanyaan ini dapat dilihat sebagai offtopic batas saya entah bagaimana menemukannya baik untuk situs IMHO.
Sean Owen

3
Selain komentar yang luar biasa, ada posting blog (agak lebih tua) yang membandingkan beberapa solusi berbeda: jeroenjanssens.com/2013/12/07/…
LauriK

Jawaban:



12

Jika Anda mencari VM dengan banyak alat yang sudah diinstal, coba Toolbox Ilmu Data .


Proyek yang menarik (+1). Terima kasih sudah berbagi! Mungkin lebih mudah untuk menggunakannya daripada mencari tahu mengapa Docker tidak ingin bekerja pada laptop Win 7 saya (lihat di atas). Namun, masih mungkin ide yang baik untuk belajar Docker, mengingat tren terbaru.
Aleksandr Blekh

Informasi yang bagus. Dibandingkan dengan alat vm, perlu waktu untuk memahami bagaimana buruh pelabuhan beroperasi. Jika Anda sudah terbiasa dengan vm, sebaiknya gunakan kotak alat ini. Terima kasih sudah berbagi.
Fansia

Terima kasih sudah berbagi. Ini pasti menarik. Tetapi saya tidak melihat bagaimana seseorang dapat menggunakannya tanpa antarmuka grafis. Saya membutuhkan R-studio, dan PyCharm untuk Python. (IPython notebook ada di sana). Saya harus bermain dengan sedikit untuk memahaminya sepenuhnya.
JeanVuda

1
@AlexandrBlekh Saya akhirnya bisa mendapatkan buruh pelabuhan untuk bekerja di mesin Windows 7 saya dengan membuat ulang sertifikat yang docker-machine regenerate-certssaya harap bisa membantu :)
RK

@RK: Terima kasih telah memberi tahu saya. Saya akan mencobanya ketika saya akan mendapatkan kesempatan (meskipun mungkin perlu beberapa saat, karena ada beberapa hal prioritas yang lebih tinggi menunggu untuk diurus).
Aleksandr Blekh

8

Sementara gambar Docker sekarang lebih trendi, saya pribadi menemukan teknologi Docker tidak ramah pengguna, bahkan untuk pengguna tingkat lanjut. Jika Anda setuju dengan menggunakan gambar VM non-lokal dan dapat menggunakan Amazon Web Services (AWS) EC2 , pertimbangkan gambar yang berfokus pada R untuk proyek-proyek ilmu data, yang dibuat sebelumnya oleh Louis Aslett. Gambar-gambar tersebut mengandung versi terbaru LTS , R dan RStudio Server Ubuntu terbaru . Anda dapat mengaksesnya di sini .

Selain komponen-komponen utama yang saya sebutkan di atas, gambar-gambar itu mengandung banyak alat sains data yang berguna. Misalnya, gambar mendukung LaTeX, ODBC, OpenGL, Git, perpustakaan numerik yang dioptimalkan dan banyak lagi.


Terima kasih banyak telah menyebutkan opsi ini. Saya pasti akan mencobanya. Namun, saya ingin gambar yang persis seperti AMI ini, tetapi dapat dijalankan dengan VirtualBox di laptop saya.
JeanVuda

Saya menonton tutorial baru-baru ini tentang Docker, mengujinya dan ternyata mudah dimengerti. Bagian apa yang Anda temukan tidak ramah pengguna?
Robert Smith

@JeanVids: Terima kasih kembali. Saya memahami keinginan Anda untuk memiliki VM lokal - itulah alasan saya mencoba Docker di komputer saya. Saya akan memberi tahu Anda, jika saya menemukan gambar VM VirtualBox yang berfokus pada ilmu data (mudah-mudahan, berbasis R).
Aleksandr Blekh

1
@ Roberttmith: Saya mengerti. Mungkin, masalahnya adalah saya mencoba memasangnya di mesin Windows saya. Bagaimanapun, saya akan mencobanya beberapa waktu kemudian. Terima kasih atas komentar anda
Aleksandr Blekh

1
@AlexandrBlekh Ya, itu mungkin masalah utama. Sayangnya ada banyak masalah saat menginstal hal semacam ini di Windows.
Robert Smith


Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.