Ilmu Data

T&J untuk profesional sains Data, spesialis Pembelajaran Mesin, dan mereka yang tertarik untuk belajar lebih banyak tentang bidang ini

4
Model statistik apa yang harus saya gunakan untuk menganalisis kemungkinan bahwa satu peristiwa memengaruhi data longitudinal
Saya mencoba menemukan formula, metode, atau model yang akan digunakan untuk menganalisis kemungkinan bahwa peristiwa tertentu mempengaruhi beberapa data longitudinal. Saya mengalami kesulitan mencari tahu apa yang harus dicari di Google. Berikut ini sebuah contoh skenario: Image Anda memiliki bisnis yang memiliki rata-rata 100 pelanggan berjalan setiap hari. Suatu hari, …


1
Apa itu "replay pengalaman" dan apa manfaatnya?
Saya telah membaca makalah DeepMind Atari Google dan saya mencoba memahami konsep "replay pengalaman". Replay pengalaman muncul di banyak makalah pembelajaran penguatan lainnya (khususnya, kertas AlphaGo), jadi saya ingin memahami cara kerjanya. Berikut beberapa kutipannya. Pertama, kami menggunakan mekanisme yang diilhami secara biologis yang disebut replay pengalaman yang mengacak data, …

4
Apa arti dari "Jumlah unit dalam sel LSTM"?
Dari kode Tensorflow : Tensorflow. RnnCell. num_units: int, The number of units in the LSTM cell. Tidak dapat memahami apa artinya ini. Apa unit sel LSTM. Input, Output dan lupakan gerbang? Apakah ini berarti "jumlah unit dalam lapisan proyeksi berulang untuk Deep LSTM". Lalu mengapa ini disebut "jumlah unit dalam …


1
Bagaimana cara memutuskan arsitektur jaringan saraf?
Saya bertanya-tanya bagaimana kita harus memutuskan berapa banyak node di lapisan tersembunyi, dan berapa banyak lapisan tersembunyi untuk diletakkan ketika kita membangun arsitektur jaringan saraf. Saya mengerti layer input dan output tergantung pada set pelatihan yang kita miliki tetapi bagaimana kita memutuskan layer tersembunyi dan keseluruhan arsitektur secara umum?

3
Dataset untuk Pengakuan Entitas Bernama pada Teks Informal
Saat ini saya sedang mencari dataset berlabel untuk melatih model untuk mengekstrak entitas bernama dari teks informal (sesuatu yang mirip dengan tweets). Karena kapitalisasi dan tata bahasa sering kurang dalam dokumen dalam set data saya, saya mencari di luar data domain yang sedikit lebih "informal" daripada entri artikel artikel dan …
18 dataset  nlp 

3
Bagaimana cara meningkatkan pengembangan algoritma?
Dalam mengerjakan analisis data eksplorasi, dan mengembangkan algoritma, saya menemukan bahwa sebagian besar waktu saya dihabiskan dalam siklus visualisasi, menulis beberapa kode, berjalan pada dataset kecil, ulangi. Data yang saya miliki cenderung pada jenis visi komputer / jenis sensor fusi, dan algoritme yang berat untuk visi (misalnya deteksi dan pelacakan …
18 algorithms 

4
Bagaimana cara membuat anotasi dokumen teks dengan meta-data?
Memiliki banyak dokumen teks (dalam bahasa alami, tidak terstruktur), apa cara yang memungkinkan untuk membuat anotasi dengan beberapa meta-data semantik? Misalnya, pertimbangkan dokumen pendek: I saw the company's manager last day. Untuk dapat mengekstraksi informasi darinya, harus dianotasi dengan data tambahan agar tidak ambigu. Proses menemukan meta-data tersebut tidak dipertanyakan, …



3
Implementasi python fungsi biaya dalam regresi logistik: mengapa dot perkalian dalam satu ekspresi tetapi perkalian elemen-bijaksana di lain
Saya punya pertanyaan yang sangat mendasar yang berkaitan dengan Python, numpy dan perkalian matriks dalam pengaturan regresi logistik. Pertama, izinkan saya meminta maaf karena tidak menggunakan notasi matematika. Saya bingung tentang penggunaan multiplikasi matriks dot versus elemen pultiplication. Fungsi biaya diberikan oleh: Dan dengan python saya telah menulis ini sebagai …


1
Bagaimana cara menangani label string dalam klasifikasi multi-kelas dengan keras?
Saya pemula di pembelajaran mesin dan keras dan sekarang bekerja masalah klasifikasi gambar multi-kelas menggunakan keras. Input ditandai gambar. Setelah beberapa pra-pemrosesan, data pelatihan diwakili dalam daftar Python sebagai: [["dog", "path/to/dog/imageX.jpg"],["cat", "path/to/cat/imageX.jpg"], ["bird", "path/to/cat/imageX.jpg"]] "anjing", "kucing", dan "burung" adalah label kelas. Saya pikir pengkodean satu-panas harus digunakan untuk masalah ini, …

1
Apakah dimensi t-sne bermakna?
Apakah ada arti untuk dimensi embedding t-sne? Seperti halnya PCA, kami memiliki perasaan ini untuk memaksimalkan varians linear, tetapi untuk t-sne apakah ada intuisi selain hanya ruang yang kami tetapkan untuk pemetaan dan minimalisasi jarak-KL?

Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.