Pertanyaan yang diberi tag «statistics»

Statistik adalah pendekatan ilmiah untuk inferensi dan prediksi induktif berdasarkan model probabilistik data. Dengan ekstensi, ini mencakup desain eksperimen dan survei untuk mengumpulkan data untuk tujuan ini.

1
Bagaimana cara mendapatkan korelasi antara dua variabel kategori dan variabel kategori dan variabel kontinu?
Saya sedang membangun model regresi dan saya perlu menghitung di bawah ini untuk memeriksa korelasi Korelasi antara 2 variabel kategori multi level Korelasi antara variabel kategori Multi level dan variabel kontinu VIF (variance inflation factor) untuk variabel kategori multi level Saya percaya salah menggunakan koefisien korelasi Pearson untuk skenario di …

4
Jaringan saraf: fungsi biaya manakah yang digunakan?
Saya menggunakan TensorFlow untuk eksperimen terutama dengan jaringan saraf. Meskipun saya telah melakukan beberapa percobaan (XOR-Problem, MNIST, beberapa hal Regresi, ...) sekarang, saya berjuang dengan memilih fungsi biaya "yang benar" untuk masalah tertentu karena secara keseluruhan saya dapat dianggap sebagai pemula. Sebelum datang ke TensorFlow saya mengkodekan beberapa MLP yang …

11
Ilmu Data dalam C (atau C ++)
Saya seorang Rprogrammer bahasa. Saya juga berada dalam kelompok orang yang dianggap sebagai Ilmuwan Data tetapi berasal dari disiplin akademis selain CS. Ini berfungsi dengan baik dalam peran saya sebagai Data Scientist, namun, dengan memulai karir saya Rdan hanya memiliki pengetahuan dasar tentang bahasa scripting / web lain, saya merasa …

3
Perhitungan dan Visualisasi Matriks Korelasi dengan Pandas
Saya memiliki kerangka data panda dengan beberapa entri, dan saya ingin menghitung korelasi antara pendapatan beberapa jenis toko. Ada sejumlah toko dengan data pendapatan, klasifikasi area aktivitas (teater, toko pakaian, makanan ...) dan data lainnya. Saya mencoba membuat bingkai data baru dan menyisipkan kolom dengan pendapatan semua jenis toko yang …

4
Buku tentang "Sains" dalam Ilmu Data? [Tutup]
Ditutup . Pertanyaan ini perlu lebih fokus . Saat ini tidak menerima jawaban. Ingin meningkatkan pertanyaan ini? Perbarui pertanyaan sehingga berfokus pada satu masalah hanya dengan mengedit posting ini . Ditutup 5 tahun yang lalu . Apa saja buku tentang sains dan matematika di balik sains data? Rasanya seperti begitu …

9
Ada konsol R Online?
Saya mencari konsol online untuk bahasa R. Seperti saya menulis kode dan server harus mengeksekusi dan memberi saya output. Mirip dengan situs web Datacamp.
24 r  statistics 

4
Model statistik apa yang harus saya gunakan untuk menganalisis kemungkinan bahwa satu peristiwa memengaruhi data longitudinal
Saya mencoba menemukan formula, metode, atau model yang akan digunakan untuk menganalisis kemungkinan bahwa peristiwa tertentu mempengaruhi beberapa data longitudinal. Saya mengalami kesulitan mencari tahu apa yang harus dicari di Google. Berikut ini sebuah contoh skenario: Image Anda memiliki bisnis yang memiliki rata-rata 100 pelanggan berjalan setiap hari. Suatu hari, …

4
Bagaimana cara menentukan atribut penting?
Asumsikan satu set data yang terstruktur secara longgar (misalnya tabel Web / Linked Open Data), terdiri dari banyak sumber data. Tidak ada skema umum yang diikuti oleh data dan setiap sumber dapat menggunakan atribut sinonim untuk menggambarkan nilai-nilai (misalnya "kebangsaan" vs "bornIn"). Tujuan saya adalah menemukan beberapa atribut "penting" yang …

5
Buku matematika pemula untuk Pembelajaran Mesin
Saya seorang insinyur Ilmu Komputer tanpa latar belakang statistik atau matematika tingkat lanjut. Saya sedang mempelajari buku Python Machine Learning oleh Raschka dan Mirjalili, tetapi ketika saya mencoba memahami matematika dari Machine Learning, saya tidak dapat memahami buku hebat yang disarankan seorang teman kepada saya The Elements of Statistics Learning …


3
Kapan nilai-p menipu?
Apa kondisi data yang harus kita waspadai, di mana nilai-p mungkin bukan cara terbaik untuk menentukan signifikansi statistik? Apakah ada tipe masalah spesifik yang termasuk dalam kategori ini?

1
Berapa banyak fitur untuk sampel menggunakan Hutan Acak
The Wikipedia halaman yang kutipan "The Elements of statistik Learning" kata: Biasanya, untuk masalah klasifikasi dengan fitur , ⌊ √halhalp fitur p ⌋digunakan di setiap pemisahan.⌊ hlm-√⌋⌊hal⌋\lfloor \sqrt{p}\rfloor Saya mengerti bahwa ini adalah tebakan berpendidikan yang cukup baik dan mungkin dikonfirmasi oleh bukti empiris, tetapi apakah ada alasan lain mengapa …

2
Menganalisis hasil tes A / B yang tidak terdistribusi normal, menggunakan independent t-test
Saya memiliki serangkaian hasil dari uji A / B (satu grup kontrol, satu grup fitur) yang tidak sesuai dengan Distribusi Normal. Bahkan distribusi lebih menyerupai Distribusi Landau. Saya percaya uji-t independen mensyaratkan bahwa sampel harus setidaknya terdistribusi secara normal, yang menghambat saya menggunakan uji-t sebagai metode pengujian signifikansi yang valid. …

6
Kumpulan data memahami praktik terbaik
Saya seorang mahasiswa master CS dalam penambangan data. Atasan saya pernah mengatakan kepada saya bahwa sebelum saya menjalankan classifier atau melakukan apa pun dengan dataset saya harus sepenuhnya memahami data dan memastikan bahwa data tersebut bersih dan benar. Pertanyaan saya: Apa praktik terbaik untuk memahami dataset (dimensi tinggi dengan atribut …

3
Apakah ada model bahasa out-of-the-box yang bagus untuk python?
Saya membuat prototipe aplikasi dan saya membutuhkan model bahasa untuk menghitung kebingungan pada beberapa kalimat yang dihasilkan. Apakah ada model bahasa terlatih dalam python yang bisa saya gunakan? Sesuatu yang sederhana seperti model = LanguageModel('en') p1 = model.perplexity('This is a well constructed sentence') p2 = model.perplexity('Bunny lamp robert junior pancake') …
11 python  nlp  language-model  r  statistics  linear-regression  machine-learning  classification  random-forest  xgboost  python  sampling  data-mining  orange  predictive-modeling  recommender-system  statistics  dimensionality-reduction  pca  machine-learning  python  deep-learning  keras  reinforcement-learning  neural-network  image-classification  r  dplyr  deep-learning  keras  tensorflow  lstm  dropout  machine-learning  sampling  categorical-data  data-imputation  machine-learning  deep-learning  machine-learning-model  dropout  deep-network  pandas  data-cleaning  data-science-model  aggregation  python  neural-network  reinforcement-learning  policy-gradients  r  dataframe  dataset  statistics  prediction  forecasting  r  k-means  python  scikit-learn  labels  python  orange  cloud-computing  machine-learning  neural-network  deep-learning  rnn  recurrent-neural-net  logistic-regression  missing-data  deep-learning  autoencoder  apache-hadoop  time-series  data  preprocessing  classification  predictive-modeling  time-series  machine-learning  python  feature-selection  autoencoder  deep-learning  keras  tensorflow  lstm  word-embeddings  predictive-modeling  prediction  machine-learning-model  machine-learning  classification  binary  theory  machine-learning  neural-network  time-series  lstm  rnn  neural-network  deep-learning  keras  tensorflow  convnet  computer-vision 

Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.