Apakah ArXiv populer di komunitas statistik?


25

Saya tahu bahwa komunitas fisika dan matematika sangat menyukai ArXiv, tetapi bagaimana dengan komunitas statistik? Apakah sudah biasa memposting di sana sebelum pengiriman?


Saya tidak pernah memposting di sana dan juga tidak ingat pernah mencari kertas di sana.
Christoph Hanck

@DalamNorth ya, itu akan menarik. Saya meminta keduanya karena penasaran dan karena saya baru-baru ini memposting draf "sebagaimana diajukan" di ArXiv. Bertanya-tanya apakah itu benar-benar akan mencapai bola mata ekstra ....

1
Iya nih; sebagian dari kita melihat arXiv setidaknya beberapa waktu. Saya lakukan ketika saya bisa atau ketika seseorang menunjuk saya ke sana, dan saya sering menghubungkan orang dengan kertas di sana.
Glen_b -Reinstate Monica

3
Tentukan "statistik". Di daerah tempat saya bekerja, metodologi survei, pencari saya yang naif dibilang "survei kompleks" dan "populasi terbatas" masing-masing membawa 2 dan 42 hasil pada arXiv. Setiap tahun, Bagian Metode Penelitian Survei dari Asosiasi Statistik Amerika memiliki sekitar 40 sesi pada Pertemuan Statistik Bersama, antara 1 dan 3 dalam setiap slot waktu selama 4 hari konferensi, dan dengan demikian menghasilkan setidaknya seratus makalah Prosiding. Sejauh yang saya tahu, tidak ada yang membuatnya menjadi arXiv.
Tugas

Jawaban:


19

Ya, Arxiv populer dalam statistik dan komunitas sains data.

Seiring dunia statistik dan ilmu data berkembang setiap hari, penting bagi ahli statistik dan ilmuwan data untuk tetap mahir dengan kejadian, teknik, dan algoritma terbaru.

Ini mungkin tidak sepopuler di komunitas fisika, tetapi memiliki bagian penting di dunia yang kaya data.

Anda mungkin tertarik pada Gitxiv , yang menggabungkan penelitian mutakhir dengan kode sumber terbuka / pustaka yang sesuai.


3
+1 untuk tautan ke Gitxiv ... sakit coba lihat. Apakah Anda secara teratur memeriksa ArXiv atau berlangganan salah satu daftar emailnya?

2
Dengan senang hati. Gitxiv telah membawa dunia penelitian sedikit lebih dekat ke dunia statistik dan ilmu komputer. Kudos kepada orang-orang itu. Tidak, saya tidak berlangganan milis, tetapi karena sebagian besar Machine Learning dan makalah analisis tinggal di sana, saya memeriksanya setiap minggu.
Dawny33

3
Akan lebih baik jika Anda memasukkan beberapa bukti pendukung. Sekarang hanya satu kata "Ya", dan sisanya tidak informatif (tapi Gitxiv menarik, terima kasih telah menyebutkan).
Richard Hardy

19

Saya akan memberikan jawaban yang pasti dan berdasarkan bukti. Jawabannya iya.

Lihatlah metrik Google Cendekia untuk probabilitas dan statistik, 10 sumber teratas menurut indeks-h5:

    Publication                               h5-index  h5-median
1.  Journal of Econometrics                         62  93
2.  The Annals of Statistics                        58  81
3.  arXiv Statistics Theory (math.ST)               57  80
4.  Journal of Statistical Software                 53 113
5.  arXiv Probability (math.PR)                     53  65
6.  arXiv Methodology (stat.ME)                     48  69
7.  Journal of the American Statistical Association 48  66
8.  Statistics in Medicine                          42  62
9.  Computational Statistics & Data Analysis        40  51
10. Journal of Business & Economic Statistics       39  67

Catatan, daftar ini tidak didasarkan pada jumlah publikasi, ini didasarkan pada indeks kutipan .

Indeks kutipan Google menjadi sepopuler Scopus dan Reuters (ok, saya tidak punya bukti pernyataan ini), jadi jawaban saya sama objektifnya dengan yang didapat.

Bandingkan ini dengan daftar dari Scimagojr.com tentang Statistik dan Probabilitas:

    Title   Type    SJR H index Total Docs. (2014)  Total Docs. (3years)    Total Refs. Total Cites (3years)    Citable Docs. (3years)  Cites / Doc. (2years)   Ref. / Doc. Country
1   Annals of Mathematics   j   Q1  8,551   72  46  209 1.572   647 207 3,05    34,17   US
2   Vital and health statistics. Series 10, Data from the National Health Survey    k   Q1  7,801   30  4   7   55  125 7   16,33   13,75   US
3   Journal of the Royal Statistical Society. Series B: Statistical Methodology j   Q1  6,148   90  45  99  1.507   547 94  3,09    33,49   GB
4   Annals of Statistics    j   Q1  5,602   103 64  296 2.099   809 287 2,25    32,80   US
5   Journal of Statistical Software j   Q1  5,003   64  67  220 2.540   1.364   220 3,91    37,91   US
6   Journal of the American Statistical Association j   Q1  4,162   123 106 408 3.501   907 373 1,85    33,03   US
7   Probability Surveys j   Q1  3,645   22  1   20  84  46  19  2,73    84,00   US
8   Bioinformatics  j   Q1  3,576   248 809 2.145   18.801  11.329  2.089   4,69    23,24   GB
9   Journal of Business and Economic Statistics j   Q1  3,496   66  58  146 1.464   384 139 2,21    25,24   US
10  Biometrika  j   Q1  3,342   83  58  233 1.485   369 229 1,28    25,60   GB

Ada tumpang tindih yang baik dengan daftar top 10 Google Cendekia, seperti yang Anda lihat. Daftar yang terakhir juga didasarkan pada indeks-h, tetapi ini bukan kutipan Google. Ini hanya memvalidasi tabel sebelumnya, dan kesimpulan darinya: arXiv populer di kalangan ahli statistik di dunia akademis.

SSRN adalah tempat lain untuk membuang pracetak. Ini populer di kalangan ahli ekonometrika.


+1 - Pekerjaan bagus menggunakan metrik Google! Indeks-h jelas menempatkannya di sana.

@Bey, satu hal yang harus diperhatikan: pergerakan akses terbuka. arXiv adalah tempat di mana orang membuang pracetak mereka, begitulah awalnya dalam fisika. Jadi, Anda akan melihat kertas yang sama di arXiv kemudian di Phys Rev, misalnya. Jadi arXiv awalnya diciptakan sebagai sarana untuk menyebarluaskan penelitian lebih cepat. Makalah yang bagus biasanya tidak muncul di arXiv secara eksklusif.
Aksakal

Ya. Saya biasanya hanya mengutip makalah yang saya temukan di ArXiv jika saya bisa menemukannya di jurnal yang diulas bersama. Makalah saya ada di sana sementara ia mengalami tinjauan dan pembaruan III dengan pracetak yang diterima setelah periode embargo (dengan asumsi tidak ditolak).

@Bey, sementara kita ada di sana, ada dua tempat lain di mana Anda dapat membuang pracetak Anda: RePec dan SSRN. Para ahli ekonometrika mungkin menggunakan ini lebih sering daripada arXiv
Aksakal

14

Ini bukan masalah pendapat pribadi jadi mari kita lihat beberapa angka pada istilah yang muncul di halaman arXiv (beberapa permintaan Google acak dengan beberapa istilah khusus domain):

situs validasi silang: arxiv.org kembali

Tentang 17.800 hasil

situs monte carlo: arxiv.org kembali

Sekitar 187.000 hasil

situs pengambilan sampel: arxiv.org kembali

Sekitar 141.000 hasil

situs perkiraan: pengembalian arxiv.org

Tentang 11.300 hasil

situs regresi: arxiv.org kembali

Tentang 51.100 hasil

EDIT

Seperti yang dicatat @Scortchi , arXiv memposting statistiknya sendiri. kategori stat muncul dalam laporan selama tiga tahun terakhir seperti di bawah ini:

year submissions % submissions
2014 2025        2.2% 
2013 1602        1.7%
2012 1284        1.5%

Namun ini mungkin tidak sepenuhnya mewakili konten makalah yang diterbitkan karena beberapa dari mereka mungkin sangat terkait dengan statistik tetapi ditandai sebagai domain yang berbeda (misalnya sebagai matematika atau cs ).

Juga, blog Xi'an bisa dijadikan sebagai studi kasus. Dia menulis banyak tentang statistik Bayesian dan sering menyebutkan makalah yang sudah ada (memiliki label sendiri ).

Tampaknya kami menyebutkan "arXiv" di CrossValidated dalam 689 posting dan komentar sampai sekarang (termasuk di sini).

Apakah ini membuatnya populer atau tidak? Meski begitu, sulit dikatakan, tetapi pasti ribuan makalah terkait statistik dipasang di arXiv dan popularitasnya meningkat.


3
Atau setidaknya, ribuan makalah yang menggunakan / menyebutkan metodologi statistik
Glen_b -Reinstate Monica

@ Glen_b ya, ini masalah kata kunci untuk diperiksa, tapi saya tidak melihat cara yang lebih baik untuk memeriksa apakah itu "populer".
Tim

4
'Statistik' adalah area subjek di arXiv - dengan 7.711 pengiriman hingga akhir 2014, 0,9% dari total. arxiv.org/help/stats/2014_by_area/index
Scortchi

@Scortchi Saya tidak pernah menggali terlalu dalam di situs ini, terima kasih!
Tim

+1 :) Saya tidak membayangkan pertanyaan ini sebagai latihan analisis ... tetapi Anda menemukan cara untuk mendapatkannya ... ini sangat keren :) Tidak akan mengharapkan yang kurang dari orang-orang di situs ini! Saya akan mengatakan berdasarkan @Aksakal dan analisis Anda, ArXiv berlangganan dengan cukup baik untuk statistik :-)

8

Semua jurnal yang diterbitkan oleh Institute of Mathematical Statistics (IMS) - dan itu termasuk The Annals of Statistics (salah satu jurnal statistik paling top), The Annals of Applied Statistics , dll. - secara eksplisit mendorong penulis untuk membuat pracetak pada arXiv dan Selain itu, berhati-hatilah untuk menempatkan cap pos di arXiv juga. Saya sebenarnya tidak mengetahui adanya jurnal matematika atau fisika yang mengunggah makalah ke arXiv jika penulis tidak melakukannya sendiri!

IMS mendorong semua anggota untuk memposting artikel mereka di arXiv.

( http://www.imstat.org/publications/arxiv.html )

Semua artikel IMS 2004 dan seterusnya tersedia secara bebas dalam format cetak di arXiv, serta artikel yang diposting oleh penulis.

ArXiv adalah akses terbuka, arsip elektronik lengkap dan server distribusi untuk artikel penelitian, sekarang dimiliki dan dioperasikan oleh Cornell University, dan sebagian didanai oleh NSF. Bidang utama yang dicakupnya adalah fisika, matematika, ilmu non-linear, ilmu komputer, dan biologi kuantitatif. Baru-baru ini, arXiv telah bekerja sama dengan IMS dan Bernoulli Society untuk membuka kategori statistik baru dalam matematika. Kami berharap kategori ini pada akhirnya akan tumbuh menjadi arsip tingkat atas yang dapat dibandingkan dengan misalnya matematika dan fisika.

( http://www.imstat.org/publications/eaccess.htm )

Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.