Pertanyaan yang diberi tag «parquet»

3
Apa pro dan kontra dari format parket dibandingkan dengan format lain?
Karakteristik Apache Parket adalah: Menggambarkan sendiri Format kolom Tidak tergantung bahasa Dibandingkan dengan Avro, Sequence Files, RC File dll. Saya ingin ikhtisar dari format. Saya sudah membaca: Bagaimana Impala Bekerja dengan Format File Hadoop , ini memberikan beberapa wawasan tentang format tetapi saya ingin tahu bagaimana akses ke data & …
136 file  hadoop  hdfs  avro  parquet 

1
Apa perbedaan antara Feather dan Parket?
Keduanya adalah format penyimpanan berbentuk kolom (disk-) untuk digunakan dalam sistem analisis data. Keduanya terintegrasi dalam Apache Arrow ( paket pyarrow untuk python) dan dirancang agar sesuai dengan Arrow sebagai lapisan analitik dalam memori berbentuk kolom. Apa perbedaan kedua format? Haruskah Anda selalu memilih bulu saat menangani panda jika memungkinkan? …

7
Avro vs. Parket
Saya berencana menggunakan salah satu format file hadoop untuk proyek terkait hadoop saya. Saya memahami parket efisien untuk kueri berbasis kolom dan avro untuk pemindaian penuh atau ketika kita membutuhkan semua data kolom! Sebelum saya melanjutkan dan memilih salah satu format file, saya ingin memahami apa saja kekurangan / kekurangan …
92 hadoop  avro  parquet 

5
Parket vs ORC vs ORC dengan Snappy
Saya menjalankan beberapa tes pada format penyimpanan yang tersedia dengan Hive dan menggunakan Parquet dan ORC sebagai opsi utama. Saya memasukkan ORC sekali dengan kompresi default dan sekali dengan Snappy. Saya telah membaca banyak dokumen yang menyatakan Parquet menjadi lebih baik dalam kompleksitas ruang / waktu dibandingkan dengan ORC tetapi …
88 hadoop  hive  parquet  snappy  orc 
Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.