Mengapa iterasi List lebih cepat daripada mengindeksnya?


125

Membaca dokumentasi Java untuk Daftar ADT dikatakan:

Antarmuka Daftar menyediakan empat metode untuk akses posisi (diindeks) ke elemen daftar. Daftar (seperti array Java) berbasis nol. Perhatikan bahwa operasi ini dapat dijalankan dalam waktu yang sebanding dengan nilai indeks untuk beberapa implementasi (kelas LinkedList, misalnya). Jadi, melakukan iterasi terhadap elemen dalam daftar biasanya lebih baik daripada mengindeksnya jika pemanggil tidak mengetahui implementasinya.

Apa sebenarnya artinya ini? Saya tidak mengerti kesimpulan yang diambil.


12
Contoh lain yang dapat membantu Anda memahami kasus umum ini adalah artikel Joel Spolsky "Kembali ke Dasar" - cari "Algoritme Shlemiel si pelukis".
CVn

Jawaban:


211

Dalam daftar tertaut, setiap elemen memiliki penunjuk ke elemen berikutnya:

head -> item1 -> item2 -> item3 -> etc.

Untuk mengakses item3, Anda dapat melihat dengan jelas bahwa Anda perlu berjalan dari kepala melalui setiap node sampai Anda mencapai item3, karena Anda tidak dapat melompat secara langsung.

Jadi, jika saya ingin mencetak nilai setiap elemen, jika saya menulis ini:

for(int i = 0; i < 4; i++) {
    System.out.println(list.get(i));
}

yang terjadi adalah ini:

head -> print head
head -> item1 -> print item1
head -> item1 -> item2 -> print item2
head -> item1 -> item2 -> item3 print item3

Ini sangat tidak efisien karena setiap kali Anda mengindeksnya dimulai ulang dari awal daftar dan melewati setiap item. Ini berarti kompleksitas Anda secara efektif O(N^2)hanya untuk melintasi daftar!

Jika sebaliknya saya melakukan ini:

for(String s: list) {
    System.out.println(s);
}

lalu yang terjadi adalah ini:

head -> print head -> item1 -> print item1 -> item2 -> print item2 etc.

semua dalam satu traversal, yaitu O(N).

Sekarang, pergi ke implementasi lain Listyang ArrayList, yang didukung oleh array sederhana. Dalam kasus tersebut, kedua traversal di atas setara, karena larik berdekatan sehingga memungkinkan lompatan acak ke posisi arbitrer.


29
Pemberitahuan kecil: LinkedList akan mencari dari akhir daftar jika indeks berada di paruh terakhir daftar, tetapi itu tidak benar-benar mengubah inefisiensi fundamental. Itu membuatnya hanya sedikit tidak terlalu bermasalah.
Joachim Sauer

8
Ini sangat tidak efisien . Untuk LinkedList yang lebih besar -ya, untuk yang lebih kecil dapat bekerja lebih cepat REVERSE_THRESHOLDdiatur 18 in java.util.Collections, aneh melihat jawaban yang diberi suara tinggi tanpa komentar.
bestsss

1
@DanDiplo, jika strukturnya Linked, ya itu benar. Namun, menggunakan struktur LinkedS adalah misteri kecil. Mereka hampir selalu berkinerja jauh lebih buruk daripada yang didukung array (jejak memori ekstra, lokalitas gc-unfriendly dan mengerikan). Daftar standar di C # didukung oleh array.
bestsss

3
Pemberitahuan kecil: Jika Anda ingin memeriksa tipe iterasi mana yang harus digunakan (indexed vs Iterator / foreach), Anda selalu dapat menguji apakah List mengimplementasikan RandomAccess (antarmuka penanda):List l = unknownList(); if (l instanceof RandomAccess) /* do indexed loop */ else /* use iterator/foreach */
afk5min

1
@ KK_07k11A0585: Sebenarnya loop for yang ditingkatkan dalam contoh pertama Anda dikompilasi menjadi sebuah iterator seperti pada contoh kedua, jadi mereka setara.
Tudor

35

Jawabannya tersirat di sini:

Perhatikan bahwa operasi ini dapat dijalankan dalam waktu yang sebanding dengan nilai indeks untuk beberapa implementasi (kelas LinkedList, misalnya)

Daftar tertaut tidak memiliki indeks yang melekat; memanggil .get(x)akan membutuhkan implementasi daftar untuk menemukan entri pertama dan memanggil .next()x-1 kali (untuk O (n) atau akses waktu linier), di mana daftar yang didukung array hanya dapat mengindeks ke backingarray[x]dalam O (1) atau waktu konstan.

Jika Anda melihat JavaDoc untukLinkedList , Anda akan melihat komentarnya

Semua operasi berjalan seperti yang diharapkan untuk daftar tertaut ganda. Operasi yang mengindeks ke dalam daftar akan melintasi daftar dari awal atau akhir, mana saja yang lebih dekat dengan indeks yang ditentukan.

sedangkan JavaDoc forArrayList memiliki file

Implementasi array yang dapat diubah ukurannya dari antarmuka Daftar. Menerapkan semua operasi daftar opsional, dan mengizinkan semua elemen, termasuk null. Selain mengimplementasikan antarmuka Daftar, kelas ini menyediakan metode untuk memanipulasi ukuran larik yang digunakan secara internal untuk menyimpan daftar. (Kelas ini kira-kira setara dengan Vektor, kecuali kelas ini tidak disinkronkan.)

The size, isEmpty, get, set, iterator, dan listIteratoroperasi berjalan dalam waktu yang konstan. Operasi penambahan berjalan dalam waktu konstan diamortisasi, yaitu menambahkan n elemen memerlukan waktu O (n). Semua operasi lainnya berjalan dalam waktu linier (secara kasar). Faktor konstanta lebih rendah dibandingkan dengan faktor LinkedListimplementasi.

Sebuah pertanyaan terkait berjudul "Ringkasan Big-O untuk Kerangka Koleksi Java" memiliki jawaban yang menunjuk ke sumber daya ini, "Koleksi Java JDK6" yang mungkin berguna bagi Anda.


7

Meskipun jawaban yang diterima pasti benar, bolehkah saya menunjukkan kekurangan kecil. Mengutip Tudor:

Sekarang, pergi ke implementasi List lainnya yaitu ArrayList, yang didukung oleh array sederhana. Dalam kasus tersebut, kedua traversal di atas setara , karena larik berdekatan sehingga memungkinkan lompatan acak ke posisi arbitrer.

Ini tidak sepenuhnya benar. Sebenarnya, itu

Dengan ArrayList, loop dihitung yang ditulis tangan sekitar 3x lebih cepat

sumber: Designing for Performance, dokumen Google Android

Perhatikan bahwa loop tulisan tangan mengacu pada iterasi yang diindeks. Saya menduga itu karena iterator yang digunakan dengan loop untuk ditingkatkan. Ini menghasilkan kinerja kecil dalam penalti dalam struktur yang didukung oleh array yang berdekatan. Saya juga menduga ini mungkin benar untuk kelas Vektor.

Aturan saya adalah, gunakan loop for yang disempurnakan bila memungkinkan, dan jika Anda benar-benar peduli dengan kinerja, gunakan iterasi terindeks hanya untuk ArrayLists atau Vectors. Dalam kebanyakan kasus, Anda bahkan dapat mengabaikan ini- kompilator mungkin mengoptimalkannya di latar belakang.

Saya hanya ingin menunjukkan bahwa dalam konteks pengembangan di Android, traversal ArrayLists belum tentu setara . Hanya makanan untuk dipikirkan.


Sumber Anda hanya Anndroid. Apakah ini juga berlaku untuk JVM lain?
Matsemann

Tidak sepenuhnya yakin tbh, tetapi sekali lagi, menggunakan loop untuk yang ditingkatkan harus menjadi default dalam banyak kasus.
Dhruv Gairola

Masuk akal bagi saya, menyingkirkan semua logika iterator saat mengakses struktur data yang menggunakan array bekerja lebih cepat. Saya tidak tahu apakah 3x lebih cepat, tapi yang pasti lebih cepat.
Setzer22

7

Iterasi daftar dengan offset untuk pencarian, seperti i, analog dengan algoritma Shlemiel the painter .

Shlemiel mendapat pekerjaan sebagai pelukis jalanan, melukis garis putus-putus di tengah jalan. Pada hari pertama dia membawa sekaleng cat ke jalan dan menyelesaikan 300 yard jalan. "Itu cukup bagus!" kata bosnya, "Anda pekerja yang cepat!" dan membayarnya kopeck.

Keesokan harinya Shlemiel hanya menyelesaikan 150 yard. "Yah, itu tidak sebagus kemarin, tapi kamu masih pekerja yang cepat. 150 yard cukup terhormat," dan memberinya kopeck.

Keesokan harinya Shlemiel mengecat 30 yard jalan. "Hanya 30!" teriak bosnya. "Itu tidak bisa diterima! Pada hari pertama kamu melakukan sepuluh kali lebih banyak pekerjaan! Apa yang terjadi?"

"Aku tidak bisa menahannya," kata Shlemiel. "Setiap hari aku semakin jauh dari kaleng cat!"

Sumber .

Cerita kecil ini dapat mempermudah untuk memahami apa yang terjadi secara internal dan mengapa hal itu sangat tidak efisien.


4

Untuk menemukan elemen ke-i dari sebuah LinkedListimplementasi melewati semua elemen hingga ke-i.

Begitu

for(int i = 0; i < list.length ; i++ ) {
    Object something = list.get(i); //Slow for LinkedList
}
Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.