Saya sudah tampak gila untuk penjelasan tentang algoritma diff yang bekerja dan efisien.
Yang paling dekat yang saya dapatkan adalah tautan ini ke RFC 3284 (dari beberapa posting blog Eric Sink), yang menjelaskan secara termudah dimengerti format data di mana hasil yang berbeda disimpan. Namun, tidak disebutkan sama sekali tentang bagaimana suatu program akan mencapai hasil ini saat melakukan perbedaan.
Saya mencoba untuk meneliti ini karena keingintahuan pribadi, karena saya yakin pasti ada kompromi ketika menerapkan algoritma diff, yang kadang-kadang cukup jelas ketika Anda melihat diffs dan bertanya-tanya "mengapa program diff memilih ini sebagai perubahan bukannya itu? "...
Di mana saya dapat menemukan deskripsi algoritma yang efisien yang pada akhirnya menghasilkan VCDIFF?
Omong-omong, jika Anda menemukan deskripsi algoritma aktual yang digunakan oleh SourceGear's DiffMerge, itu akan lebih baik.
CATATAN: urutan umum terpanjang tampaknya bukan algoritma yang digunakan oleh VCDIFF, sepertinya mereka melakukan sesuatu yang lebih cerdas, mengingat format data yang mereka gunakan.