HTTP tidak berfungsi seperti itu. Klien mengirim permintaan, lalu server mengirim balasan. Tidak ada komunikasi lain yang terjadi. Nah, server dapat mengirim respons informasi 1xx sebelum respons utama. Tetapi tidak ada cara bagi klien untuk mengirim pembaruan tentang permintaan yang dikirim.
(Situasinya sangat berbeda untuk HTTP / 2 yang dapat mengalikan banyak permintaan melalui koneksi yang sama. Seorang klien dapat MEMBATALKAN aliran untuk menunjukkan bahwa ia tidak lagi diperlukan setelah menerima PUSH_PROMISE dari server. Saya akan mengabaikan HTTP / 2 untuk sisa jawaban ini.)
Juga, jaringan tidak berfungsi seperti itu. Secara khusus, lihat kekeliruan kedua dari komputasi terdistribusi : "latency adalah nol". Bukan itu. Dari batas waktu satu detik itu, 400 ms mungkin telah dihabiskan untuk membangun koneksi dan mengirimkan permintaan dan 600 ms pada tanggapan, karena salah satu paket dijatuhkan dan Anda harus mengirim ulang semuanya dan klien Anda ada di Australia. Selain masalah bahwa server mungkin tidak memiliki cukup waktu, server bahkan tidak tahu berapa banyak waktu yang mereka miliki karena latensi respons tidak dapat diketahui sebelumnya.
Jadi mengingat secara harfiah menerapkan batas waktu ini tidak mungkin, solusi apa yang mungkin cukup baik?
Jika respons tidak akan memiliki nilai setelah batas waktu, klien dapat dengan mudah menutup koneksi. Ini akan menyebabkan respons Anda diabaikan, tetapi tidak akan mencegah respons.
Menutup koneksi TCP di mana permintaan HTTP dikirim tidak memberi tahu server. Tetapi pemberitahuan ini hanya datang dengan latensi, jadi mungkin sudah terlambat. Juga, kerangka kerja web Anda mungkin tidak melakukan apa-apa ketika soket klien ditutup. Dalam hal ini Anda hanya akan mendapatkan "koneksi reset oleh rekan" kesalahan setelah Anda mencoba menulis ke soket tertutup.
Jika Anda tidak ingin menghabiskan lebih dari satu detik untuk memproses respons, menerapkan batas waktu itu sepenuhnya menjadi tanggung jawab Anda, dan tidak ada hubungannya dengan jaringan atau HTTP.
Anda dapat meminta klien untuk memberikan batas waktu ke server, sehingga server dapat membatalkan jika tidak memenuhi tenggat waktu. Ini dapat ditentukan sebagai tajuk khusus, atau sebagai parameter kueri di URL. Batas waktu ini harus menjadi titik waktu absolut dan bukan durasi sehingga penundaan transmisi juga menghabiskan waktu yang tersedia. Tetapi akurasi sub-detik sulit: server dan klien harus disinkronkan dengan waktu yang tepat dan perlu menggunakan jam yang sesuai. Bergantung pada pengaturannya, setiap sumber waktu mungkin mati 100 ms meskipun dikonfigurasi dengan benar. Ini sudah memakan sebagian besar anggaran waktu Anda.