Seperti yang telah disebutkan, merekam pada 22,05 kHz untuk kata yang diucapkan tidak dengan sendirinya 'buruk'; tetapi juga tidak dapat benar-benar 'diperbaiki' karena tidak ada informasi dalam rekaman untuk ditekankan. Anda hanya dapat bekerja dengan apa yang sudah ada di sana.
Beberapa penjelasan ... Suara manusia benar-benar paling berbeda sekitar 2 - 6 kHz. Di situlah semua konsonan berada & apa yang benar-benar membantu pendengar untuk memutuskan apa yang sebenarnya dikatakan; itu juga mengapa meletakkan jari-jari Anda di telinga mengurangi daya tangkap, terutama menghalangi frekuensi yang lebih tinggi ini.
Ada informasi dalam pidato di atas 6kHz, tetapi jauh di atas itu & oleh 11kHz hanya ada sedikit informasi berguna yang tersisa.
Jadi - untuk kata yang diucapkan mereka menggunakan 22,05 kHz sebagai frekuensi sampel.
Ada analisis audio yang sangat kompleks yang disebut Nyquist-Shannon Sampling Theorem yang sering disebut sebagai Nyquist Limit, yang pada dasarnya bermuara pada
"Frekuensi audio tertinggi yang dapat direkam dalam file audio adalah setengah frekuensi pengambilan sampel."
Itu setara dengan sekitar 11kHz pada rekaman 22.05kHz.
Itu cukup untuk suara manusia.
Ini juga berarti tidak ada lagi informasi di atas yang dapat digunakan, bahkan jika Anda mengubah frekuensi sampling hingga 44,1 kHz [kualitas audio CD].
Aktif ke buku audio Anda.
Masalahnya, seperti yang saya dengar, adalah bahwa pembaca agak dekat dengan mic. Ini menekankan frekuensi yang lebih rendah, karena sesuatu yang disebut efek kedekatan . Tidak perlu membahasnya secara penuh di sini, tetapi secara keseluruhan itu membuat rekamannya sedikit lebih beradab.
Itu juga agak dikompresi - itu memiliki rentang dinamis berkurang sehingga bit yang tenang lebih keras & bit keras lebih tenang. Ini seharusnya membantu kejelasan, tetapi itu tidak dilakukan dengan sebaik yang seharusnya, & cenderung lebih menekankan bass. Satu-satunya alasan yang dapat saya pikirkan untuk melakukan ini adalah membuat pembaca terdengar "lebih jantan, lebih berwibawa" .. tetapi tidak benar-benar membantu kejelasan sedikit pun: /
Yang perlu kita lakukan adalah mengurangi bass, menekankan highs & mencoba untuk mengurangi penekanan pada beberapa kompresi berat.
Sebagian besar ini dapat dilakukan di Audacity, ke tingkat yang lebih besar atau lebih kecil, tapi saya lebih nyaman di Cubase, jadi saya akan tunjukkan di sana ...
Kebanyakan orang akan memberitahu Anda untuk Menormalkan file terlebih dahulu.
Jangan lakukan ini dulu - Anda akan membunuh ruang kepala potensial Anda.
Jika Anda perlu melakukannya sama sekali, lakukan yang terakhir .
Juga perhatikan Anda tidak dapat "membatalkan" kompresi yang telah diterapkan - yang akan setara dengan mendapatkan telur & tepung kembali dari kue panggang - sebagai gantinya Anda hanya dapat mencoba menguranginya di daerah yang paling parah terkena dampak.
Jika semua yang harus Anda kerjakan adalah Penyetaraan, maka Anda dapat mencoba mengurangi level di bawah 250Hz, dengan perlahan bergulir di bawahnya. Anda kemudian dapat mencoba mendapatkan beberapa konsonan kembali dengan menambahkan kemiringan yang berlawanan di atas mungkin 2 atau 3 kHz.
Saya melihat klik yang menjengkelkan, atau menampar bibir sekitar pukul 3:40, yang saya pilih & ditolak menjadi nol - Anda bisa mendapatkan semua yang pintar dengan de-clicker, tetapi itu tidak sepadan dengan usaha.
Senjata pilihan saya untuk operasi penyelamatan seperti ini adalah kompresor multi-band.
Saya menemukan comp multi band gratis untuk Audacity, meskipun saya belum mencobanya sendiri, jadi YMMV - https://www.gvst.co.uk/gmulti.htm
Saya menggunakan Waves LinMB yang jauh lebih mahal tetapi ide umumnya sama. Ini adalah bagaimana saya mengaturnya ...
Dari gambar, Anda dapat melihat saya memukul ujung bawah sangat keras, untuk mencoba menghapus ledakan berlebihan itu. Bagian tengah aku hampir tidak tersentuh. Tertinggi saya telah meningkatkan level output mereka, sementara pada saat yang sama menerapkan sedikit kompresi supaya beberapa S yang lebih berat dll tidak menjadi terlalu punchy. Juga, pada titik ini saya belum meningkatkan volume keseluruhan sama sekali - kami masih memiliki banyak ruang kepala untuk bermain & yang terbaik adalah ketika ketika Anda mengubah efek Anda masuk dan keluar untuk perbandingan bahwa Anda tidak hanya membodohi diri sendiri dengan volume perubahan.
Contoh cepat -
sebelum ...
https://soundcloud.com/graham-lee-15/antal-vegh-orig?in=graham-lee-15/sets/intelligibility-fix
setelah...
https://soundcloud.com/graham-lee-15/antal-vegh-linmb?in=graham-lee-15/sets/intelligibility-fix
Pada titik ini, setelah Anda puas dengan kedengarannya, sekarang Anda bisa menjadi normal.
Perhatikan contoh saya pada tingkat sampel yang lebih tinggi murni karena saya tidak dapat mengekspor langsung pada 22,05. Ini tidak secara material mempengaruhi hasil dengan cara apa pun.