Ini bukan jawaban sebagai komentar.
Kualitasnya tergantung pada beberapa hal, termasuk (seperti kata Aaron di atas) 1) pasangan bahasa dan 2) topik, tetapi juga 3) genera dan 4) gaya aslinya, dan 5) jumlah teks paralel yang Anda miliki untuk melatih sistem MT.
Untuk mengatur panggung, hampir semua MT hari ini didasarkan pada teks paralel, yaitu teks dalam dua bahasa yang berbeda, dengan yang satu mungkin merupakan terjemahan dari yang lain (atau keduanya merupakan terjemahan dari beberapa bahasa ketiga); dan berpotensi menggunakan kamus (mungkin dibantu oleh proses morfologis) sebagai backoff ketika teks paralel tidak mengandung kata-kata tertentu.
Selain itu, seperti yang dikatakan orang lain, sistem MT sama sekali tidak memahami teks yang diterjemahkan; hanya melihat string karakter, dan urutan kata-kata yang terdiri dari karakter, dan mencari string dan urutan yang sama dalam teks yang diterjemahkan sebelumnya. (Ok, ini sedikit lebih rumit dari itu, dan ada upaya untuk mendapatkan semantik dalam sistem komputasi, tetapi untuk saat ini sebagian besar adalah string.)
1) Bahasa bervariasi. Beberapa bahasa memiliki banyak morfologi, yang berarti mereka melakukan sesuatu dengan satu kata yang dilakukan oleh bahasa lain dengan beberapa kata. Contoh sederhananya adalah bahasa Spanyol 'cantaremos' = Bahasa Inggris "we will sing". Dan satu bahasa dapat melakukan hal-hal yang tidak mengganggu bahasa lain, seperti perbedaan informal / formal (tu / usted) dalam bahasa Spanyol, yang tidak dimiliki oleh bahasa Inggris. Atau satu bahasa dapat melakukan hal-hal dengan morfologi yang dilakukan oleh bahasa lain dengan urutan kata. Atau skrip yang digunakan bahasa mungkin bahkan tidak menandai batas kata (Cina, dan beberapa lainnya). Semakin berbeda kedua bahasa tersebut, semakin sulit bagi sistem MT untuk menerjemahkan di antara mereka. Eksperimen pertama dalam statistik MT dilakukan antara Perancis dan Inggris,
2) Topik: Jika Anda memiliki teks paralel dalam Alkitab (yang berlaku untuk hampir semua bahasa tertulis), dan Anda melatih sistem MT Anda dari itu, jangan berharap untuk melakukannya dengan baik pada teks rekayasa. (Yah, Alkitab adalah teks dalam jumlah relatif kecil menurut standar pelatihan sistem MT, tetapi berpura-pura :-).) Kosakata Alkitab sangat berbeda dari teks teknik, dan begitu juga frekuensi berbagai tata bahasa konstruksi. (Tata bahasanya pada dasarnya sama, tetapi dalam bahasa Inggris, misalnya, Anda mendapatkan lebih banyak suara pasif dan lebih banyak kata majemuk dalam teks-teks ilmiah dan teknik.)
3) Genera: Jika teks paralel Anda semuanya deklaratif (seperti manual traktor, katakanlah), mencoba menggunakan sistem MT yang dihasilkan pada dialog tidak akan memberi Anda hasil yang baik.
4) Gaya: Pikirkan Hilary vs. Donald; terpelajar vs populer. Pelatihan satu tidak akan mendapatkan hasil yang baik pada yang lain. Demikian juga pelatihan sistem MT pada novel tingkat dewasa dan menggunakannya pada buku anak-anak.
5) Pasangan bahasa: Bahasa Inggris memiliki banyak teks, dan kemungkinan menemukan teks dalam beberapa bahasa lain yang paralel dengan teks bahasa Inggris yang diberikan jauh lebih tinggi daripada kemungkinan menemukan teks paralel di, katakanlah, Rusia dan Igbo. (Yang mengatakan, mungkin ada pengecualian, seperti bahasa India.) Sebagai generalisasi besar, semakin banyak teks paralel yang Anda miliki untuk melatih sistem MT, semakin baik hasilnya.
Singkatnya, bahasa itu rumit (itulah sebabnya saya menyukainya - saya seorang ahli bahasa). Jadi tidak mengherankan bahwa sistem MT tidak selalu bekerja dengan baik.
BTW, penerjemah manusia juga tidak selalu melakukannya dengan baik. Satu atau dua dekade yang lalu, saya mendapatkan terjemahan dokumen dari penerjemah manusia ke dalam bahasa Inggris, untuk digunakan sebagai materi pelatihan untuk sistem MT. Beberapa terjemahan sulit dipahami, dan dalam beberapa kasus di mana kami mendapat terjemahan dari dua (atau lebih) penerjemah manusia, sulit untuk percaya bahwa para penerjemah telah membaca dokumen yang sama.
Dan akhirnya, hampir tidak pernah ada satu pun terjemahan yang benar; ada beberapa cara untuk menerjemahkan suatu bagian, yang mungkin lebih atau kurang baik, tergantung pada fitur apa (kebenaran tata bahasa, gaya, konsistensi penggunaan, ...) yang Anda inginkan. Tidak ada ukuran mudah "akurasi".