Pengenalan ucapan - MP3 ke perangkat lunak teks [tertutup]


16

Saya mencari program independen pembicara (komersial atau gratis) yang memungkinkan saya untuk menyalin file MP3 yang berisi rekaman pidato (terutama podcast) ke teks. Saya ingin mencoba Dragon Naturally Speaking, tetapi sepertinya itu hanya mendukung menyalin rekaman pidato saya sendiri. Jadi apa saja alternatifnya?


Komentar Avi: Saya tidak percaya itu mungkin - pembicara independen
Ivo Flipse

sistem operasi apa?
studiohack

Windows atau Linux.
pako

Jawaban:


7

Dragon Naturally Speaking akan mengimpor file mp3 dan mencoba menyalinnya. Ini lebih memilih untuk menyetel pengenalan suaranya ke speaker individu, tetapi melakukan pekerjaan yang adil tanpa penyetelan. Mungkin akan bekerja lebih baik jika speaker podcast Anda terdengar seperti Tom Brokaw.


2
Saya mencoba Dragon Naturally Speaking, tetapi itu berhasil dengan sangat baik untuk podcast dengan speaker yang tidak dikenal. Itu hanya bekerja dengan cukup baik dengan suara saya sendiri setelah pelatihan program.
pako

1
Bisakah itu juga mengimpor file audio lain dan menyalinnya?
Larry Morries

4

Salah satu solusi yang mungkin adalah mengunggah video Anda ke Youtube, dan mencoba teks otomatis yang dapat Anda aktifkan ... itu belum terlalu akurat, tetapi Anda dapat mengunduh file teks dan mengeditnya sendiri, jika itu membantu ... seperti untuk masalah hak cipta / pembajakan lagu, Anda dapat membuat video pribadi di profil Anda, jika itu mungkin?


1
@studioback: Apakah metode ini oleh Youtube hanya berlaku untuk video sendiri, bukan yang diunggah oleh orang lain?
StackExchange for All

1
@ Tim: itu untuk keduanya, sebenarnya.
studiohack

1
@studiohack: Untuk video yang diunggah oleh orang lain, bagaimana cara melakukannya? Maksud saya, tanpa mengunduh dan mengunggah sebagai video saya sendiri?
StackExchange for All

1
Pada sebagian besar video, ada ikon CC di bagian bawah, klik dan kemudian transkripsi otomatis ...
studiohack


2

Saya akan memperingatkan untuk tidak mencoba Dragon Naturally Speaking - Saya menulis beberapa skrip pada iphone saya yang sudah di-jailbreak untuk menyalin / mengonversi semua file voicemail dari ponsel saya ke folder di PC saya dan membuat layanan transkripsi Dragon Naturally Speaking berjalan melawan mereka.

Hasil menjalankan transkripsi terhadap file dengan speaker yang berbeda benar-benar tidak dapat digunakan. Saya sudah mencoba beberapa alternatif open source tetapi pengenalan suara yang independen-speaker tampaknya masih terbatas pada kamus yang sangat kecil.


1

Saya menggunakan http://www.voicebase.com dengan podcast dan video dalam bahasa Inggris dan berfungsi dengan sangat baik. Gratis selama 50 jam audio.

Anda dapat mengunduh transkripsi audio di rtf, srt atau pdf.

Anda dapat mengunduh transkripsi mesin sekitar 10-15 menit setelah mengunggah, dan terkadang, lebih awal.


1

Sumber Terbuka: CMU Sphinx

Shareware: http://www.e-speaking.com/ (Windows)

Komersial: Dragon NaturallySpeaking (Windows)

Anda juga bisa mencoba metode ini jika Anda mencoba dengan osx yang dapat dilakukan menggunakan audacity dan soundflower

Anda juga bisa menemukan beberapa link yang relevan untuk opensource lain senilai shareware untuk dicoba adalah voxcribecc

Jika Anda seorang programmer .net, Anda dapat menggunakan metode ini untuk membuat kit Anda sendiri


0

Podzinger akan menjadi solusi yang hebat, tetapi saya tidak yakin bahwa ramp (nama baru untuk perusahaan yang dulunya adalah EveryZing, yang memproduksi Podzinger) menawarkan layanan gratis lagi ...

http://en.wikipedia.org/wiki/Podzinger

Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.