Bagaimana cara mendapatkan keluaran ucapan dari teks yang dimasukkan dengan menggunakan command-line?
Juga fasilitas untuk mengubah kecepatan bicara, nada, volume dll menggunakan perintah sederhana .
Bagaimana cara mendapatkan keluaran ucapan dari teks yang dimasukkan dengan menggunakan command-line?
Juga fasilitas untuk mengubah kecepatan bicara, nada, volume dll menggunakan perintah sederhana .
Jawaban:
Agar popularitas menurun :
katakanlah konversi teks menjadi ucapan yang dapat didengar menggunakan mesin pidato GNUstep.
sudo apt-get install gnustep-gui-runtime
say "hello"
festival Sistem sintesis bicara multi-bahasa Umum.
sudo apt-get install festival
echo "hello" | festival --tts
spd-say mengirimkan permintaan keluaran teks-ke-ucapan ke speech-dispatcher
sudo apt-get install speech-dispatcher
spd-say "hello"
espeak adalah software synthesizer ucapan multi-bahasa.
sudo apt-get install espeak
espeak "hello"
spd-say
muncul untuk pra-instal di 14,04 dan kemudian: releases.ubuntu.com/trusty/...
sudo pip install gTTS
, (Google Text to Speech / github.com/pndurette/gTTS ) maka gtts-cli "hello" -o hello.mp3
Anda dapat mengirimnyampg123 -
juga. gtts-cli "why, hello there" | mpg123 -
.
spd-say
sepertinya tidak bisa bermain tts secara bersamaan, hanya satu kali
espeak
Saya spd-say
adalah yang terbaik untuk meme (yang lain bahkan tidak bisa mengucapkan kata "meme" dengan benar). Terbaik yang bisa saya katakan spd-say
menggunakan espeak
sebagai backend (suara-suara terdengar sama).
espeak
adalah alat kecil yang bagus.
Saya hanya suka bermain-main dengannya di baris perintah. Anda mungkin menemukan itu bertentangan dengan Pulseaudio jadi saya menggunakan versi panjang lebar yang meniadakan harus mengaturnya dengan benar.
sudo apt-get install espeak
espeak --stdout "this is a test" | paplay
espeak --help
akan menunjukkan kepada Anda opsi untuk mengkalibrasi kecepatan membaca, nada, suara, dll.
Saat Anda membuat catatan, simpan sebagai file teks dan kemudian:
echo "these are my notes" > text.txt
espeak --stdout -f text.txt > text.wav
paplay text.wav # you should hear "these are my notes"
Anda kemudian dapat bermain-main dengan ffmeg et al untuk mengompresi ini dari PCM ke sesuatu yang lebih mudah dikelola seperti MP3 atau OGG. Tapi itu cerita yang berbeda.
Dari man spd-say
:
NAMA spd-say - kirim permintaan keluaran text-to-speech ke speech-dispatcher RINGKASAN spd-say [options] "some text" DESKRIPSI spd-say mengirimkan permintaan keluaran teks-ke-ucapan ke proses pengiriman-bicara yang menanganinya dan secara ideal menampilkan hasilnya ke sistem audio. PILIHAN -r, --rate Setel kecepatan bicara (antara -100 dan +100, default: 0) -p, --pitch Setel nada bicara (antara -100 dan +100, default: 0) -i, --volume Atur volume (intensitas) pidato (antara -100 dan +100, default: 0)
Karenanya Anda bisa mendapatkan text-to-speech dengan mengikuti perintah:
spd-say "<type text>"
Ex:
spd-say "Welcome to Ubuntu Linux"
Anda juga dapat mengatur kecepatan bicara, nada, volume dll. Lihat halaman manual.
spd-say -t female2 "text"
membuatnya tertahankan
Mbrola tidak berfungsi sejak pukul 11.10.
Alat SVOX (pico) mudah dipasang, mudah digunakan, dan menghadirkan suara berkualitas baik di Ubuntu. Pasang itu:
sudo apt-get install libttspico0 libttspico-utils libttspico-data
Bahkan lebih mudah, Anda dapat menggunakan LibreOffice dalam kombinasi dengan alat-alat SVOX (pico) dengan menginstal ekstensi "Baca Teks" dan Anda mendapatkan "GUI" untuk perangkat lunak TTS yang sangat baik ini:
Atur opsi Baca Ekstensi Teks dengan Alat - Add-on - Baca pilihan .... Gunakan / usr / bin / python sebagai program eksternal. Pilih opsi baris perintah yang menyertakan token (PICO_READ_TEXT_PY).
Python Google Speach:
pip install google_speech
google_speech "Test the hello world"
Svox Dari Android:
apt-get install svox-pico
pico2wave --wave=test.wav "Test the hello world"
play test.wav
Svox Nanotts:
git clone https://github.com/gmn/nanotts.git
cd nanotts
make
./nanotts -v en-US "Test the hello world"
Tautan - Wiki:
google_speech
di ubuntu 18.04 saya harus menginstal python3-pip
dan libsox-fmt-mp3
dan menggunakan pip3 install google_speech
.
Berikut ini bukan solusi FLOSS, tetapi Anda mungkin menganggapnya bermanfaat. (itu adalah solusi anggur ),
Saya pribadi sangat tertarik pada TTS, saya sering menggunakannya ... misalnya. mendengarkan wacana mengoceh yang saya tidak akan pernah repot untuk tetap dengan otherise (karena saya perlu mendapatkan secangkir kopi lagi ... :)
Beberapa hal yang saya temukan di sepanjang jalan .. atau harus saya katakan, hal-hal yang belum saya temukan di sepanjang jalan ... Terus terang: Setiap bagian dari perangkat lunak suara FOSS TTS yang saya coba berada di bawah par dan oleh karena itu tidak cocok untuk mendengarkan apa pun yang semi-berlarut-larut ...
Saat ini saya menggunakan NaturalVoices ATnT. Ini hanya tersedia untuk Windows (mungkin Mac), tetapi berjalan wine
di bawah Ubuntu .. (memiliki glytch kecil, di mana saya kadang-kadang perlu mengklik pada panel ketika saya menjauh dari pembaca ... Ini adalah minor masalah bila dibandingkan dengan keuntungan yang diperoleh oleh kualitas bicara dari NatualVoices.
Beberapa hal lain yang saya temukan sebenarnya penting untuk pengalaman mendengarkan yang setengah masuk akal, adalah ...
Program TTS ini tidak cerdas (yah mungkin sepintar babon muda) .. sehingga mereka membutuhkan setiap bantuan yang bisa mereka dapatkan. dan ada satu (dan hanya satu program Pustaka yang saya temukan yang sangat membantu dalam hal ini .. Aplikasi ini disebut ReadPlease (2003 Pro)
... Aplikasi ini memungkinkan Anda untuk memodifikasi kata dan grup kata secara khusus untuk diucapkan seperti yang Anda inginkan ... Ini tidak berarti sempurna, tetapi bagi saya, itu membuat perbedaan antara seluruh proses dapat digunakan dan tidak dapat digunakan ...
Pidato dalam Natural Voices "oke", tapi agak membosankan. Ada produk bagus lain juga, tetapi mereka semua untuk Windows, sayangnya) ..
Ini kadang mengejutkan mengejutkan .. tapi OMG, awalnya itu menyakitkan! .. jadi # 2 adalah * kesabaran ... dan banyak memperbarui daftar "kata-kata khusus" Anda ... Dengan kesabaran, maksud saya Anda (saya) benar-benar menjadi terbiasa dengan pola bicara babon khusus saya:) ... dan oleh Ngomong-ngomong, saat ini saya memiliki sekitar 3000 kata yang sekarang terdengar cukup "Manusia" sehingga saya tidak lagi merasa ngeri ketika mendengarnya.
3 .. "Ikuti Bola Memantul" ... Sekali lagi karena suaranya tidak pernah sebagus seorang pembicara sungguhan, hal-hal terkadang perlu diklarifikasi ... Program Reader yang saya gunakan memiliki satu fitur yang bahkan saya tahan dengan antarmuka yang terlihat kikuk .... Apakah memiliki opsi "pilih yang saat ini sedang dibaca" .. Banyak pembaca memiliki ini, tetapi ReadPlease tetap menggunakan baris saat ini di tengah layar .. Ini sangat berharga untuk dapat melihat ke depan dan ke belakang untuk dengan cepat membaca kembali apa yang baru saja Anda lewatkan (jadi auto-centering garis curent baik) ...
Nah itu pengalaman saya .. Saya akan membuat kopi sekarang, dan sementara saya melakukannya, saya akan mendengarkan ini, untuk melihat bagaimana "membaca" .... TTS mengejutkan baik untuk mengambil kesalahan ketik (saya membuat banyak kesalahan ketik) ...
Jika sesuatu sebagus ATnT NaturalVoices muncul di repositori Ubuntu, saya akan langsung melakukannya.
Berikut ini tautan ke beberapa contoh Suara Alami : Saya menggunakan "MIke"
Pico2wave SVOX
itulah yang saya gunakan. Dan itu terdengar alami, mudah dimengerti, ia mengenali Unit (m, ° C, kg, ...)
Inilah posting pertama saya ke pico2wave
Teks Terdengar Alami untuk Pidato?
Yang harus Anda lakukan adalah:
Buka Pusat Perangkat Lunak Ubuntu dan cari "pico". Anda akan menemukan 4 atau 5 entri dengan "Small Footprint Ling ...". Pasang mereka.
Kemungkinan penggunaan pico2wave dijelaskan dalam posting pertama saya (ikuti tautan di atas).
Sampai jumpa
Karena festival
(suaranya sepertinya lebih alami bagi saya):
sudo apt-get install festival
echo "hello" | festival --tts
Konfigurasi pitch dan kecepatan:
buat ~/.festivalrc
:
(Parameter.set 'Audio_Command "play -b 16 -c 1 -e signed-integer -r $SR -t raw $FILE tempo 1.5 pitch -100")
(Parameter.set 'Audio_Method 'Audio_Command)
Lihat juga http://www.solomonson.com/content/ubuntu-linux-text-speech
Pembaruan: dicoba di komputer ubuntu lain. Harus menginstal paket mesin pidato bahasa Inggris untuk bekerja dengan festival dengan benar:
sudo apt-get install festvox-kallpc16k
Juga play
merupakan perintah cli yang datang dengan sox
paket:
sudo apt-get install sox
Meskipun Anda sudah menerima jawaban, saya ingin menyebutkan festival
, yang saya suka juga. Posting ini di forum Ubuntu memiliki banyak informasi tentang cara mengatur suara yang sangat bagus untuk itu.
Meet espeak-ng
- Penyintesis ucapan multi-bahasa perangkat lunak:
espeak-ng "text to read"
espeak-ng -f "~/file to read"
Ini menggunakan suara bahasa Inggris default, tetapi ada banyak suara lain untuk bahasa lain dan bahkan dialek tersedia dan dapat didaftar dengan espeak-ng --voices
(untuk semua) atau misalnya espeak-ng --voices=en
(untuk bahasa Inggris). Mereka dapat diatur -v
bersama dengan singkatan bahasa atau nama file, misalnya untuk Skotlandia atau Swahili:
espeak-ng -v en-gb-scotland "text to read" # language name
espeak-ng -v bnt/sw "text to read" # file name: “bnt” for Bantu, “sw” for Swahili
Ada banyak opsi lain yang tersedia, misalnya -s
untuk kecepatan dan -w
untuk menulis output ke file wave, lihat halaman manual yang ditautkan di bawah ini.
espeak-ng
("Ng" untuk "generasi berikutnya") adalah garpu yang dikembangkan secara aktif dari espeak
perangkat lunak synthesizer ucapan asli , lihat bab History di Wikipedia . Keduanya tersedia dari sumber resmi melalui paket espeak
atau espeak-ng
masing - masing.
Balabolka di bawah Wine berfungsi dengan baik (untuk saya) dengan suara SAPI4 (suara SAPI5 tidak terdeteksi pada sistem Linux saya). Itu dapat membuka file dan mulai membaca.
Berikut ini tautan ke entri AppDB anggur untuk Balabolka: https://appdb.winehq.org/objectManager.php?sClass=application&iId=17859
Alat gTTS sangat bagus untuk menghasilkan file audio dari teks. Ia menggunakan API text-to-speech Google Translate, dan menghasilkan file mp3.
Karena itu digunakan pip
untuk instalasi, saya sangat menyarankan Anda menginstal Miniconda, dan kemudian gunakan conda
untuk membuat lingkungan tempat Anda dapat menginstal gTTS. Anda dapat mengunduh Miniconda dari sini:
https://docs.conda.io/en/latest/miniconda.html
Repositori GitHub untuk gTTS adalah:
https://github.com/pndurette/gTTS
Dan Anda dapat menemukan dokumentasi gTTS di sini: