27

Saya membaca buku: " Kode: Bahasa Tersembunyi dari Perangkat Keras dan Perangkat Lunak Komputer " dan dalam Bab 2 penulis mengatakan:

Kode Morse dikatakan kode biner (secara harfiah berarti dua oleh dua) karena komponen kode hanya terdiri dari dua hal - titik dan garis putus-putus.

Wikipedia di sisi lain mengatakan:

Sebenarnya itu bukan biner, karena ada lima elemen mendasar (lihat quinary). Namun, ini tidak berarti kode Morse tidak dapat direpresentasikan sebagai kode biner. Dalam arti abstrak, ini adalah fungsi yang dilakukan oleh operator telegraf saat mengirim pesan (lihat quinary).

Tetapi sekali lagi, halaman Wikipedia lain memasukkan Kode Morse di 'Daftar kode biner.'

Saya sangat bingung karena saya pikir Kode Morse sebenarnya adalah ternary . Anda memiliki 3 jenis 'kemungkinan': kesunyian, bunyi bip pendek atau bunyi bip panjang.

Tidak mungkin untuk mewakili Kode Morse di 'stirct binary' bukan?

Maksudnya 'binary ketat' maksud saya, pikirkan aliran biner: 1010111101010 .. Bagaimana saya bisa mewakili keheningan, bunyi bip pendek dan / atau bunyi bip panjang?

Satu-satunya cara yang dapat saya pikirkan adalah 'ukuran kata' yang diterapkan oleh komputer. Jika saya (dan CPU / juru kode) tahu bahwa itu akan membaca 8 bit setiap waktu, maka saya dapat mewakili Kode Morse. Saya hanya dapat mewakili bunyi bip pendek dengan 1 atau bunyi bip panjang dengan 0 dan diam akan secara implisit diwakili oleh panjang kata. (Katakanlah 8 bit ..) Jadi sekali lagi, saya memiliki variabel ke-3 ini / aset ke-3 dalam tanganku: ukuran kata.

Pemikiran saya seperti ini: Saya dapat memesan 3 bit pertama untuk berapa banyak bit untuk dibaca, dan terakhir 5 bit untuk kode Morse dalam kata 8bit. Seperti 00110000 berarti 'A'. Dan saya masih dalam 'biner' TETAPI saya perlu ukuran kata yang membuatnya ternary bukan? 3 bit pertama mengatakan: Baca hanya 1 bit dari 5 bit berikut.

Alih-alih biner, jika kita menggunakan trinary, kita dapat menampilkan kode morse seperti: 101021110102110222 dll. Di mana 1 adalah: dit 0 adalah: dah dan 2 adalah diam. Dengan menggunakan 222 kita dapat mengkode keheningan panjang, jadi jika Anda memiliki sinyal seperti * - * --- * - Anda dapat menampilkannya seperti: 102100022210, tetapi tidak secara langsung mungkin menggunakan hanya dengan 1 dan 0 KECUALI Anda datang dengan sesuatu seperti ukuran kata 'tetap' seperti yang saya sebutkan, tetapi ini menafsirkan, tidak menyimpan Kode Morse seperti dalam biner. Bayangkan sesuatu seperti piano, Anda hanya memiliki tombol piano. Anda ingin meninggalkan pesan dalam Kode Morse untuk seseorang dan Anda dapat melukis tombol menjadi hitam. Tidak mungkin Anda bisa meninggalkan pesan yang jelas, bukan? Anda membutuhkan setidaknya satu warna lagi sehingga Anda dapat menempatkan keheningan (yang antara karakter dan kata-kata. Inilah yang saya maksud dengan trenary.

Saya tidak bertanya apakah Anda dapat mewakili Kode Morse di 57-ary atau apa pun.

Saya telah mengirim email kepada penulis (Charles Petzold) tentang ini; dia mengatakan bahwa dia menunjukkan dalam Bab 9 dari "Kode" bahwa Kode Morse dapat diartikan sebagai kode biner.

Di mana saya salah dengan pemikiran saya? Apakah yang saya baca di buku, bahwa Kode Morse menjadi Biner fakta atau tidak? Apakah ini bisa diperdebatkan? Mengapa Kode Morse dikategorikan dalam satu halaman Wikipedia, dan juga tercantum dalam halaman Daftar Kode Biner ?

Sunting: Saya telah mengirimkan email kepada penulis dan mendapat balasan:

-----Pesan asli-----

Dari: Koray Tugay [mailto: koray@tugay.biz]

Terkirim: Selasa, 3 Maret 2015 15:16

Ke: cp@charlespetzold.com

Subjek: Apakah Kode Morse benar-benar biner?

Pak, dapatkah Anda melihat pertanyaan saya di sini: Apakah Kode Morse biner, ternary atau quinary? Quinary?

Salam, Koray Tugay

Dari: "Charles Petzold"

Kepada: "'Koray Tugay'"

Subjek: RE: Apakah Kode Morse benar-benar biner? Tanggal: 3

Mar 2015 23:04:35 EET

Menjelang akhir Bab 9 dalam "Kode" saya menunjukkan bahwa Kode Morse dapat diartikan sebagai kode biner.

-----Pesan asli-----

Dari: Koray Tugay [mailto: koray@tugay.biz]

Terkirim: Selasa, 3 Maret 2015 15:16

Ke: cp@charlespetzold.com

Subjek: Apakah Kode Morse benar-benar biner?

Pak, dapatkah Anda melihat pertanyaan saya di sini: Apakah Kode Morse biner, ternary atau quinary? Quinary?

Salam, Koray Tugay

Saya tidak menyembunyikan e-mailnya karena sangat mudah ditemukan di web.

information-theory coding-theory encoding-scheme

— Koray Tugay
sumber

Silakan pindahkan percakapan lebih lanjut ke chat.stackexchange.com/rooms/21638/…

— Wandering Logic

Komentar bukan untuk diskusi panjang; percakapan ini telah dipindahkan ke obrolan .

— Raphael

Saya memperbaiki tautan yang saya hapus secara tidak sengaja (ups); tolong jangan mulai memutar balik ke revisi yang lebih buruk.

— Raphael

1

@WanderingLogic Pendekatan yang benar, paling efektif, dan bebas noise adalah menandai pertanyaan untuk pembersihan komentar secara diam-diam dan menyarankan agar komentar dipindahkan ke obrolan di flag, bukan untuk bermain di depan umum, komentar polisi dan berupaya membuat ruang obrolan untuk menggabungkan semua komentar pada semua jawaban tanpa konteks. Tautan Anda sekarang juga hanya membingungkan masalah ini karena Raphael telah memposting tautan yang benar.

— Jason C

1

@ J.-E.Pin Yah, saya tidak memberikan definisi formal karena saya menerima begitu saja bahwa orang yang menjawab pertanyaan akan tahu itu, dan saya memang punya satu atau dua referensi ke wikipedia untuk mengatur konteks. Bahkan jika wikipedia bisa jauh dari sempurna, ini harus dapat mengambil peran definisi, seperti yang sering dilakukan di sini. Butuh beberapa waktu bagi saya untuk menyadari bahwa itulah masalahnya, yang ternyata tersebar luas. Saya sendiri dalam proses menulis ulang semuanya panjang lebar, dengan definisi eksplisit, kutipan, referensi, dan penjelasan formal dengan homomorfisme suntik. Haruskah saya menyelesaikannya?

— babou

19

Kode morse adalah kode ternary awalan (untuk enkode 58 karakter) di atas kode biner awalan yang menyandikan tiga simbol.

Ini adalah jawaban yang jauh lebih pendek ketika diterima. Namun, mengingat kesalahpahaman yang cukup besar antara pengguna, dan mengikuti permintaan dari OP, saya menulis jawaban yang jauh lebih lama ini. Bagian "singkatnya" memberi Anda inti dari itu.

Isi

Singkatnya (besar)

Saat bertanya "Apakah Kode Morse biner, ternary atau quinary?" tidak ada yang membandingkan jawaban yang mungkin kecuali seseorang memperbaiki beberapa kriteria untuk jawaban yang dapat diterima. Memang, tanpa kriteria yang tepat, orang dapat menyusun penjelasan untuk hampir semua jenis struktur. Kriteria yang saya pilih adalah sebagai berikut:

itu harus mencerminkan deskripsi tiga lapis kode Morse dengan representasi dot / dash di tingkat kedua;
harus sesuai dengan alat presentasi dan matematika yang dikembangkan untuk analisis kode secara teoritis, sebanyak mungkin;
itu harus sesederhana mungkin;
itu harus jelas menunjukkan sifat-sifat kode Morse.

Ini dimaksudkan untuk mencegah peretasan sewenang-wenang, yang mengabaikan konsep dasar teori kode sebagaimana dipelajari secara ilmiah, dan yang mungkin memiliki daya tarik dengan memberikan ilusi analisis sistematis, meskipun ditangani terlalu informal untuk meyakinkan. Situs ini seharusnya tentang ilmu komputer , bukan pemrograman. Kita harus menggunakan minimal ilmu pengetahuan mapan dan konsep yang diterima untuk menjawab pertanyaan teknis.

Analisis cepat dari standar menunjukkan bahwa semua simbol yang digunakan dalam kode Morse pada akhirnya dikodekan dalam biner , karena ia ditransmisikan sebagai string unit dengan panjang yang sama, dengan sinyal yang dapat hidup atau mati untuk setiap unit. Ini menunjukkan bahwa pesan Morse pada akhirnya dikodekan dalam alfabet logis . $\Sigma_1=\{0,1\}$

Tapi itu tidak mengatakan apa pun tentang struktur internal kode. Informasi yang akan dikodekan adalah string pada alfabet 58 simbol (sesuai standar) termasuk 57 karakter dan spasi. Ini sesuai dengan alfabet , symbl terakhir adalah spasi. $\Sigma_3=\{A,B,\dots,Z,0,1,\dots,9,?,=,\dots,\times,@,[\;]\}\;$

Namun, standar menentukan bahwa ada alfabet menengah , berdasarkan dan dan mungkin simbol lainnya. Cukup jelas $\Sigma_2$ dotdash

string di harus dikodekan sebagai string di , dan $\Sigma_3^*$ $\Sigma_2^*$
string di harus dikodekan sebagai string di $\Sigma_2^*$ $\Sigma_1^*$

Jadi, mengingat bahwa tidak ada pilihan untuk dan , pertanyaannya harus dipahami sebagai: " Berapa jumlah simbol yang harus kita pertimbangkan dalam alfabet menengah sehingga dapat dengan baik menjelaskan struktur dan properti seluruh Morse kode, "yang juga mensyaratkan menentukan dua pengkodean antara tiga level. $\Sigma_1$ $\Sigma_3$ $\Sigma_2$

Mengingat fakta bahwa kode Morse adalah awalan homomorphic (panjang variabel) kode yang menghalangi setiap ambiguitas ketika decoding sinyal, kita bisa menjelaskan hanya properti penting ini dengan terner alfabet { , , }, dan dua skema pengkodean dari ke , dan dari ke , yang keduanya homomorfik dan awalan, dengan demikian keduanya kode yang tidak ambigu, dan dengan demikian dapat dikomposisi untuk memberikan awalan yang tidak ambigu. pengkodean 58 simbol ke dalam biner. $\Sigma_2=$ dotdashsep $C_{3\to 2}$ $\Sigma_3$ $\Sigma_2$ $C_{2\to 1}$ $\Sigma_2$ $\Sigma_1$

Oleh karena itu kode Morse terdiri dari kode awalan terner dinyatakan dalam alfabet , , , dengan tiga simbol-simbol ini sendiri dikodekan dalam biner dengan codeword berikut: $\{$ dotdashsep $\}$

dot $\to 10$ , , dandash $\to 1110$ sep $\to 00$

Perhatikan bahwa apa yang dikenal sebagai ruang antara berturut-turut dotatau dashsebenarnya termasuk dalam representasi dotdan dash, karena ini adalah representasi matematis biasa untuk jenis kode semacam itu, yang biasanya didefinisikan sebagai string homomorfisme dari simbol sumber ke kode sumber yang diekspresikan dengan simbol target, seperti yang baru saja saya lakukan.

Ini sedikit berbeda dari beberapa presentasi yang diberikan dalam standar, yang lebih bertujuan menentukan secara intuitif kode untuk pengguna, daripada menganalisisnya untuk sifat strukturalnya. Tetapi pengkodeannya sama dalam kedua kasus.

Bahkan tanpa penetapan waktu yang tepat dari standar, decoder dari sinyal analog masih dapat menerjemahkannya ke dalam alfabet ternary yang kami sarankan, sehingga pemahaman di atas tentang kode ternary tetap valid.

Kode: poin dasar

Jawaban ini didasarkan pada Standar ITU-R M.1677-1 , tertanggal Oktober 2009 (terima kasih kepada Jason C untuk referensi). Saya akan menggunakan terminologi dotdan dash, bukannya ditdan dah, karena terminologi yang digunakan oleh standar ini.

Sebelum kita mulai membahas kode Morse, kita perlu menyepakati apa itu kode. Diskusi sulit tentang pertanyaan ini jelas membutuhkannya.

Pada dasarnya, informasi perlu diwakili agar dapat dikirim atau diproses. Kode adalah sistem untuk menerjemahkan informasi dari satu sistem representasi ke yang lain . Ini adalah definisi yang sangat umum. Kita harus berhati-hati untuk tidak membingungkan konsep representasi , dan bahwa kode dari satu representasi ( sumber ) ke yang lain ( target ).

Representasi dapat mengambil banyak bentuk, seperti tegangan listrik variabel, titik-titik berwarna di atas kertas, string karakter, angka, string biner 0 dan 1, dll. Penting untuk membedakan antara representasi analog dan formal (atau logis, atau abstrak) .

Representasi analog / fisik adalah gambar, level tegangan yang bervariasi, bentuk (untuk huruf).

Representasi logis / formal / abstrak adalah representasi matematis dengan grafik abstrak, string simbol, atau entitas matematika lainnya.

Meskipun beberapa informasi mungkin awalnya analog, kami biasanya mengubahnya menjadi representasi logis sehingga dapat mendefinisikan secara tepat pemrosesan dengan cara matematika, atau oleh orang-orang.

Sebaliknya, kita berurusan dengan representasi logis menggunakan perangkat fisik, seperti komputer atau pemancar, kita perlu memberikan bentuk analog ke representasi logis.

Untuk keperluan analisis ini, satu-satunya bentuk analog yang kami pertimbangkan adalah yang digunakan untuk transmisi, seperti yang dijelaskan dalam standar. Tetapi meskipun begitu, kami akan mempertimbangkan bahwa langkah pertama adalah menafsirkan representasi analog ini sebagai implementasi langsung dari representasi logis terstruktur yang identik, di mana kami membangun analisis kami tentang apa jenis kode kode Morse. Teori kode adalah badan pengetahuan matematika yang didasarkan pada analisis representasi logis.

Namun kita akan kembali pada transisi analog / logis dalam diskusi di akhir.

Kode: definisi

Pandangan logis kami adalah bahwa kode yang digunakan untuk menerjemahkan sumber string pada sumber alfabet untuk target alfabet . Sering terjadi bahwa kedua huruf identik, biasanya biner, ketika tujuannya adalah untuk menambahkan beberapa properti tambahan ke representasi informasi, seperti membuatnya lebih tahan terhadap kesalahan (deteksi dan koreksi kesalahan), atau membuat representasi lebih kecil dengan menghapus redundansi (kompresi kode lossless) dan mungkin dengan hilangnya beberapa informasi secara terkontrol (kompresi lossy). $S$ $T$

Namun, tujuan dari kode Morse adalah hanya menyediakan cara untuk merepresentasikan string pada alfabet besar, menjadi string yang didasarkan pada alfabet yang jauh lebih kecil (sebenarnya biner), menggunakan alfabet menengah hampir biner (titik dan garis) untuk lebih disesuaikan dengan manusia. persepsi dan kemampuan manipulatif. Ini dicapai dengan apa yang disebut kode panjang variabel :

Menggunakan istilah-istilah dari teori bahasa formal, definisi matematika yang tepat adalah sebagai berikut: Biarkan dan menjadi dua set yang terbatas, masing-masing disebut sumber dan target huruf. Kode adalah fungsi total yang memetakan setiap simbol dari ke urutan simbol di atas , dan ekstensi ke homomorfisme ke , yang secara alami memetakan setiap urutan simbol sumber ke urutan simbol target, disebut sebagai ekstensi. $S$ $T$ $C: S \to T^*$ $S$ $T$ $C$ $S^*$ $T^*$

Kami panggilan codeword gambar dari simbol . $C(s)\in T^*$ $s\in S$

Kode panjang variabel dapat didekodekan secara unik jika homomorfisme ke bersifat injeksi . Itu berarti bahwa setiap string di dapat menjadi gambar paling banyak satu string di . Kita juga mengatakan bahwa kodenya tidak ambigu , artinya string apa pun dapat didekodekan secara pasti, jika ada. $C$ $S^*$ $T^*$ $T^*$ $S^*$

Kode panjang variabel adalah kode awalan jika tidak ada codeword yang merupakan awalan dari yang lain. Itu juga kode instan sekutu , atau kode bebas konteks . Alasan untuk nama-nama ini adalah bahwa, ketika membaca string target yang dimulai dengan codeword dari kode awalan, Anda mengenali akhir codeword segera setelah Anda membaca simbol terakhirnya, tanpa harus tahu / membaca simbol berikutnya. Sebagai akibatnya, kode awalan tidak ambigu dan sangat mudah untuk didekodekan dengan cepat. $w$

Mudah ditunjukkan bahwa dekodabilitas unik dan properti awalan ditutup di bawah komposisi kode.

Perhatikan bahwa definisi sebagai homomorfisme menyiratkan bahwa tidak ada pemisahan khusus antara codewords. Ini adalah struktur mereka, seperti properti awalan, yang memungkinkan mengidentifikasi mereka secara jelas.

Memang, jika ada simbol pemisahan seperti itu, mereka harus menjadi bagian dari alfabet target, karena mereka akan perlu untuk memecahkan kode string dari alfabet target. Maka akan sangat sederhana untuk kembali ke model teoritis kode panjang variabel dengan menambahkan pemisah ke kata kode sebelumnya. Jika itu meningkatkan kesulitan kontekstual (misalnya misalnya untuk beberapa pemisah), itu hanya akan menjadi petunjuk bahwa kode lebih kompleks daripada yang terlihat. Ini adalah alasan yang baik untuk tetap berpegang pada model teoritis yang dijelaskan di atas.

Kode Morse

Kode Morse dijelaskan dalam standar pada tiga tingkat:

3. itu dimaksudkan untuk menyediakan penyandian teks bahasa alami, menggunakan 57 karakter (27 huruf, 10 digit, 20 simbol dan ponctuations) dan ruang antar kata untuk memotong string karakter menjadi kata-kata. Ruang antar kata digunakan seperti karakter khusus, yang dapat dicampur dengan yang lain, yang akan saya perhatikan SEP.
2. semua karakter ini harus dikodekan sebagai suksesi dash dan dot, menggunakan ruang antar huruf, yang akan saya catat sep, untuk memisahkan dashdan dotdari satu huruf dari orang-orang dari surat berikutnya.
1. The dashdan dot, serta sepharus dikodekan sebagai sinyal atau tidak adanya sinyal (disebut spasi) dengan panjang tepat didefinisikan dalam hal beberapa satuan diterima. Secara khusus, dashdan dot pengkodean surat harus dipisahkan oleh ruang antar-elemen, yang akan saya perhatikan σ.

Ini sudah membutuhkan beberapa kesimpulan.

Pesan yang akan dikirim dan diterima dalam bentuk analog adalah suksesi satuan panjang (panjang ruang atau panjang waktu), sehingga sinyal mati untuk seluruh durasi masing-masing unit sebagaimana ditentukan dalam Lampiran 1, Bagian I, bagian 2 standar :

2   Spacing and length of the signals
2.1 A dash is equal to three dots.
2.2 The space between the signals forming the same letter is equal to one dot.
2.3 The space between two letters is equal to three dots.
2.4 The space between two words is equal to seven dots.

Ini jelas merupakan penyandian analog dalam apa yang dikenal sebagai bit stream, yang secara logis dapat direpresentasikan dalam notasi biner oleh string 0ans 1, yang merupakan singkatan dari analog on dan on .

Untuk mengabstraksi isu-isu terkait dengan representasi analog, kita dapat mempertimbangkan bahwa pesan kode Morse ditransmisikan sebagai string bit, yang akan kita perhatikan dengan 0dan 1.

Oleh karena itu kutipan di atas dari standar dapat dinyatakan secara logis sebagai:

0. A dotdiwakili oleh 1.
1. A dashdiwakili oleh 111.
2. Ruang antar-elemen σdiwakili oleh 0.
3. Ruang antar huruf sepdiwakili oleh 000.
4. Ruang antar kata SEPdiwakili oleh 0000000.

Jadi kita bisa melihat kode Morse menggunakan 5 kata kode dalam biner untuk menyandikan 5 simbol ini. Kecuali untuk fakta bahwa ini tidak cukup bagaimana sistem dijelaskan, ada beberapa lebih untuk itu, dan itu bukan cara yang paling nyaman dapat dipikirkan, dari sudut pandang naif atau matematika.

Perhatikan juga bahwa deskripsi ini ditujukan untuk orang awam, bukan spesialis teori kode. Untuk alasan itu lebih menggambarkan penampilan yang terlihat daripada struktur internal yang membenarkannya. Tidak ada alasan untuk menghalangi deskripsi lain yang kompatibel dengan yang satu ini, meskipun secara matematis lebih terstruktur, untuk menekankan sifat-sifat kode.

Tetapi pertama-tama, kita harus mencatat bahwa deskripsi lengkap kode melibatkan 3 level representasi, yang langsung dapat dikenali:

3. Teks, terdiri dari serangkaian karakter, termasuk SEP.
2. Pengkodean string surat sebagai string dot, dashdan sep.
1. Pengkodean string level 2 dari ketiganya symbolssebagai string biner.

Kita mungkin dapat mendiskusikan mengenai simbol apa yang dikodekan dalam apa, tetapi itu merupakan aspek penting dari kode Morse yang memiliki tiga level representasi ini, dengan karakter di atas, dotdan dashdi tengah, dan bit 0dan 1di bawah .

Ini menyiratkan bahwa ada dua kode, satu dari level 3 ke level 2, dan yang lainnya dari level 2 ke level 1.

Menganalisa tiga level representasi

Untuk memiliki analisis yang konsisten dari sistem pengkodean 3 tingkat ini, pertama-tama kita harus menganalisis jenis informasi apa yang relevan di setiap tingkat.

1. Bit string, menurut definisi, dan oleh kebutuhan representasi analognya, hanya terdiri dari 0dan 1.
3. Pada level teks, kita membutuhkan dan alfabet 58 simbol, termasuk 57 karakter dan ruang antar kata SEP. Semua 58 dari mereka harus memiliki akhirnya pengkodean biner. Tetapi, meskipun standar kode Morse menentukan 57 + 1 karakter ini, itu tidak menentukan bagaimana mereka harus digunakan untuk menyandikan informasi. Itulah peran bahasa Inggris dan bahasa alami lainnya. Kode Morse menyediakan alfabet 58 simbol kepada sistem lain, yang dengannya mereka dapat membangun beberapa kode 58-ary, tetapi kode Morse sendiri bukan kode 58-ary.
2. Pada tingkat dotdan dash, yang kita butuhkan adalah dua simbol ini untuk mengkodekan 57 karakter, yaitu memberikan codeword untuk masing-masing sebagai string dotdan dash, bersama dengan beberapa pemisah sepuntuk menandai ketika satu huruf selesai, dan awal yang lain. Kami juga membutuhkan beberapa cara untuk menyandikan ruang antar kata SEP. Kami mungkin mencoba menyediakannya secara langsung di tingkat 1, tetapi ini akan mengacaukan organisasi kode yang terstruktur.

Memang, deskripsi standar mungkin benar dikritik karena melakukan hal itu. Tetapi penulis mungkin berpikir bahwa presentasi mereka akan lebih mudah dipahami oleh pengguna biasa. Juga mengikuti deskripsi tradisional kode Morse, yang ada sebelum analisis matematika.

Ini membutuhkan beberapa komentar:

pada level 3, level huruf, ruang antar huruf septidak lagi berarti. Ini cukup normal, karena tidak memiliki makna lebih di jagat raya daripada ruang yang memisahkan dua karakter tertulis di atas kertas. Adalah penting pada level 2 untuk mengenali kata sandi yang mewakili huruf-huruf itu, tetapi itu saja.
sama halnya pada level 2, ruang antar-elemen σtidak lagi bermakna. Itu tidak ada artinya di dunia dotdan dash, tetapi hanya diperlukan pada tingkat 1 untuk mengidentifikasi kata-kata kode biner yang mewakili dot, dash. Tetapi pada level 1, itu tidak dapat dibedakan dari bit 0.

Jadi ruang antar-elemen σtidak lagi spesial. Ini hanya satu penggunaan 0.

Namun, seperti yang dijelaskan sebelumnya, jika kode akan dianalisis menggunakan pengetahuan kode panjang variabel, pemisah harus ditambahkan ke dalam codeword yang mereka ikuti, sehingga dapat mendefinisikan kode sebagai string sederhana homomorfisme. $\Sigma_2^*\to\Sigma_1^*$

Ini menyiratkan spesifikasi parsial kode berikut: dandot $\to$ 10dash $\to$ 1110

Alfabet tingkat 2 membutuhkan setidaknya satu simbol lain, ruang antar-huruf dicatat , yang harus sesuai dengan huruf standar. Namun, definisi kode panjang variabel sebagai homomorfisme diperlukan menambahkan ruang antar-elemen untuk setiap codeword untuk dan . Oleh karena itu kita harus memiliki hanya sebagai kata sandi untuk , sehingga untuk mendapatkan akhir dari sebelumnya atau , itu membuat 3 seperti yang dipersyaratkan oleh standar. Ini selalu berhasil karena tidak ada ketentuan dalam standar untuk memiliki dua pemisah antar surat yang saling mengikuti. $\Sigma_2$ sep0000dotdash00sep0dotdash0

Ini cukup untuk mengkodekan alfabet { , , } dengan kode homomorphic didefinisikan sebagai berikut: $\Sigma_2=$ dotdashsep $C_{2\to 1} : \Sigma_2\to\Sigma_1^*$

dot $\to$ 10
dash $\to$ 1110
sep $\to$ 00

Dan kami memiliki kejutan yang baik untuk menemukan bahwa tidak ada kata sandi adalah awalan dari yang lain. Karenanya kami memiliki kode awalan, yang tidak ambigu dan mudah didekode.

Kita sekarang dapat melanjutkan dengan cara yang sama untuk mendefinisikan kode . $C_{3\to 2}: \Sigma_3\to\Sigma_2^*$

Standar menggunakan string dotdan dashsebagai codeword untuk karakter dalam , dengan cara yang diberikan oleh tabel standar misalnya untuk mewakili huruf . $\Sigma_3$ dot dot dash dot $f$

Sekali lagi, codeword ini dipisahkan oleh spasi antar huruf. Untuk mendefinisikan kode sebagai homomorfisma, kita harus memasukkan pemisah dalam codewords, sehingga definisi homomorfisma menjadi: $f\to$ dot dot dash dot sep

Ini berlaku untuk masing-masing dari 57 karakter dalam alfabet . Tetapi sekali lagi kita juga membutuhkan kata separator , yang, menurut standar, adalah . Pertama-tama kita perhatikan bahwa sudah 3 bit disediakan oleh kode, 2 oleh yang mengakhiri huruf terakhir kata, dan 1 oleh bit yang mengakhiri yang terakhir atau dari pengkodean huruf terakhir itu. Karenanya akhirnya harus dikodekan sebagai yang tersisa . $\Sigma_3$ SEP00000000sep0dotdashSEP0000

Tetapi untuk menghormati pendekatan berjenjang, SEPharus dikodekan dalam beberapa codeword dari . Karena biner dikodekan sebagai , maka dapat dikodekan sebagai . $\Sigma_2^*$ sep00SEPsep sep

Karenanya kita dapat menyandikan alfabet , dengan kode homomorfik didefinisikan sebagai berikut: $\Sigma_3=\{A,B,\dots,Z,0,1,\dots,9,?,=,\dots,\times,@,$ SEP $\}$ $C_{3\to 2} : \Sigma_3\to\Sigma_2^*$

$A \to$ dot dash se p
$B \to$ dash do t dot dot sep ...
$Z \to$ dash dash dot dot sep ...
$7 \to$ dash dash dot dot dot sep ...
SEP $\to$ sep sep (untuk pemisah kata)

Dan kami memiliki kejutan lebih lanjut untuk melihat bahwa tidak ada kata sandi adalah awalan dari yang lain. Karenanya kode juga merupakan kode awalan. $C_{3\to 2}$

Karena properti awalan ditutup di bawah komposisi kode, kode Morse adalah kode awalan. $C_{Morse}= C_{2\to 1}\circ C_{3\to 2}$

Dengan demikian dapat disimpulkan bahwa kode Morse dapat dipahami, dan mudah dianalisis, sebagai komposisi awalan biner pengkodean dari 3 simbol alfabet { dot, dash, sep} menjadi alfabet biner, dan awalan pengkodean dari alfabet 58 simbol (57 karakter dan satu spasi) ke dalam 3 huruf alfabet.

Komposisi itu sendiri adalah pengkodean awalan dari 58 simbol menjadi representasi biner.

Keterangan tentang analisis ini.

Selalu sulit untuk menetapkan bahwa presentasi struktur adalah yang terbaik yang dapat dihasilkan. Namun tampaknya bahwa analisis di atas memenuhi kriteria yang ditetapkan pada awal jawaban ini: kedekatan dengan definisi 3-tier, secara formal disajikan sesuai dengan teori pengkodean saat ini, kesederhanaan, dan membuktikan sifat-sifat utama kode.

Perhatikan bahwa ada gunanya mencari properti koreksi kesalahan. Kode Morse bahkan mungkin tidak mendeteksi kesalahan bit tunggal karena hanya dapat mengubah dua dotmenjadi satu dash. Namun, itu hanya menyebabkan kesalahan lokal.

Mengenai kompresi, pengkodean terner dirancang untuk kira-kira mengurangi jumlah titik dan garis, dalam jenis pendekatan Huffman coding . Tetapi dua kode yang disusun dapat dengan mudah dibuat lebih padat.

Mengenai ukuran huruf, tidak ada pilihan untuk biner dan alfabet simbol 58. Alfabet menengah dapat berisi lebih banyak simbol, tetapi apa tujuannya?

Namun, beberapa orang akan cenderung mengenali ruang DETdi level 2, sehingga membuat kuarterner alfabet , kemudian menggunakannya langsung di level 3, dikodekan sebagai dirinya sendiri di level 2.

Ini akan memenuhi definisi standar, untuk DETdikodekan dalam biner sebagai 0000. Tetapi itu akan mencegah analisis dari binary encoding sebagai kode awalan, membuatnya lebih sulit untuk menunjukkan bahwa adalah kode awalan, karenanya tidak ambigu. $C_{2\to 1}$ $C_{Morse}$

Memang, pilihan seperti itu akan membuat string biner 0000ambigu, dapat didekodekan sebagai salah satu SEPatau sep sep. Ambiguitas harus diselesaikan dengan aturan kontekstual yang septidak dapat mengikuti dirinya sendiri, membuat formalisasi menjadi lebih kompleks.

Pentingnya transisi analog ke logis.

Analisis ini sangat bergantung pada fakta bahwa penguraian sinyal on / off menjadi satuan dengan panjang yang sama menunjukkan dengan jelas representasi analog dari string biner. Selain itu, panjang dalam satuan tepat untuk analisis di atas, yang tampaknya tidak mungkin terjadi secara kebetulan (meskipun mungkin).

Namun, dari pandangan (terlalu sepintas) pada paten asli 1647 , tampaknya tidak begitu tepat, dengan kalimat-kalimat seperti (di atas halaman 2):

Tanda angka yang berbeda, atau angka majemuk ketika digunakan dalam kalimat kata atau angka, terdiri dari jarak atau ruang pemisahan antara karakter yang lebih besar dari jarak yang digunakan untuk memisahkan karakter yang menyusun setiap perbedaan tersebut. atau angka majemuk.

Orang-orang yang belakangan mengirim dengan tangan atau menerima dengan telinga juga tidak mungkin setepat itu. Memang, tinju mereka , yaitu waktu mereka, sering dikenali. Pandangan ini juga didukung oleh fakta bahwa panjang spasi tidak selalu dihormati , terutama ketika mempelajari kode Morse.

Situasi ini sesuai dengan tampilan analog kode sebagai sinyal pendek (titik), sinyal menengah (tanda hubung), dan jeda pendek, sedang dan panjang. Transposisi langsung ke alfabet logis secara alami akan memberikan alfabet kueri , di mana 58 simbol harus dikodekan. Ini tentu saja bukan lagi presentasi 3-tingkat dari kode Morse.

Namun, untuk masuk akal (dan mungkin menghindari ambiguitas), alfabet ini harus digunakan dengan kendala bahwa dua simbol sinyal ( dotatau dash) tidak dapat saling mengikuti, dan bahwa simbol jeda tidak dapat saling mengikuti. Analisis kode dan sifat-sifatnya akan dibuat lebih kompleks, dan cara alami untuk menyederhanakannya adalah dengan melakukan apa yang dilakukan: memperkenalkan penentuan waktu yang tepat untuk mengubahnya menjadi komposisi dua kode, yang mengarah ke analisis yang cukup sederhana yang diberikan di atas ( ingat bahwa itu termasuk menunjukkan kode awalan).

Selain itu, tidak sepenuhnya diperlukan untuk mengikuti pengaturan waktu yang tepat dalam representasi analog. Karena decoder dari terjemahan analog dapat membedakan jeda pendek, sedang dan panjang, dengan cara apa pun, seharusnya hanya meniru apa yang dilakukan dalam kasus biner. Karenanya sinyal pendek dan sedang (harus diikuti dengan jeda) diakui sebagai logis dotatau dash. Jeda singkat dilupakan, karena hanya melayani untuk menandai akhir dotatau dash. Jeda sedang diakui sebagai sep, dan jeda panjang diakui sebagai dua sepberturut-turut. Karenanya sinyal analog direpresentasikan dalam alfabet terner, yang dapat digunakan seperti sebelumnya untuk mengkodekan 58 simbol alfabet. Analisis awal kami dapat digunakan bahkan ketika timing tidak dihormati dengan ketat.

Sebagai alternatif, alternatif jeda sinyal dapat digunakan untuk mengubah alfabet kueri ini menjadi alfabet ternary, hanya mempertahankan tiga durasi sebagai simbol alfabet, dan menggunakan analisis kontekstual untuk menentukan apakah durasi yang diberikan adalah sinyal atau jeda. Tetapi sekali lagi ini agak rumit untuk dianalisis.

Ini hanya menunjukkan bahwa ada banyak cara untuk melihat sesuatu, tetapi mereka belum tentu nyaman, dan mungkin tidak semua mudah meminjamkan diri untuk dianalisis dengan alat matematika yang telah dikembangkan untuk menganalisis kode.

Lebih banyak referensi tentang paten dapat ditemukan di Internet.

Kesimpulan

Mengingat ketepatan waktu standar, jawaban yang baik tampaknya mempertimbangkan kode Morse sebagai komposisi pengkodean awalan ternary (dari 58 karakter) menjadi alfabet 3 simbol, yang disusun dengan pengkodean awalan biner dari ketiga simbol ini.

Tanpa ketepatan waktu standar, tingkat biner tidak dapat lagi dipertimbangkan. Kemudian decoding analog ke logis terjadi secara alami pada tingkat alfabet menengah dotdan dash. Namun, dekoder analog ke logis dapat tetap mendekodekan ke 3 simbol alfabet sebelumnya, sehingga menjaga penerapan analisis kami.

— babou
sumber

1

Silakan pindahkan percakapan lebih lanjut ke chat.stackexchange.com/rooms/21638/…

— Wandering Logic

1

Komentar bukan untuk diskusi panjang; percakapan ini telah dipindahkan ke obrolan .

— Raphael

Pertanyaan: Dalam argumen ternary Anda mulai dengan alfabet {0,1}, dari sini Anda membangun empat simbol {dot = 10, dash = 1110, sep1 = 00, sep2 = 000000}, dari sini Anda membuat kumpulan kata kode kode ternary dengan memungkinkan sep2 = sep1 sep1 sep1 . Kumpulan kata kode dipilih karena secara implisit mengikat simbol ke pengkodean, yang nyaman, dan OP bertanya tentang penyimpanan biner. Namun, mengapa Anda tidak bisa menggunakan kata set kode {rest = 0, on = 1} lalu katakan "dot = on", "dash = on on on", sep0 = "off", sep1 = "off off off" , sep2 = "off off off off off off" (di mana sep0 adalah istirahat intersignal)?

— Jason C

^ Dalam hal ini argumennya adalah untuk kata kode biner yang ditetapkan atas kata terner, tetapi menggunakan argumen yang sama dan sama kuatnya dengan kata terner yang diberikan di sini. Yaitu, pilihan untuk memberikan makna khusus kepada banyak pemisah dalam satu baris tetapi tidak memberikan arti khusus pada banyak pemisah apa pun - selain itu dalam satu baris merupakan hal mendasar untuk argumen ternary, tetapi juga tampaknya sewenang-wenang.

— Jason C

1

Mari kita lanjutkan diskusi ini dalam obrolan .

— babou

28

Jawaban ini tidak sepanjang yang terlihat; situs ini hanya menempatkan banyak jarak antar item daftar! Pembaruan: Sebenarnya sudah cukup lama ...

Kode Morse bukan "secara resmi" biner, ternary, kuartener, quinary, atau bahkan 57-ary (jika saya hitung dengan benar). Berdebat tentang yang mana itu tanpa konteks tidak produktif. Terserah Anda untuk menentukan yang mana dari lima itu berdasarkan aplikasi Anda dan persyaratan pengkodean untuk situasi spesifik Anda . Untuk itu, ada pro dan kontra untuk setiap ukuran set simbol, yang harus Anda pertimbangkan untuk situasi Anda sebelum membuat keputusan.

Sebagai dasar, M.1677 , standar Kode Morse internasional, bagian 2, mendefinisikan timing sebagai:

2 Jarak dan panjang sinyal
2.1 Tanda hubung sama dengan tiga titik.
2.2 Ruang antara sinyal yang membentuk huruf yang sama sama dengan satu titik.
2.3 Ruang antara dua huruf sama dengan tiga titik.
2.4 Ruang antara dua kata sama dengan tujuh titik.

Perhatikan bahwa yang menentukan timing saja, misalnya tanda hubung tidak berarti hal yang sama dengan tiga titik, itu hanya panjang yang sama. Unit dasar waktu adalah sebuah titik.

Biner

Kita dapat memilih biner jika kita mau. Dimungkinkan untuk mewakili Kode Morse dengan "binary ketat", seperti yang Anda sebut - pendekatan penulis adalah untuk menetapkan digit ke "titik" dan "tanda hubung". Pendekatan itu tidak berhasil dan saya tidak berpikir penulis memiliki pemahaman yang kuat tentang kode Morse. Tetapi ada pendekatan berbeda yang berhasil. Jika kita memilih biner, pada dasarnya kita merepresentasikan apakah sinyalnya tinggi atau rendah dengan masing-masing simbol menempati satu irisan waktu yang panjang titik. Perhatikan bahwa ini juga merupakan pendekatan yang dijelaskan pada halaman Daftar Kode Biner yang Anda kutip.

Pengodean biner lainnya dapat dipilih juga (mis . Jawaban Bob Jarvis ) dengan mengorbankan peningkatan kesulitan pengodean kembali ke Kode Morse yang dapat didengar (Pengodean Bob tidak dapat didekodekan secara stateless, misalnya, pengorbanannya memberikan urutan pengodean yang lebih pendek).

Simbol:

Rendah, mati, dll. (0)
Tinggi, aktif, dll. (1)

Contoh Pengodean:

Pemisah sinyal: 0
Pemisah surat: 000
Pemisah kata: 0000000
Tiga titik: 10101
Tiga garis: 11101110111
Kata "son": 101010001110111011100011101
Ungkapan "is a": 10100010101000000010111

Pro:

Ukuran simbol minimal
Mudah dikelola dengan logika digital yang khas
Mudah diterjemahkan ke dalam Kode Morse yang dapat didengar (dengan anggapan tidak ada validasi yang dilakukan); decoding stateless dan tidak memerlukan menyimpan informasi tentang waktu simbol (setiap simbol memiliki panjang yang sama).

Cons:

Penyandian panjang
Banyak peluang untuk penyandian yang tidak valid.
Makna simbol individu (0, 1) tergantung pada konteks.

Ternary

Dengan pilihan ini, kami mendefinisikan jarak huruf dan kata sebagai sandaran, dan jarak sinyal adalah implisit (meskipun Anda bisa memilih untuk memerlukan simbol titik panjang tanda titik di antara sinyal, jika itu lebih cocok untuk Anda).

Simbol:

Istirahat dot-panjang (0)
Dot (1)
Dash (2)

Contoh Pengodean:

Pemisah surat: 000
Pemisah kata: 0000000
Tiga titik: 111
Tiga garis: 222
Kata "son": 11100022200021
Ungkapan "is a": 11000111000000012

Pro:

Simbol kecil mengatur ukuran.
Pemisah sinyal tidak lagi dibutuhkan.
Panjang penyandian lebih pendek dari biner.
Menghapus beberapa penyandian yang tidak valid (mis. 0110 dengan pilihan biner tidak lagi mungkin).

Cons:

Pengkodean masih panjang.
Masih banyak kemungkinan untuk penyandian yang tidak valid, khususnya, sisanya.
Tidak dapat didekodekan secara stat ^ly kecuali Anda memilih untuk menempatkan panjang titik eksplisit di antara sinyal.
Pemisah sinyal implisit ^‡ kecuali jika Anda memilih untuk menempatkan panjang titik eksplisit di antara sinyal.
Beberapa makna simbol individu (0) tergantung pada konteks.

Kuarter

Simbol:

Pemisah surat (0)
Pemisah kata (1)
Dot (2)
Dash (3)

Contoh Pengodean:

Tiga titik: 222
Tiga garis: 333
Kata "son": 2220333032
Frasa "is a": 220222123

Pro:

Panjang pendek sangat disandikan.
Kemungkinan penyandian yang tidak valid berkurang.
Simbol secara semantik akurat.
Boleh dibilang, lebih bisa dibaca manusia.

Cons:

Simbol mengatur ukuran besar.
Tidak dapat didekodekan secara stateless. ^†
Pemisah sinyal implisit. ^‡

Yg terdiri dr lima bagian

Interpretasi langsung dari daftar Wikipedia. Catatan ini sangat mirip dengan pilihan biner kecuali berbagai kombinasi yang valid dari biner 0 atau 1 diberikan simbolnya sendiri.

Simbol:

Pemisah sinyal (0)
Pemisah surat (1)
Pemisah kata (2)
Dot (3)
Dash (4)

Contoh pengodean:

Tiga titik: 30303
Tiga garis: 40404
Kata "son": 303031404041403
Ungkapan "is a": 3031303032304

Pro (dibandingkan dengan kuartener):

Dapat diterjemahkan secara stateless.
Satu-satunya simbol yang menetapkan ukuran yang jelas, secara langsung dan ringkas mewakili lima objek yang disebutkan dalam bagian 2 dari standar: "titik" (yang semua waktunya relatif terhadap), "tanda hubung", "ruang di antara sinyal", "ruang di antara dua huruf "," spasi antara dua kata ".

Kontra (dibandingkan dengan kuartener):

Kemungkinan lebih tinggi untuk penyandian yang tidak valid.
Peningkatan panjang penyandian tanpa menambahkan informasi tambahan (tradeoff adalah kemudahan pengodean).
Tidak seperti mudah untuk decode sebagai pilihan biner, dalam setiap simbol adalah panjang yang berbeda dalam waktu dan asosiasi ini harus dipertahankan di suatu tempat.

57-ary:

Termasuk untuk kelengkapan.

Simbol:

26 huruf
10 angka
20 tanda baca dan tanda lain-lain
Pemisah kata (spasi)

Contoh Pengodean:

Kata "anak": son
Frasa "is a": is a

Pro:

Pengkodean terpendek
Dapat dibaca manusia
Penyandian yang tidak valid tidak mungkin.

Cons:

Kumpulan simbol terbesar
Sulit diterjemahkan ke dalam Kode Morse; diperlukan untuk mempertahankan tabel urutan output Kode Morse untuk setiap simbol dan diperlukan untuk mendeteksi batas kata dan huruf yang berdekatan untuk menentukan di mana memasukkan berbagai tanda.
Tidak mungkin berkembang melampaui spesifikasi Kode Morse tanpa menambahkan simbol baru (tradeoff karena kebal terhadap penyandian yang tidak valid).
Pemisah sinyal dan huruf adalah implisit. ^‡

Penghentian

Untuk penyimpanan sebagai aliran simbol pada perangkat, jika Anda perlu melakukan itu, perlu dicatat bahwa M.1677 mendefinisikan urutan penghentian pesan dan transmisi. Dari Bagian II:

5 Setiap telegram harus diakhiri dengan sinyal silang (. -. -.)
6 Akhir transmisi harus ditunjukkan oleh sinyal silang (. -. -.) Diikuti oleh undangan untuk mengirimkan sinyal K (-. -)
7 Akhir pekerjaan harus ditunjukkan oleh stasiun yang mentransmisikan telegram terakhir. Indikasi yang benar adalah akhir sinyal kerja (... -. -)

Sayangnya, standar tersebut diam pada kemampuan untuk membedakan misalnya string "+ K" dari urutan ( akhir telegram , undangan untuk mengirim ). Namun, akhir pekerjaan itu unik. Jika Anda menyimpan kode morse, Anda harus menentukan bagaimana Anda ingin menunjukkan akhir dari urutan yang disimpan.

Jika Anda menyimpan seluruh percakapan, misalnya, dan menggunakan set simbol biner, Anda dapat mempertimbangkan akhir pekerjaan sebagai akhir indikator urutan, direpresentasikan sebagai urutan bit unik 101010111010111. Anda perlu mempertimbangkan jenisnya data yang Anda simpan (mis. fragmen pesan, seluruh pesan, seluruh percakapan) serta fasilitas yang ditawarkan kepada Anda oleh media penyimpanan Anda (mis. kemampuan untuk awalan dengan panjang pesan) sebelum memutuskan. Saya kira Anda bisa menentukan indikator urutan akhir Anda sendiri. Bagaimanapun, ini semua adalah masalah penyimpanan yang mendasarinya dan memiliki terlalu banyak kemungkinan untuk dicantumkan di sini. Pilihannya benar-benar terserah Anda berdasarkan pada apa pun yang sesuai untuk situasi Anda.

^† Tidak dapat didekodekan secara stateless: Pengkodean ini membutuhkan beberapa kondisi untuk dijaga agar dapat diterjemahkan ke dalam Kode Morse yang terdengar. Mereka semua membutuhkan "Jika simbol sebelumnya adalah titik / dasbor dan simbol saat ini adalah titik / dasbor kemudian masukkan pemisah sinyal". Meskipun Anda dapat mencoba dan "menipu" dan secara otomatis menambahkan pemisah sinyal ke semua simbol sambil mengurangi pemisah kata menjadi 5 sandaran dan pemisah huruf menjadi 1, M.1677 afaict tidak secara eksplisit melarang pemisah kata berturut-turut, yang memecah kludge ini.

^‡ Pemisah sinyal tersirat: Ini terkait langsung dengan catatan di atas tetapi lebih berorientasi semantik. Pengkodean ini memiliki pemisah sinyal implisit dalam notasi mereka. Yaitu "zzz" secara intuitif tiga z yang terpisah, batas-batasnya "dibonceng" pada apa pun yang memisahkan simbol dalam pengkodean itu sendiri. Pertimbangkan deskripsi "tiga titik berturut-turut"; secara intuitif kita menganggap ini berarti tiga terpisahtitik, tetapi jika pemisah tidak tersirat ini bisa dianggap tidak bisa dibedakan dari tanda hubung. Hanya representasi biner dan kueri gaya Wikipedia (atau terner dengan opsi pemisah sinyal eksplisit) yang menghapus semua ambiguitas dan "pintasan" di sini, yang dapat bernilai tinggi tergantung pada situasinya. Karena alasan inilah maka ada argumen kuat untuk pilihan quinary.

TL; DR:

Seperti yang Anda lihat, ada kelebihan dan kekurangan untuk masing-masing, dan terserah Anda untuk memutuskan bagaimana Anda ingin memperlakukannya berdasarkan kebutuhan Anda . Tidak ada jawaban yang benar. Anda dapat mencoba untuk berargumen bahwa yang satu lebih tepat daripada yang lain pada umumnya, tetapi argumen ini akan mengarah pada preferensi yang berlebihan, karena tanpa konteks, tidak ada jawaban yang benar.

Sekarang, semua yang mengatakan, menurut pendapat saya sendiri, pilihan kueri adalah representasi yang terasa paling "tepat" bagi saya untuk Kode Morse itu sendiri (awalnya saya lebih disukai kuartener). Ini adalah satu-satunya pilihan yang menyediakan semua hal berikut:

Simbol bebas konteks (simbol sendiri berisi semua informasi tentang artinya tanpa memeriksa simbol yang berdekatan).
Representasi semua primitif yang didefinisikan dalam M.1667.
Pemisah (sinyal, huruf, kata) tidak tersirat oleh notasi atau pengkodean yang mendasarinya (ini penting, jika saya menulis { dot, dot, dash }, itu ,penting dan mudah untuk diabaikan).

Namun, ada argumen kuat untuk semua. Argumen yang terkait dengan pengkodean juga berlaku untuk pengobatan Morse itu sendiri. Tidak ada jawaban 100% yang konkret, tetapi pasti bisa menjadi topik yang bagus untuk diperdebatkan dengan teman-teman Anda di bar.

. . . -. -

— Jason C
sumber

1

Silakan pindahkan percakapan lebih lanjut ke chat.stackexchange.com/rooms/21638/…

— Wandering Logic

1

Komentar bukan untuk diskusi panjang; percakapan ini telah dipindahkan ke obrolan .

— Raphael

Anda terus mengacu pada decoding stateless dalam argumen Anda. Dalam teori pengkodean, negara tampaknya jarang digunakan, dalam kode konvolusional, yang merupakan keluarga kode koreksi kesalahan. Ini sepenuhnya di luar topik karena kode Morse sama sekali tidak memperbaiki kesalahan. Memang, ia bahkan tidak dapat mendeteksi beberapa kesalahan satu bit, apalagi memperbaikinya. Anda membuat berbagai jenis kode arbitrer sebagai versi kode Morse, tetapi tidak ada artinya. Kenapa menyajikannya? Tidak memerlukan status, yaitu penyandian homomorfik, tampaknya merupakan persyaratan minimum. Dan Anda melewatkan pengkodean yang menarik. cc @KorayTugay

— babou

@Babou argumen decoding tanpa negara?

— Koray Tugay

@ BaBou Saya tidak keberatan memiliki beberapa poin di luar topik. Tentu saja set simbol arbitrer; itulah tepatnya yang saya maksudkan dengan jawaban ini. Kata ternary yang diatur di atas argumen kode awalan biner sama sewenang-wenangnya. Pada pandangan pertama tidak, tetapi pada dasarnya, Anda membuat pilihan sewenang-wenang untuk mendasarkan argumen pada kata kode yang diatur dengan alfabet dua huruf (0 dan 1). Ini adalah pilihan yang sewenang-wenang, karena pilihan untuk memberikan "sep sep sep" arti khusus tetapi tidak melakukan itu pada "unit 1" adalah sewenang-wenang. Anda bisa dengan mudah mengatakan bahwa "dash" adalah "dot dot dot" dan berdebat untuk binary lebih ternary.

— Jason C

5

Terlepas dari pemikiran awal saya tentang ini, ternyata pertanyaan ini dapat diformalkan dengan cara yang mengakui jawaban yang cukup tepat (modulo beberapa masalah definisi). Jawabannya ternyata 3 atau 4, yaitu ternary atau kuaterner. Jawaban "semuanya berjalan dari 2 hingga 57" benar hanya dalam arti bahwa jika seseorang meminta Anda untuk karakterisasi kelompok abelian, Anda memberi tahu dia bahwa mereka set.

Mari kita mulai dengan melihat pengkodean fisik untuk kode Morse. Itu sebenarnya B ASK , yaitu penguncian amplitudo-shift biner, yang merupakan cara rumit untuk mengatakan ada dua tingkat amplitudo fisik (listrik / optik dll.) Bagi kita untuk menyandikan pesan kita. Jadi, pertanyaan segera adalah: bukankah ini berarti jawaban itu adalah bahwa kode Morse adalah biner? Yah, ini biner hanya dengan cara yang agak tidak informatif, dalam arti bahwa sinyal nyala / mati biner yang dikirim melalui kabel tidak berhubungan langsung dengan garis atau titik. Pada tingkat korespondensi yang tidak jelas ini, kita bahkan dapat mengirim kode ASCII (dengan penyandian bit langsung dan jelas) dan menyebutnya "Morse" dan / atau "binary"; hal yang sama berlaku untuk kode Huffman (bukan ASCII).

$M$ $c:M\to T^*$ $T$ $T^*$ $T\subset \{0,1\}^*$ $c$

$T$ $T$ $T^*$ $T$ $T$ memiliki terminologi yang berbeda di mana pemetaan apa pun adalah kode, tetapi yang secara unik dapat diuraikan hanya dikatakan demikian dan disingkat kode UD. Di sini saya hanya akan menggunakan terminologi yang terakhir. Anda juga akan melihat sedikit nanti mengapa saya mengatakan "idealnya".)

$c$ $T$ $T$ $T$

$T$ $T$

just-dotjust-lineunit-spaceletter-spaceword-spaceunit-spacejust-dotjust-line $0$ just-dotjust-line

dit= just-dot unit-space= 10 dan
dah= just-line unit-space= 1110.

Jadi itulah kuaterner kode Morse: dit, dah, letter-space, word-space. Pengamatan selanjutnya adalah bahwa word-spacedapat diperkirakan (atau bahkan dianggap) dua letter-spaces, yaitu enam nol. Jadi, begitulah cara Anda mendapatkan kode kata sandi ternary; Sebagai referensi untuk alur penalaran ini, lihat misalnya [1] [2] .

$T = \{10 , 1110, 000\}$ $\{10 , 1110, 000, 0^7\}$ $0^{10}=0^30^7=0^70^3$ jadi ada faktorisasi yang tidak unik. Walaupun ini secara teori merupakan masalah, itu bukan masalah praktis karena "metronom" manusia memiliki kesulitan mengukur keheningan yang sangat panjang, jadi pada dasarnya setiap keheningan yang lebih lama dari panjang tertentu dianggap (oleh manusia) adalah sejenis word-space.

$0$ $000$ $0$ $T$ $1^{42}0$ $T$ $0$

ditdahletter-spaceletter-spacejust-linejust-dotunit-space $0$ ditdah $000$

Anda juga dapat menggunakan pendekatan trit untuk menghitung entropi dengan asumsi a dahdan ditdan letter-space"setara" sebagai trit [3] , dalam arti bahwa — misalnya —'e 'membutuhkan 2 trit dan' y 'mengambil 5 trit. Pendekatan abstrak trit tidak begitu berguna jika Anda peduli tentang seberapa mahal setiap simbol untuk benar-benar mentransmisikan dalam pengkodean BASK Morse nyata pada suatu garis. Untuk yang terakhir, Anda harus turun ke panjang bit nyata dari 3 (atau 4) simbol, yang dipandang sama seperti transisi dalam otomat. Misalnya huruf 'e' membutuhkan 5 bit untuk menyandikan (as dit letter-space) sementara 'y' membutuhkan 17 bit (tiga dahs, satu ditdan a letter-space). Garis pemikiran ini kembali ke Shannon (lihat hal. 3-4). Rincian lebih lanjut dapat ditemukandalam "Teori Informasi dan Pengkodean" Blahut , misalnya ia menghitung "rata-rata 9.296 unit waktu pensinyalan per huruf keluaran sumber" untuk kode Morse menggunakan probabilitas kejadian huruf tanpa syarat dalam bahasa Inggris. Untuk eksposisi yang sedikit berbeda (oleh ahli zoologi!) Anda bisa melihat JP Hailman ; dia mendapatkan rata-rata yang berbeda (10.2) karena dia mengasumsikan probabilitas yang sedikit berbeda untuk huruf bahasa Inggris, tetapi sebaliknya analisisnya secara konseptual sama.

Untuk meringkas ini: Anda dapat mengambil beberapa tampilan kode Morse, tetapi beberapa lebih bermanfaat daripada yang lain dalam mengatakan sesuatu yang menarik tentang hal itu. Saya tidak mengetahui adanya analisis yang menggunakan tampilan "quinary" dan agar model ini tidak dapat direduksi menjadi empat simbol, Anda harus membuat beberapa asumsi tentang terjadinya unit-ruang yang tidak memiliki Morse yang sebenarnya. , mis. Anda dapat memiliki dua tetapi tidak harus tiga unit-ruang yang berdekatan (yang merupakan Morse tidak valid). Tampilan ternary memberi Anda analisis cepat dari dekodabilitas unik. Pandangan paling dalam / berbuah adalah orang yang melihat 3 atau 4 simbol sebagai benar-benar diwakili oleh jumlah bit yang tidak sama karena mereka berada dalam kode Morse nyata (| dit| = 2, | dah| = 4, | letter-space| = 3 dan |word-space| = 6 atau 7); itu masih berwawasan luas di tingkat rendah ini untuk mempertimbangkan simbol ternary / kuartener sebagai transisi dalam otomat.

Mengapa Wikipedia menyebalkan ini ... baik pada beberapa topik yang dilakukannya. Artikel utama mereka di http://en.wikipedia.org/wiki/Coding_theory juga bukan sesuatu yang saya rekomendasikan untuk dibaca. Saya tidak bisa mengatakan banyak tentang buku (Petzold) yang Anda sebutkan selain itu tidak ditulis oleh seorang pakar teori informasi. Petzold benar hanya dalam arti bahwa jika pesan berkode Morse hanya terdiri dari satu huruf, Anda dapat mengatakannya dalam beberapa kode biner; jika Anda ingin mengirim kata-kata, Anda memerlukan pemisah surat, jika tidak kodenya bukan UD, sehingga tidak praktis.

letter-spaceletter-spaceditdahletter-space $T=\{10, 1110, 00\}$ . Itu juga berarti bahwa (misalnya) ukuran 'e' hanya 4 bit, bukan 5.

— Mendesis
sumber

Silakan pindahkan percakapan lebih lanjut ke chat.stackexchange.com/rooms/21638/…

— Wandering Logic

Komentar bukan untuk diskusi panjang; percakapan ini telah dipindahkan ke obrolan .

— Raphael

-1

Awalnya kode Morse dimaksudkan untuk menjadi tanda tertulis pada selembar kertas, tetapi operator telegraf segera bisa "membaca" klik peralatan. Versi Morse ini (Morse Amerika atau "tanah") memiliki tiga elemen "tanda", titik, tanda hubung, dan tanda hubung panjang.

Penggunaan Morse Internasional selama abad terakhir, melalui transmisi radio, biasanya dikodekan dengan tangan (pada kunci telegraf) dan diterjemahkan dengan telinga, dengan mendengarkan pola bunyi bip yang dihasilkan oleh penerima. Operator yang terampil dapat menerima lebih baik daripada yang tidak terampil, dan beberapa orang dapat menghasilkan kode yang lebih mudah dipahami daripada yang lain. Operator transmisi yang baik dikatakan memiliki "kepalan tangan yang baik." Operator yang tidak kompeten disebut LID. (Untuk asal "tutup" - yang saya percaya berasal dari kesalahan umum di Morse Amerika mengirim LID untuk DD, daaahh, dit dit, dah dit dit sebagai ganti dah dit dit, dah dit dit - lihat referensi ini: https://english.stackexchange.com/questions/31818/how-did-the-word-lid-come-to-mean-poor-operator-in-the-context-of-telegraph .)

Karena itu, "penyandian" Morse ke dalam format biner bergantung pada tujuannya, dan dengan demikian apakah kualitas "kepalan baik" versus "kepalan tangan miskin" harus dipertahankan. Apakah string switching on-and-off dicocokkan dengan jam dan "dikoreksi" untuk kesulitan dalam fase atau durasi setiap bagian dari sinyal? Atau apakah sampel diambil dengan kecepatan yang cukup untuk mempertahankan variasi acak atau membingungkan, mungkin untuk inspeksi atau kesenangan nanti?

— mantan ham
sumber

1

Maaf, bagaimana ini menjawab pertanyaan?

— Koray Tugay