Faisol, Muchamad (2013) Implementasi text to speech pada screen reader berbasis Mbrola. Undergraduate thesis, Universitas Islam Negeri Maulana Malik Ibrahim.
|
Text (Fulltext)
06550077.pdf - Accepted Version Available under License Creative Commons Attribution Non-commercial No Derivatives. Download (2MB) | Preview |
Abstract
INDONESIA:
Text to speech adalah suatu sistem yang melakukan konversi dari teks menjadi ucapan secara otomatis dengan cara fonetisasi (penyusunan fonem-fonem untuk membentuk ucapan). Perbedaan sistem text to speech dengan talking machine biasa adalah keotomatisannya dalam mengucapkan katakata baru. Oleh karena itu sistem text to speech memungkinkan diimplementasikan pada bidang aplikasi yang beragam seperti screen reader.
Screen reader merupakan bentuk teknologi bantu (assistive technology) yang digunakan untuk membantu orang yang memiliki keterbatasan penglihatan (low vision) dalam mengakses komputer. Sebuah screen reader akan membaca isi (tulisan) dari layar komputer dengan menggunakan logat inggris. Dan umum nya screen reader tidak menggunakan teknologi text to speech melainkan menggunakan suara sintesis robot (robotic synthetic voice).
MBROLA adalah Speech synthesizer yang menggunakan teknik penggabungan segmen bunyi berdasarkan pangkalan diphone (Diphone Concatenation).
Teknik diphone concatenation bekerja dengan cara menggabung-gabungkan segmen-segmen bunyi yang telah direkam sebelumnya. Setiap segmen berupa diphone (gabungan dua buah fonem). Diphone merupakan unit bunyi ucapan yang paling sering digunakan sebagai unit database. Berdasarkan penelitian yang ada syntesizer ini dapat menghasilkan bunyi ucapan dengan tingkat kealamian yang tinggi.
Pada penelitian ini sistem text to speech dengan menggunakan MBROLA Synthesizer akan diimplementasikan pada screen reader, sehingga dapat menghasilkan suara yang memiliki interpretasi yang baik dan memiliki tingkat kealamian yang tinggi.
ENGLISH:
Text to speech is a system that performs the conversion of text to speech automatically by means fonetisasi (preparation of phonemes to form words). Differences in text to speech system with regular talking machine is keotomatisannya in pronouncing new words. Therefore the text to speech system implemented on field enables diverse applications such as screen readers.
Screen readers are a form of assistive technology (assistive technology) which is used to help people who have limited vision (low vision) to access the computer. A screen reader will read the contents (text) of a computer screen using the English accent. And his general not to use a screen reader text to speech technology it uses robot voice synthesis (synthetic robotic voice).
MBROLA is Speech synthesizer which uses sound segment merging technique based on diphone base (Diphone Concatenation).
Diphone concatenation technique works by combining segments combined the sounds that have been recorded previously. Each segment of a diphone (combination of two phonemes). Diphone is a speech sound units are most often used as a database unit. Based on existing research syntesizer can produce speech sounds with a high level of naturalness.
In this study the system using a text to speech synthesizer MBROLA will be implemented on a screen reader, so as to produce a sound that has a good interpretation and have a high level of naturalness.
Item Type: | Thesis (Undergraduate) | |||||||||
---|---|---|---|---|---|---|---|---|---|---|
Supervisor: | Chamidy, Totok and Suhartono, Suhartono | |||||||||
Contributors: |
|
|||||||||
Keywords: | Text to Speech; Screen Reader; Mbrola | |||||||||
Departement: | Fakultas Sains dan Teknologi > Jurusan Teknik Informatika | |||||||||
Depositing User: | Dellavia Azzahra Permata Putri | |||||||||
Date Deposited: | 25 Jul 2017 10:30 | |||||||||
Last Modified: | 25 Jul 2017 10:30 | |||||||||
URI: | http://etheses.uin-malang.ac.id/id/eprint/7368 |
Downloads
Downloads per month over past year
Actions (login required)
View Item |