Rabu, 29 April 2009

V0!c3 RecogniTi0N

Voice recognition adalah Pengenal suara. Kemampuan mengenal secara spesifik suara individual, mirip dengan pengenalan sidik jari. Teknologi ini memiliki kemampuan untuk menafsirkan kata-kata yang diucapkan oleh manusia. Dalam pengaplikasiannya dengan menggunakan teknologi ini, anda dapat memberi perintah kepada komputer secara lisan. Misalnya dengannya anda dapat menulis surat tanpa perlu mengetiknya. Untuk itu anda harus menggunakan mikrofon. Program semacam ini banyak macamnya di antaranya adalah Via Voice dari IBM.

Cara Kerja Program Pengenalan UcapanPengenal ucapan: sebuah teknologi yang mengubah ucapan menjadi teks alfanumerik dan perintah navigasi yang akan diterima oleh PC.Selama bertahun-tahun, program pengenal ucapan menjadi teknologi baru yang tidak dapat menepati janjinya. Tiga tahun yang lalu, produknya sangat mahal, tidak akurat, dan sukar untuk digunakan. Sekarang hal itu telah berubah. PC yang cepat dan software yang pintar meningkatkan kemampuan pengenalan ucapan sehingga benar-benar berguna. Dan ia muncul pada bagian yang tidak Anda duga sebelumnya, termasuk ponsel Anda. Mengetik e-mail atau hanya menjelajah Web? Katakan saja dan program tersebut akan berjalan dengan baik.Beberapa hal yang harus Anda ketahui:· Anda dapat mendiktekan teks melalui aplikasi pengenalan kata atau mengontrol desktop Anda dengan ketepatan hingga 95 persen.· Software pengenalan memerlukan sebuah CPU yang cepat, RAM yang banyak, mikrofon yang bagus, dan kartu suara terbaik.· Pengembangan baru membawa pengenalan ucapan memasuki Internet dan bahkan tidak hanya pada teknologi PC.Sebuah komputer tidak mengerti apa yang Anda ucapkan, sehingga ia harus menerjemahkan kata-kata Anda menjadi sesuatu yang dimengerti. Sebuah mikrofon akan mengubah suara Anda menjadi sinyal analog dan mengirimkannya ke PC melalui kartu suara. Sebuah konverter analog-ke-digital mengambil sinyal tersebut dan mengubahnya menjadi suatu aliran data digital (berupa bilangan binari satu dan nol). Kira-kira begitulah software pengenal ucapan bekerja.Walau beberapa perusahaan penghasil software pengenal ucapan memiliki metoda tersendiri, komponen utama dari software tersebut terbagi atas dua bagian. Yang pertama, dinamakan model akustik, akan menganalisa suara Anda dan mengkonversikannya menjadi fonem, yaitu elemen dasar ucapan. Bahasa Inggris misalnya, memiliki sekitar 50 fonem.Begini caranya bagaimana komputer memecah suara Anda menjadi data: Pertama-tama, model akustik menghilangkan noise (suara gangguan) dan informasi yang tidak diperlukan seperti perubahan volume suara dan lainnya. Kemudian, dengan menggunakan kalkulasi matematis, mengurangi data masukan menjadi sebuah spektrum frekuensi (tinggi rendahnya suara), kemudian menganalisa data kembali, dan mengubah kata-kata menjadi data digital yang merepresentasikan fonem.
Menyelaraskan Konteks KalimatSekarang komponen utama kedua software pengenal kata adalah model bahasa. Model bahasa akan menganalisa isi dari ucapan Anda. Kemudaian membandingkan kombinasi fonem dengan kata-kata yang terdapat pada kamus digital, sebuah database besar yang berisi kata-kata dari bahasa yang digunakan (kebanyakan software pengenal ucapan menggunakan bahasa Inggris). Saat ini software pengenal ucapan datang dengan kamus berisi 150.000 kata. Model bahasa dengan cepat akan menentukan kata-kata apa saja yang Anda ucapkan dan menampilkannya di layar (secara teori, demikianlah jalannya). Tetapi ada kendala yang cukup serius, ini disebabkan bahasa Inggris memiliki kata-kata yang hampir sama pengucapannya. Sebagai contoh kata "there", "their", dan "they`re". Kunci penyelesaian masalah tersebut adalah penggunaan trigram, yang akan menganalisa setiap konteks dari sebuah kata yang digunakan. Dalam banyak kasus, software akan dapat mengenali sebuah kata dengan membandingkannya terhadap dua kata sebelumnya. Bila Anda mengatakan "let`s go there", maka kemungkinan besar software akan memilih "there" dan bukan "their" setelah kata "let`s go".Program pengenal ucapan juga dapat diset sesuai karakter pemakainya. Software tersebut dapat dikostumasi berdasarkan suara, pola pengucapan kata, serta aksen Anda. Untuk meningkatkan ketepatan pendiktean, program tersebut membuat sebuah kamus tambahan dari kata-kata yang biasa Anda gunakan.
Bicaralah dan Anda Akan DidengarDragon Systems, IBM, Lernout & Hauspie, dan Philips adalah pemain-pemain utama penghasil software pengenal ucapan untuk PC. Tahun kemarin L&H mengumumkan telah mengakuisisi Dragon Systems, tetapi akan tetap menjual produknya masing-masing di masa depan. Ini berarti L&H akan menjadi yang terdepan dalam penjualan software pengenal ucapan untuk PC. Berdasarkan analisa IDC, Dragon Systems menguasai pangsa pasar sebesar 60 persen, diikuti oleh IBM dan L&H di belakangnya.Paket basis software pengenal ucapan dari Dragon Systems, L&H, IBM, dan Philips harganya berkisar antara US$50. Versi tercanggih dari Dragon, L&H, dan IBM memiliki kamus yang lebih besar serta aplikasi pendukungnya lebih luas sehingga harganya bisa mencapai US$200 hingga US$250.Kompleksitas dari program pengenal ucapan membutuhkan tenaga dari CPU hingga batas tertingginya. Walau kebanyakan paket dapat berjalan pada sebuah mesin berprosesor Pentium 200MHz, kinerjanya dapat ditingkatkan lagi bila mesin tersebut memiliki prosesor 300MHz. Chip terbaru seperti Pentium III dan Athlon akan lebih baik lagi dalam menjalankan program tersebut, dan banyak paket kelas high-end yang dapat mengambil manfaat dari ekstensi multimedia dari Pentium III. Dan jangan lupa, semakin banyak RAM semakin baik: Gunakan RAM minimum 64MB, atau 128MB untuk mendapatkan peningkatan yang substansial.
Kegunaan LainKebanyakan dari paket program pengenal ucapan juga memungkinkan kita untuk mengatur aplikasi Windows lainnya (Anda bisa mencari tahu pada vendornya, aplikasi apa saja yang dapat menggunakan paket mereka). Paket pengolah ucapan biasanya mengubah ucapan menjadi teks atau perintah dan mengirimkannya ke aplikasi tersebut.Aplikasi semacam Word dan Excel memiliki perintah yang standar, dan tidak penting apakah perintah tersebut datang dari keyboard atau ucapan Anda. Sebagai tambahan, kebanyakan program pengenal ucapan juga dapat bekerja dengan baik pada browser Web Anda, sehingga Anda bisa menjelajahi Web secara "lisan"."Menjelajah secara lisan" hanyalah sebagian kecil dari kemampuan yang dapat Anda gunakan. Dragon dan L&H sekarang menawarkan perekaman suara digital yang portabel yang dapat mendownload rekaman saat Anda pulang dari kantor; software pengenal ucapan pada PC Anda kemudian mengubah rekaman Anda menjadi sebuah catatan dalam bentuk teks langsung dari alat perekam tersebut.Analis mengatakan peranti portabel semacam itu--seperti telepon mobil berkemampuan Web, yang tidak memiliki keyboard standar--akan segera hadir. Akan tetapi featurenya tidak akan selengkap sebuah program pengenal ucapan, melainkan disesuaikan berdasarkan aplikasi yang spesifik, seperti mendapatkan informasi harga saham. Untuk PC desktop, langkah besar selanjutnya mungkin akan terjadi dalam jangka waktu tiga atau lima tahun ke depan, dimana teknologi seperti pemrosesan bahasa secara natural serta intelejensia buatan telah digunakan untuk keperluan sehari-hari. Pemrosesan bahasa secara natural akan menganalisa konteks dari sebuah kata dengan mencarinya pada sebuah kalimat utuh, bukan berdasarkan kata-kata lainnya, sehingga diharapkan ketepatannya akan meningkat.Bahkan intelejensia buatan yang canggih (bahkan kadang-kadang menakutkan), akan dapat membuat komputer mengerti apa yang Anda maksudkan, bukan hanya apa yang Anda ucapkan. Paket pengenal ucapan mungkin akan dapat berdiskusi dengan Anda serta menganalisa aspek emosional dari ucapan Anda. Cukup menarik bukan?

Tidak ada komentar:

Posting Komentar