Senin, 16 November 2009

Made In Indonesia,, Mesin Pengubah Suara jadi Teks

TEMPO Interaktif, Jakarta -Ingar-bingar perseteruan "cicak-buaya" tak hanya membuat repot para penegak hukum dan aktivis antikorupsi di Tanah Air. Komisi Hukum Dewan Perwakilan Rakyat pun masuk pusaran keriuhan yang menjadi sorotan media massa dan masyarakat itu. Sejak dua pekan lalu, para wakil rakyat menggelar rapat dengan petinggi Kepolisian RI, Kejaksaan Agung, Komisi Pemberantasan Korupsi, dan aktivis lembaga swadaya masyarakat. Rapat berlangsung berjam-jam, bahkan pernah hingga lewat tengah malam, lebih panjang dari yang dijadwalkan. Anggota Dewan seperti tak mau kehilangan panggung untuk bersuara atau berceramah.
Kalau sudah begini, yang dibikin repot adalah sekretariat komisi, yang harus mencatat semua ucapan anggota dewan dan tamunya. Mereka tak sekadar menunggu hingga rapat selesai, lalu membuat laporan singkat sebagai bahan bagi pemimpin rapat untuk membuat kesimpulan. Mereka pun harus menyalin rekaman dialog rapat.
"Targetnya, penyalinan harus selesai tiga hari," kata Noviantika, anggota staf tata usaha Komisi Hukum. Tapi, bila rapat berlangsung maraton hingga tengah malam, seperti pembahasan isu KPK itu, target tersebut sulit dicapai. "Rekaman yang satu belum selesai, ada lagi yang harus disalin," katanya.
Agar tak melewati tenggat, pekerjaan itu dibagi ke pegawai sekretariat jenderal Dewan dengan sistem lembur. Pemanfaatan tenaga penyalin dari luar tidak diperbolehkan karena ada yang bersifat rahasia. Akibatnya, selain menghabiskan waktu dan tenaga, pembuatan risalah rapat menyedot biaya yang tak sedikit. Noviantika mengaku tak tahu berapa biaya penyalinan dialog atau dokumentasi rapat Dewan yang memiliki 560 anggota itu. Tapi, sebagai gambaran, anggaran notulensi rapat Dewan Perwakilan Daerah, yang hanya beranggotakan 132 orang, mencapai Rp 3,6 miliar per tahun.
Waktu, tenaga, dan biaya dokumentasi rapat itu bisa dipangkas jika mereka memakai peranti lunak pengenal wicara berbahasa Indonesia buatan tim peneliti Badan Pengkajian dan Penerapan Teknologi (BPPT) yang diluncurkan tahun depan. Dengan Perisalah, sebutan peranti lunak itu, setiap kata yang diucapkan peserta rapat secara otomatis akan disalin menjadi tulisan dalam sekejap, runut sesuai dengan waktu bicara dari jam hingga detik. "Dengan perangkat ini, akan mudah diketahui siapa yang berbicara, tanpa harus menyalin lagi," kata Oscar Riandi, Open Source Resource Center Manager BPPT, sekaligus ketua tim riset Perisalah.
Meski perancangnya mengatakan bahwa peranti ini masih jauh dari sempurna, demo Perisalah dalam Konferensi Global Open Source di Jakarta, akhir Oktober lalu, mengundang decak kagum ratusan pengunjung. Dengan komputer jinjing yang sudah dilengkapi peranti lunak Perisalah dan bantuan mikrofon, semua ucapan Oscar langsung diubah menjadi naskah dalam sebuah dokumen open office. Ia juga menunjukkan penggunaan Perisalah dalam rapat. Ucapan tiap pembicara disalin dalam slot tersendiri sehingga rapi dan siap dicetak. "Cepat dan praktis. Mempermudah notulensi," kata Rani, sekretaris direksi perusahaan tambang nasional, yang ikut menyaksikan demo itu.
Perisalah mempunyai fitur penyuntingan, sehingga notulis yang berada di ruang kendali dapat melakukan penyuntingan on the fly, bersamaan ketika rapat berlangsung, tanpa mengganggu penyalinan yang dilakukan sistem di komputer. Kesalahan penyalinan dapat terjadi karena imla pembicara tidak jelas, gangguan suara lain, atau seperti saat ini karena model yang ada pada bank data suara masih sedikit. Oskar mengatakan, dengan fitur ini, koreksi penyalinan yang salah dapat diperbaiki oleh pencatat notula selama rapat berlangsung. "Draf risalah rapat dapat diselesaikan tidak lama setelah rapat selesai," katanya.
Selain menghasilkan risalah rapat, peranti lunak ini mampu menghasilkan ikhtisar atau resume hasil rapat. Oskar menjelaskan, resume dibuat  menggunakan SIDoBI (Sistem Ikhtisar Dokumen untuk Bahasa Indonesia) yang juga dikembangkan BPPT.
Perisalah tidak hanya dapat menghasilkan risalah rapat dalam versi lengkap tetapi juga dapat mengeluarkan risalah dalam bentuk resume rapat. Resume rapat dapat berupa dokumen dengan jumlah kalimat absolut, misalnya sepuluh atau seratus kalimat. Bisa pula dalam bentuk persentase dari risalah utuh, misalnya sepuluh persen, seperempat, atau separuh risalah.
Oskar mengatakan pembuatan Perisalah dimulai pada akhir 2008. Peranti ini merupakan pengembangan LiSan (Linux dengan Lisan) yang dikembangkan Pusat Teknologi dan Informasi dan Komunikasi BPPT sejak dua tahun lalu. LiSan merupakan pengembangan IGOS Linux Voice Command dengan memanfaatkan Free/Open Source Software (FOSS). LiSan berjalan dengan sistem operasi Linux yang memiliki jendela pengatur berbasis Gnome. "LiSan merupakan perangkat lunak pengenal wicara (speech recognition) berbahasa Indonesia pertama yang digunakan untuk mengoperasikan komputer dan penulisan dokumen," ujarnya.
Penggunaan suara sebagai man-machine interface merupakan terobosan dalam peningkatan aksesibilitas komputer. Prinsip interaksi dengan komputer melalui keyboard dan tetikus digantikan interaksi melalui suara yang diterima mikrofon yang selanjutnya dikonversi menjadi bentuk yang dikenali komputer untuk menjalankan perintah ataupun menulis dokumen. Dengan peranti ini, kesenjangan digital antara manusia normal dan yang memiliki keterbatasan fisik bisa dikurangi. "Bagi pengguna normal, LiSan membuat penulisan dokumen lebih cepat dan memberikan peluang pengoperasian komputer hands freely," kata Oskar.
Khusus untuk penyandang keterbatasan fisik, teknologi pengubah suara menjadi naskah dan sebaliknya telah dikembangkan untuk membantu mereka berkomunikasi menggunakan telepon. Divisi Riset dan Teknologi Informasi Telkom yang mengembangkan peranti lunak itu lima tahun lalu. Dengan peranti ini, ucapan lawan bicara akan diubah menjadi teks yang dibalas dengan tulisan oleh penelepon tunarungu. Demikian pula sebaliknya, tulisan yang dibuat penyandang tunarungu diubah menjadi suara. Tapi kian mudahnya layanan pesan singkat dan surat elektronik membuat perangkat itu tak banyak berkembang.
LiSan dapat dioperasikan dalam tiga ragam, yaitu diam, perintah, dan tulis. Ragam diam digunakan ketika pengguna tidak ingin suaranya diproses oleh LiSan menjadi perintah atau penulisan dokumen. Ragam perintah digunakan saat mengoperasikan komputer, seperti menjalankan program dan membuka dokumen atau sebaliknya. Ragam tulis digunakan pada saat penulisan dokumen. Ragam yang terakhir ini sangat membantu mereka yang pekerjaannya berhubungan dengan tulis-menulis dan dikejar tenggat, seperti sekretaris dan wartawan. Mereka tinggal mendiktekan kalimat, tulisan pun langsung jadi.
Peranti lunak ini memang belum sempurna. Kesalahan penyalinan dari ucapan menjadi naskah kerap terjadi sehingga peran penyunting menjadi sangat penting. Oskar mengatakan, kendala utama adalah kurangnya model suara yang tersimpan pada sistem. Ketika dipertunjukkan pada akhir bulan lalu, sistem Perisalah ini hanya menyimpan lima suara laki-laki dan lima perempuan dengan masing-masing mengucapkan 45 ribu kata. "Idealnya 500 laki-laki dan 500 perempuan," katanya. Model suara harus terus ditambah sebelum peranti ini diluncurkan enam bulan lagi.
Sumber : Tempo Adek Media (red_blc)

Tidak ada komentar: