Arsip

Arsip untuk kategori ‘Kisah’

Tesamoko: Aplikasi daring penyusunan tesaurus

27/12/2011 1 komentar

Oleh Ivan Lanin

Tesamoko adalah aplikasi daring untuk kolaborasi pembuatan tesaurus bahasa Indonesia oleh tim revisi Tesaurus Bahasa Indonesia (TBI) yang edisi pertamanya dibuat oleh Eko Endarmoko (EE). Nama “Tesamoko” merupakan akronim dari “Tesaurus Eko Endarmoko” dan semata dipilih karena sifatnya yang unik. Aplikasi ini menggantikan cara kerja pembuatan tesaurus secara tradisional yang menggunakan coretan dan catatan di kertas. Makalah ini menjelaskan proses pembuatan aplikasi tersebut.

Perancangan

Kebutuhan aplikasi dikumpulkan berdasarkan analisis terhadap dokumen Microsoft Word naskah TBI edisi pertama yang sudah siap naik cetak. Hasil analisis dituangkan dalam bentuk pola yang kemudian dikonfirmasi kepada pembuat edisi pertama, EE, dalam bentuk wawancara dan komunikasi via surel. Pola yang ditangkap adalah sbb.

  1. Lema disusun secara alfabetis menurut kata kepala (headword). Kata kepala yang berupa homonim dianggap sebagai lema sendiri.
  2. Setiap lema dapat memiliki sublema dalam bentuk kata berimbuhan maupun kata majemuk.
  3. Setiap entri (lema dan sublema) dipisahkan dengan baris baru serta terdiri dari satu atau lebih polisem.Jika satu entri mengandung lebih dari satu polisem, setiap polisem ditandai dengan angka romawi di depannya.
  4. Setiap polisem dapat terdiri dari gugus makna yang dipisahkan dengan tanda titik koma.Sinonim dalam suatu polisem atau gugus makna dipisahkan dengan tanda koma.
  5. Satu entri atau polisem dapat memiliki atributdalam bentuk singkatan atau akronim yang menerangkan.

a. kelas kata, mis. n (nomina) atau v (verba),
b. asal serapan, mis. Ar (Arab) atau Jw (Jawa),
c. ragam/penggunaan, mis. ark (arkais) atau cak (cakapan), dan
d. bidang istilah, mis. Isl (Islam) atau Dok (Kedokteran).

Analisis dan diskusi lebih lanjut dengan tim TBI menghasilkan beberapa persyaratan sistem berikut:

  1. Prinsip resiprokal, yaitu bahwa suatu sinonim pada suatu entri juga mencantumkan entri tersebut sebagai sinonimnya. Misalnya, jika entri badan mencantumkan jasad sebagai salah satu sinonimnya, entri jasad pun harus mencantumkan badan sebagai salah satu sinonimnya.
  2. Isian untuk antonim, hipernim (hiponim), serta holonim (meronim) yang masing-masing juga dapat dikelompokkan menurut polisem dan gugus makna untuk setiap entri.
  3. Sarana untuk memasukkan komentar atau catatan pada suatu entri. Hal ini diperlukan karena dalam proses entri suatu lema, tim TBI sering memerlukan dialog untuk mencapai konsensus. Di samping itu, catatan ini dapat juga dipakai sebagai sarana untuk memasukkan rujukan.
  4. Log perubahan untuk mencatat semua perubahan yang dilakukan terhadap data. Tujuan log ini adalah sebagai alat audit dan juga sebagai sarana untuk dapat mengembalikan suatu kesalahan yang mungkin terjadi.

Tesamoko, aplikasi daring penyusunan tesaurus, dirancang dari hasil analisis awal tersebut. Sistem daring (dalam jaringan, online) dipilih untuk memudahkan koordinasi karena sifat media internet yang dapat diakses dari mana pun dan kapan pun (realtime). Sebagai platform pemrograman dipilih bahasa skrip PHP karena banyak dipakai untuk sistem daring, sedangkan sebagai basis data dipilih MySQL karena ringan dan cukup dapat diandalkan. Metode pengembangan yang digunakan adalah semi-RAD (rapid application development) dengan implementasi cepat dan pengembangan bertahap berdasarkan masukan dari pengguna.

Penerapan

Proses pembuatan sistem secara sederhana dapat dibagi menjadi tiga proses yang dilakukan secara siklus, yaitu:

  1. Perancangan dan pembuatan struktur data.
  2. Pembuatan skrip program.
  3. Pengujian dan perbaikan.

Data awal untuk mengisi sistem dimigrasi dari sumber data naskah siap cetak TBI edisi pertama. Proses migrasi dilakukan berdasarkan pola yang sudah dijabarkan di atas. Setelah migrasi, dilakukan pembersihan data karena beberapa hal, a.l.:

  1. Adanya pemenggalan manual dengan tanda hubung (-).
  2. Adanya pola yang tidak tertangkap oleh analisis awal, misalnya penulisan dengan tanda garis miring (/) untuk sinonim berupa kata majemuk yang memiliki salah satu unsur sama (mis. banyak/lebar mulut).
  3. Adanya salah tik pada naskah.

Seperti telah diuraikan di atas, proses pembuatan sistem dilakukan secara bertahap sesuai masukan dari pengguna dan perkembangan kebutuhan. Sejak purwarupa pertama diluncurkan pada 8 Agustus 2010, fitur yang sudah diimplementasikan pada Tesamoko adalah sbb.:

  1. Formulir penyuntingan entri tesaurus sesuai dengan persyaratan yang telah dijabarkan.
  2. Statistik jumlah entri berdasarkan berbagai penggolongan (alfabet, dasar/turunan, kelas kata, ragam, asal serapan, dll.).
  3. Komentar terhadap suatu entri.
  4. Log perubahan entri.
  5. Pengaturan jenis pengguna dengan tingkat akses yang berbeda: admin, kurator, editor, dan peninjau.
  6. Informasi dan formulir penyuntingan makna entri berikut polisem dan gugus maknanya.
  7. Informasi dan formulir penyuntingan sumber rujukan dan etimologi entri.
  8. Daftar entri yatim, yaitu entri (A) yang sudah dicantumkan sebagai sinonim suatu entri (B), namun belum dibuatkan entrinya (A) dalam sistem. Pada tampilan sistem, entri A ini ditandai dengan warna merah dalam daftar sinonim entri B.
  9. Penandaan entri piatu, yaitu entri (A) yang mencantumkan entri lain (B) sebagai sinonim, namun entri sinonimnya itu (B) belum mencantumkan entri tersebut (A) dalam daftar sinonimnya. Pada tampilan sistem, entri A dicantumkan pada bagian tersendiri pada entri B.
  10. Pemberian bintang untuk entri-entri yang memerlukan perhatian khusus.

Selain fitur-fitur utama tersebut, ada beberapa fitur minor yang tidak disebut secara khusus dalam daftar di atas seperti balon informasi pada singkatan atau akronim atribut, pilihan untuk menampilkan atau  menyembunyikan suatu informasi, dll.

Penyempurnaan

Sebagai suatu sistem yang dikembangkan secara bertahap, Tesamoko tidak luput dari kekurangan. Beberapa penyempurnaan yang dapat dan akan diterapkan pada Tesamoko dicantumkan di bawah ini:

  1. Statistik aktivitas individu pengguna yang digunakan untuk memantau kinerja dan kemajuan proses penyuntingan. Dipikirkan juga untuk menggabungkan fitur ini dengan penetapan tenggat waktu pengerjaan.
  2. Pembuatan daftar khusus untuk entri piatu (entri yatim sudah ada) untuk memudahkan proses penyuntingan. Perbaikan untuk entri yatim atau piatu ini seyogianya dapat dilakukan oleh sistem, namun penerapannya terhambat oleh ketaksaan homonim, polisem, dan gugus makna yang belum bisa diproses oleh mesin.
  3. Penyempurnaan sistem entri kamus yang memuat makna dan informasi lain yang tidak masuk dalam cakupan suatu tesaurus.
  4. Penyertaan rujukan dalam bentuk bibliografi atau korpus penggunaan suatu entri karena sumber rujukan dan contoh penggunaan merupakan bukti ilmiah untuk suatu karya leksikografi. Korpus juga dapat menjadi sumber rujukan untuk menentukan perubahan makna suatu entri.
  5. Penerbitan hasil kerja tim penyunting dalam bentuk tesaurus atau kamus daring yang dapat diakses oleh publik dengan fasilitas sesuai kebutuhan.

Tiada gading yang tak retak. Meskipun demikian, Tesamoko telah menunjukkan bahwa pemanfaatan teknologi informasi dalam leksikografi sangat membantu proses kerja secara umum. Dengan penyempurnaan berkelanjutan dan dukungan dari bukti linguistik berupa korpus, Tesamoko diharapkan akan menjadi alat bantu pembuatan tesaurus (dan kamus) yang baik, bermanfaat bagi penggunanya, dan dapat dipertanggungjawabkan secara ilmiah.

11 November 2011

Daftar pustaka

Atkins, S., & Rundel, M. (2008). The Oxford Guide to Practical Lexicography. Oxford: Oxford University Press.

Chaer, A. (2007). Leksikologi & Leksikografi Indonesia. Jakarta: Rineka Cipta

Kurnia, N. S. (2007). Pemanfaatan Korpus dalam Pengajaran dan Pemelajaran Bahasa. PELBBA 18: Pertemuan Linguistik Pusat Kajian Bahasa dan Budaya Atma Jaya (hlm. 1-23). Jakarta: Yayasan Obor Indonesia.

Lauder, A. (2010). Data for lexicography: the central role of the corpus (pre-publication draft). Wacana.

Setia, E. (2005). Semantik dan Leksikografi dalam Perkamusan. ENGLONESIAN: Jurnal Ilmiah Linguistik dan Sastra, Vol. 1 No. 1 (hlm. 19-37)

 

Ivan Lanin, Magister Teknologi Informasi Universitas Indonesia, Tim Teknis Tesamoko.

ivan@lanin.org

 

FacebookTwitterShare
Kategori:Kisah Tag

Gerombolan Tesamoko (2)

Oleh Zen Hae

Pusat Dokumentasi Sastra (PDS) H. B. Jassin, yang letaknya di pojok depan kompleks Taman Ismail Marzuki (TIM), adalah tempat yang nyaman untuk diskusi, apa pun temanya. Sejak lama tempat ini telah menjadi semacam oase baru bagi para pesastra dan pencinta sastra yang tidak bisa tampil di panggung-panggung besar di lingkungan TIM. Sebab, di sini mereka bisa membuat acara diskusi dan pementasan sastra dengan khalayak yang cukup apresiatif. Dan yang juga penting, sangat terjangkau secara ekonomis. Kantor ini merupakan tempat kedua, setelah sebuah ruang di Komunitas Utan Kayu, kami menyelenggarakan sejumlah pertemuan kerja revisi Tesaurus Bahasa Indonesia (TBI).

Pertemuan tidak melulu kami manfaatkan membincangkan materi perbaikan TBI, namun terkadang juga membahas pelbagai agenda lain di seputar lingkup kerja kami. Misalnya, penggarapan media jejaring sosial demi mendekat ke khalayak yang lebih luas. Dan hasilnya antara lain berupa blog http://blog.tesaurusindonesia.com/ ini, yang salah satu isinya adalah program SehariSekata yang ditautkan ke twitter. Atau juga beberapa kali kami bertemu guna menggodog rencana lama membentuk badan untuk mewadahi kerja panjang revisi. Maka pada Jumat, 19 Agustus 2011 lalu, di hadapan notaris di kantor hukum LGS, Menara Imperium, Kuningan, Jakarta, ditandatanganilah akta pendirian Yayasan Tesaurus Indonesia (YTI) oleh Arief T. Surowidjojo, Bondan Winarno, Eko Endarmoko, dan Goenawan Mohamad.

Karena tidak, tepatnya belum, punya kantor tetap, rapat atau pertemuan kami kerap berpindah-pindah: dari Komunitas Utan Kayu, PDS H. B. Jassin, Komunitas Salihara, dan terakhir, ruang rapat kantor hukum LGS di Menara Imperium – tempat terakhir ini rupanya paling ideal untuk kerja bersama merevisi TBI — bahkan pernah pula di kediaman anggota Gerombolan, yakni di rumah Mbak Mia (Multamia RMT Lauder) di bilangan Bintaro, Tangerang, serta di rumah Miagina Amal di daerah Kebon Jeruk.

Tentu saja, setelah pembagian kerja di  Komunitas Utan Kayu tempo hari, masing-masing orang bekerja berdasarkan tanggung jawabnya secara individual. Gerombolan Tesamoko bekerja dalam apa yang kami sebut Tesamoko. Ini adalah aplikasi daring untuk kolaborasi perbaikan tesaurus bahasa Indonesia oleh tim revisi TBI. Nama “Tesamoko” merupakan akronim dari “Tesaurus Eko Endarmoko” dan semata dipilih karena sifatnya yang unik. Aplikasi ini menggantikan cara kerja pembuatan tesaurus secara tradisional yang menggunakan coretan dan catatan di kertas.

Di PDS H. B. Jassin mereka yang bertugas secara bergantian menyajikan hasil kerja mereka. Inilah saat-saat yang mengasyikkan. Sebab, perdebatan tentang sinonim atau antonim sebuah kata bisa menjadi sangat lama, tetapi di akhir selalu kami bisa mengambil kesimpulan. Kadang-kadang perdebatan bisa menemui jalan buntu, tetapi kehadiran sejumlah narasumber, seperti almarhum Amin Sweeney, Mbak Mia, Mbak Cis (Felicianuradi Utorodewo), di samping Mas Eko selaku penyusun utama, membuat perdebatan itu bisa beres.

Para juru damai ini memang bertugas mengawasi atau menjadi semacam penyelia dari proyek revisi Tesamoko. Meski tidak selalu bisa hadir setiap kali rapat (yang berlangsung dua minggu sekali setiap Kamis sore, kemudian, setelah pindah ke Menara Imperium diubah menjadi tiap Sabtu sore), tetapi peran mereka menjadi sangat penting. Mbak Mia, Mbak Cis, dan Ivan Lanin, misalnya, orang yang kerap menunjukkan sejumlah sumber rujukan yang penting untuk proyek ini — nama yang disebut terakhir itu, Ivan Lanin, penting perannya di dalam “memperkenalkan” situs-situs kebahasaan yang patut kami jadikan rujukan. Terutama dalam mencari kemungkinan pengembangan Tesamoko, bagaimana model penyajiannya di edisi kedua nanti dan rencana kerja apa lagi yang bisa dikerjakan yang berkaitan dengan proyek ini.

Untuk yang terakhir ini, tentu saja berhubungan dengan peran Ivan Lanin. Ivan yang telah mengalihkan tugasnya sebagai anggota tim revisi, kini sepenuhnya berkonsentrasi pada penyiapan bagian teknologi informasi Tesamoko. Ialah yang mengakhiri era generasi Gutenberg dan menggantikannya dengan era digital untuk Tesamoko. Ia menyusun sistem yang memungkinkan Tesamoko bisa tampil dalam versi dalam jaringan atau daring (online) dan seluruh proses penyusunannya tidak lagi menggunakan kartu-kartu sebagaimana dilakukan Mas Eko dulu, tetapi bisa langsung dalam jaringan. Tiap orang bisa bekerja kapan saja dan di mana saja. Kerja menjadi lebih mudah, tetapi di sinilah soal baru muncul.

Melalui hubungan internet seorang anggota tim yang tengah bekerja memang bisa berhubungan langsung dengan anggota lain yang kebetulan sedang bekerja secara daring juga. Tetapi, tidak semua anggota akrab dengan internet, apalagi sistem yang disusun oleh Ivan belum sepenuhnya dipahami oleh teman-teman yang lain. Akibatnya masih ada satu-dua anggota yang mengerjakannya dalam versi microsoft word, baru kemudian diserahkan kepada sekretaris redaksi yang dipercayakan kepada Rani Elsanti Ambiyo. Keadaan gaptek (gagap teknologi) ini berlangsung cukup lama, sampai akhirnya seluruh anggota tim revisi bisa akrab dan mengoperasikan sistem besutan Ivan.

Bukan hanya tim redaksi yang bekerja, ada juga, tadi sudah disinggung, tim yang kerennya bisa disebut sebagai “juru kampanye tesamoko”. Mereka adalah Bagus Takwin, Ivan Lanin, Miagina Amal, Totok Suhardiyanto, Juinita Senduk. Mereka inilah yang menyiapkan kampanye penyebarluasan Tesamoko kepada masyarakat.

FacebookTwitterShare
Kategori:Kisah Tag

Gerombolan Tesamoko (1)

25/05/2011 1 komentar

Oleh Zen Hae

Kami bertemu pada suatu sore di sebuah ruang rapat di Komunitas Utan Kayu. Jumat, 4 Juni 2010. Saya datang terlambat. Saat saya masuk sudah ada Eko Endarmoko dan seorang putrinya, Eliza Handayani, dan Betty Litamahuputty. Uu Suhardi datang lebih kemudian. Kepada saya Mas Eko (begitulah saya biasa memanggil Eko Endarmoko) menyodorkan proposal penerbitan revisi Tesaurus Bahasa Indonesia (TBI). Untuk proyek revisi kali ini TBI akan mempertahankan pola penyajian lemanya. Yakni, berdasarkan urutan abjad, bukan berdasarkan kedekatan makna.Tujuannya lebih banyak memberi kebebasan kepada pembaca untuk memilih kata yang mereka inginkan, selain mendorong pembaca lebih aktif mencari, dalam kamus lain, makna kata-kata yang ia temukan dalam TBI. Sejak semula TBI punya dasar pikiran dan filosofi yang berbeda dari tesaurus Roget.

Sesuai surat Mas Eko revisi akan dilakukan pada tiga hal: (1) menambahkan antonim, (2) melengkapi gugus sinonim sebuah lema dalam korespondensi antara satu dan lain lema,  dan (3) mempertajam nuansa makna antar-anggota sinonim. Juga akan dikaji kembali pengertian dua pasangan konsep: “kontras” dan “lawan makna”, “sinonim” dan “kata yang bertalian makna” (sebagaimana diterapkan dalam baik Merriam-Webster’s Collegiate Thesaurus (1993) maupun The Modern Guide to Synonyms and Related Word (S. I. Hayakawa, 1987). Kesepakatan redaksi, termasuk pilihan sikap, akan dituangkan dengan sejelas-jelasnya di pengantar/mukadimah edisi revisi.

Yang juga menarik pada pertemuan itu adalah tawaran Betty untuk menjajaki kemungkinan penggunaan database/filemaker untuk memudahkan kerja tim revisi, dengan catatan, soal tata letak tetap menjadi urusan penerbit kelak. Sayangnya, Betty absen di pertemuan-pertemuan berikutnya sehingga usulan itu hanya tinggal usulan—yang kelak akan digantikan oleh ide cemerlang Ivan Lanin.

Setelah ngalor-ngidul membicarakan kemungkinan-kemungkinan revisi, kami berbagi tugas: siapa mengerjakan apa. Naskah Tesaurus yang ada dibagi kepada delapan orang. Masing-masing orang mendapat jatah sekitar 75 halaman.  Orang pertama akan memberi tambahan, coretan, dan koreksi dengan tinta merah. Kemudian naskah tersebut akan diperiksa ulang oleh seorang anggota tim redaksi yang lain (cross-check)— dengan tinta hitam. Kata putus tetap di tangan Eko Endarmoko.

Kelak, susunan redaksi tim revisi ini berubah. Yanusa Nugroho mengundurkan diri karena kesibukannya, Ivan menyerahkan bagian tugas redaksionalnya tadi kepada yang lain, karena ia lebih ingin berkonsentrasi mempersiapkan sistem Tesamoko (nama yang kemudian disepakai sebagai sebutan Tesaurus Bahasa Indonesia susunanan Eko Endarmoko). Masuk pula Yanwardi Natadipura.

Sejak pertemuan sore itu kami sepakat bertemu satu kali dalam sebulan. Akan tetapi, beberapa teman tidak bisa datang dalam pertemuan berikutnya: Betty kembali ke Belanda untuk beberapa lama, Eliza yang kembali ke Swedia, menemani suaminya. Tetapi, akan datang Miagina Amal yang selalu membawa makanan ketika rapat, Ivan Lanin yang bersemangat dan terus menyempurnakan sistem Tesamoko, Yanwardi yang kritis dan tak banyak bicara, Mbak Cis (Dr. Felicia Nuradi Utorodewo) sumber rujukan yang menggirangkan hati, Indra Sarathan yang kalem dan jauh-jauh datang dari Jatinangor (Universitas Padjadjaran), Juinita Senduk, Amin Sweeney yang pada November 2010 berpulang secara mendadak karena serangan jantung.

Setelah pertemuan di Utan Kayu kami pindah tempat rapat ke PDS H. B. Jassin, sebuah tempat yang penuh gejolak akhir-akhir ini…

FacebookTwitterShare
Kategori:Kisah Tag

Kampanye Antonim

Pertemuan gerombolan Tesamoko pada hari Sabtu, 9 April 2011, kemarin untuk pertama kalinya dilakukan di kantor Mas Arief Surowidjojo, lantai 30 Menara Imperium, Kuningan, Jakarta. Dua belas orang datang menghadiri rapat yang dimulai sekitar pukul 4 sore dan diakhiri pada pukul 7 malam ini: Mas Eko, Pak Steve, Kang Uu, Mas Aten, Mbak Asty, Mia, Juin, Indra, Neneng, saya sendiri, serta Rani. Ada dua agenda utama yang ditetapkan, yaitu presentasi rencana kampanye Tesamoko oleh Mas Aten serta presentasi hasil kerja Indra Sarathan (lema-lema berawalan “s”).

Baca lanjutannya…

FacebookTwitterShare
Kategori:Kisah Tag