Rabu, 20 Maret 2013

apa itu captcha?


CAPTCHA  ( Completely Automated Public Turing test to tell Computers and Humans Apart ) merupakan jenis tantangan response test untuk memastikan bahwa responden hanya dilakukan oleh manusia dan bukan oleh komputer bisa juga di istilahkan uji verifikasi kata pada saat anda login atau sign up pada website – website di internet seperti google, yahoo, facebook, forum, dan website lain.
Metode Turing Test ini yang dicetuskan oleh Alan Turing di tahun 1950, Sebelum ada CAPTCHA, spammer/hacker bisa membuat program otomatis mengisi formulir seperti pendaftaran email, sehingga bisa mendapatkan ribuan alamat email dengan mudah yang kemudian disalah-gunakan. Atau digunakan untuk mendominasi hasil sebuah polling internet, seseorang dapat merancang program sederhana untuk mengisi polling itu dengan jawaban yang sama sebanyak ribuan atau bahkan jutaan kali. Akibatnya polling itu tentu tidak valid karna bukan hasil asli/sebenarnya.
Untuk mencegah program seperti itu, kini semua formulir akan menampilkan CAPTCHA berupa gambar huruf-huruf dan angka yang akan sulit dibaca oleh program atau komputer, namun bisa dibaca manusia. Jika isian dari pengisi formulir sesuai dengan gambar yang ditampilkan, kemungkinan besar pengisi formulir adalah seorang manusia, bukan program/softwere otomatis.
CAPTCHA biasanya dibuat secara otomatis secara acak setiap kali ada orang yang masuk halaman formulir di web, sehingga hampir tidak ada dua CAPTCHA yang serupa. Ini membuat jumlah kombinasi yang mungkin muncul sangat-sangat banyak, sehingga hampir tidak mungkin untuk membuat program yang mampu mengingat dan menjawab CAPTCHA yang akan muncul.
Selain CAPTCHA visual yang sering kita jumpai, ada juga versi audio bagi penyandang cacat mata, dengan prinsip yang kurang lebih sama.
Saat ini ada inisiatif program CAPTCHA untuk tujuan positif yaitu untuk menyelamatkan arsip – arsip penting didunia, banyak negara kini ada pihak yang bertanggung jawab untuk mengubah format arsip yang sudah ada (buku, dokumen tercetak) ke format digital (file komputer). Dua kendala utama yang muncul adalah banyaknya jumlah arsip yang tersimpan selama ratusan tahun, serta kualitas cetakan yang buruk sehingga hasil scan-nya sukar dikenali oleh komputer. Dengan gabungan kedua kendala itu, hampir tidak mungkin membayar tenaga manusia untuk membaca secara manual arsip yang gagal dibaca komputer.
Untuk mengatasinya kini muncul re-CAPTCHA, sebuah sistem yang bekerja sama dengan Google Books dan The Internet Archive, dimana hasil scan arsip yang gagal dibaca komputer dimunculkan sebagai CAPTCHA, lalu hasil isian itu dianggap sebagai teks yang hilang/tak terbaca. Agar yakin teks itu benar, biasanya tidak hanya satu jawaban yang dipakai, melainkan hingga sepuluh atau lebih jawaban yang sama.
Ini menjadi solusi win-win bagi semua pihak. Bagi pemilik web dengan formulir, ia mendapat CAPTCHA yang sudah tidak bisa dikenali oleh komputer super canggih yang dipakai untuk proses digitalisasi arsip, sehingga hacker juga kesulitan membuat program yang mampu membacanya. Dan bagi pihak pengubah format arsip, dengan begitu banyaknya formulir yang diisi diseluruh dunia tiap harinya, re-CAPTCHA dapat membantu digitalisasi arsip dengan cepat dan gratis.
Jadi saat mengisi formulir di website yang bekerja sama dengan re-CAPTCHA, Anda sudah turut membantu menyelamatkan arsip dunia bagi anak cucu kita semua nanti.
Sayangnya setelah diimplementasikan sekian tahun, sistem CAPTCHA sudah mulai menunjukkan beberapa kelemahan. Perkembangan hardware dan software membuatnya tidak lagi terlalu sukar untuk dipecahkan oleh program. Apalagi kini muncul perusahaan-perusahaan atau layanan decaptcher di dunia ketiga yang bersedia memecahkan CAPTCHA dengan biaya yang sangat murah. DeCaptcher.com bersedia memecahkan CAPTCHA dengan hanya US$2 per 1000 CAPTCHA. Untuk mengatasinya, saat ini beberapa pihak seperti Universitas Carnegie Mellon dan Penn State sedang mengembangkan CAPTCHA yang berbasis gambar, bukan lagi huruf.
Penjelasan ReCaptcha menurut Google sebagai berikut.
  • reCAPTCHA adalah sebuah fasilitas internet yang membantu untuk mendigitalkan buku-buku, surat kabar maupun siaran radio lawas..berupa ‘teks tedistorsi’ dimana kita harus mengetik teks tersebut untuk menjalankan perintah.
  • Sebuah CAPTCHA adalah program yang dapat memberitahu apakah user adalah seorang ‘manusia asli’ atau ‘script komputer yang sudah diprogram’.
  • CAPTCHA digunakan banyak website untuk mencegah penyalahgunaan dari “bot” atau program otomatis yang biasanya ditulis untuk menghasilkan pesan-pesan spam pada internet.
  • Tidak ada program komputer yang dapat membaca teks terdistorsi sebaik mata manusia, sehingga bot tidak akan dapat menavigasi situs yang dilindungi oleh CAPTCHA
Dari situ diketahui bahwa salah satu fungsi reCAPTCHA adalah untuk mendigitalisasikan buku-buku pengetahuan bersejarah yang diterbitkan sebelum adanya komputer..
Bagaimana prosesnya digitalisasinya?
Penjelasan ada di bawah ini..
Mula-mula, buku yang ingin didigitalisasikan discan dulu menggunakan scanner..

Setelah discan, gambar yang dihasilkan diubah menjadi teks komputer menggunakan software Optical Character Recognition (OCR)..

masalahnya disini, hasil OCR belum tentu perfect..masih ada sebagian kata yang belum bisa diterjemahkan.. Naahh..saat inilah program reCAPTCHA dibutuhkan
reCAPTCHA membantu proses digitalisasi buku dengan mengirim kata-kata yang tidak dapat dibaca oleh komputer ke Web dalam bentuk CAPTCHA untuk diuraikan sendiri oleh manusia.
Lebih jelas lagi, setiap kata yang tidak bisa dibaca dengan benar oleh OCR akan ditempatkan pada gambar dan digunakan sebagai CAPTCHA. Hal ini dimungkinkan karena sebagian besar program OCR memberitahukan Anda bila kata tidak dapat dibaca dengan benar.
Lalu jika memang teks tersebut tidak bisa terbaca, lantas bagaimana sistem CAPTCHA mengetahui bahwa teks yang diketik user pada CAPTCHA itu benar/salah?..
Caranya adalah dengan menggunakan 2 kata pada setiap captcha. Kata pertama adalah kata yang memang sudah terbaca pada OCR, sedangkan kata kedua adalah kata yang belum terbaca.
User kemudian diminta untuk mengetik kedua kata tersebut pada CAPTCHA. Jika mereka berhasil memecahkan kata pertama (yg sudah diketahui), maka sistem juga menganggap jawaban mereka adalah benar untuk kata kedua . Sistem kemudian memberikan gambar tersebut kepada orang lain untuk diselesaikan, dengan menambah jumlah kemungkinan bahwa kata kedua memang ‘itu’ jawabannya..dst..


0 komentar:

Posting Komentar