Apa itu Optical Character Recognition (OCR)?

Daftar Isi:

Apa itu Optical Character Recognition (OCR)?
Apa itu Optical Character Recognition (OCR)?
Anonim

Optical Character Recognition (OCR) mengacu pada perangkat lunak yang membuat versi digital dari dokumen yang dicetak, diketik, atau ditulis tangan yang dapat dibaca oleh komputer tanpa perlu mengetik atau memasukkan teks secara manual. OCR umumnya digunakan pada dokumen yang dipindai dalam format PDF, tetapi juga dapat membuat versi teks yang dapat dibaca komputer dalam file gambar.

Apa OCR Itu

OCR, juga disebut sebagai pengenalan teks, adalah teknologi perangkat lunak yang mengubah karakter seperti angka, huruf, dan tanda baca (juga disebut mesin terbang) dari dokumen tercetak atau tertulis ke dalam bentuk elektronik yang lebih mudah dikenali dan dibaca oleh komputer dan program perangkat lunak lainnya. Beberapa program OCR melakukan ini sebagai dokumen yang dipindai atau difoto dengan kamera digital dan yang lainnya dapat menerapkan proses ini pada dokumen yang sebelumnya telah dipindai atau difoto tanpa OCR. OCR memungkinkan pengguna untuk mencari di dalam dokumen PDF, mengedit teks, dan memformat ulang dokumen.

Image
Image
Memindai koran bersejarah dengan perangkat lunak OCR.

Getty Images

Untuk Apa OCR Digunakan?

Untuk kebutuhan pemindaian sehari-hari yang cepat, OCR mungkin bukan masalah besar. Jika Anda melakukan banyak pemindaian, dapat mencari di dalam PDF untuk menemukan yang tepat yang Anda butuhkan dapat menghemat sedikit waktu dan membuat fungsionalitas OCR dalam program pemindai Anda lebih penting. Berikut adalah beberapa hal lain yang membantu OCR:

  • Pemrosesan data otomatis dan entri data (Contoh: Sistem pelacakan pelamar kerja untuk resume).
  • Membuat buku yang dipindai dapat dicari.
  • Mengonversi pindaian tulisan tangan menjadi teks yang dapat dibaca komputer.
  • Membuat dokumen lebih dapat digunakan oleh program pembaca yang membantu pengguna dengan gangguan penglihatan.
  • Melestarikan dokumen sejarah dan surat kabar, sekaligus membuatnya dapat dicari.
  • Ekstraksi data dan transfer ke program akuntansi (Contoh: Kwitansi dan faktur).
  • Mengindeks dokumen untuk digunakan oleh mesin pencari.
  • Pengenalan plat nomor pengemudi oleh kamera kecepatan dan perangkat lunak kamera lampu merah.
  • Speech synthesizer untuk orang yang tidak dapat berbicara – fisikawan teoretis, Stephen Hawking, mungkin adalah pengguna program speech synthesizer yang paling terkenal.

Intisari

Kenapa tidak difoto saja? Karena Anda tidak akan dapat mengedit apa pun atau menelusuri teks karena itu hanya berupa gambar. Memindai dokumen dan menjalankan perangkat lunak OCR dapat mengubah file tersebut menjadi sesuatu yang dapat Anda edit dan dapat dicari.

Sejarah OCR

Sementara penggunaan pengenalan teks paling awal dimulai pada tahun 1914, perkembangan luas dan penggunaan teknologi terkait OCR dimulai dengan sungguh-sungguh pada tahun 1950-an, khususnya dengan pembuatan font yang sangat disederhanakan yang lebih mudah dikonversi ke digital- teks yang dapat dibaca. Yang pertama dari font yang disederhanakan ini dibuat oleh David Shepard dan umumnya dikenal sebagai OCR-7B. OCR-7B masih digunakan sampai sekarang di industri keuangan untuk font standar yang digunakan pada kartu kredit dan kartu debit. Pada 1960-an, layanan pos di beberapa negara mulai menggunakan teknologi OCR untuk mempercepat penyortiran surat, termasuk Amerika Serikat, Inggris Raya, Kanada, dan Jerman. OCR masih merupakan teknologi inti yang digunakan untuk menyortir surat untuk layanan pos di seluruh dunia. Pada tahun 2000, pengetahuan kunci tentang batasan dan kemampuan teknologi OCR digunakan untuk mengembangkan program CAPTCHA yang digunakan untuk menghentikan bot dan spammer.

Selama beberapa dekade, OCR telah berkembang lebih akurat dan lebih canggih karena kemajuan di bidang teknologi terkait seperti kecerdasan buatan, pembelajaran mesin, dan visi komputer. Saat ini, perangkat lunak OCR menggunakan pengenalan pola, deteksi fitur, dan penambangan teks untuk mengubah dokumen lebih cepat dan lebih akurat daripada sebelumnya.

FAQ

    Bagaimana cara memindai dokumen dengan ponsel atau tablet saya?

    Di iOS, buka aplikasi Catatan dan buat catatan baru. Buka kamera, lalu ketuk Pindai Dokumen. Di Android, buka Google Drive dan pilih Plus (+), lalu ketuk Scan untuk memindai dokumen dengan ponsel Anda.

    Bagaimana cara menggunakan OCR di Adobe Acrobat?

    Buka file PDF yang berisi gambar pindaian, lalu pilih Tools > Edit PDF. Acrobat akan secara otomatis menerapkan OCR sehingga Anda dapat mengedit teks. Cukup pilih di mana Anda ingin mengedit dan mulai mengetik.

    Apa perbedaan antara OCR dan OMR?

    Optical Mark Recognition (OMR) adalah perangkat lunak yang mendeteksi tanda pada kertas, biasanya lembaran gelembung. OMR digunakan untuk mengolah hasil ujian, survei, angket, bahkan pemilu. Tidak seperti OCR, OMR tidak dapat menguraikan tanda pada halaman, tetapi hanya memverifikasi bahwa tanda tersebut ada.

Direkomendasikan: