OCR adalah dan 7 Aplikasi Gratis yang Dapat Kamu Gunakan

Apakah kamu pernah mendengar istilah OCR sebelumnya? OCR adalah kepanjangan dari Optical Character Recognition, yang merupakan teknologi yang dapat membedakan dan mengenali bentuk tulisan pada sebuah gambar.

Lho, kalau seperti sama saja seperti scanner dong? Fungsinya bisa dibilang mirip, hanya saja teknologi OCR memiliki cara kerja dan teknis yang berbeda dari sebuah scanner. Untuk mengetahui lebih jauh lagi mengenai OCR (optical character recognition) kamu harus baca artikel ini lebih lanjut.

Pada artikel ini kamu akan menjelaskan pengertian dari OCR itu sendiri, cara kerjanya, dan informasi menarik lainnya. Yuk, langsung saja kita mulai pembahasannya.

  • Isi form berikut ini untuk mendapatkan demo gratis aplikasi HR Suites hari ini.
  • This field is for validation purposes and should be left unchanged.

OCR adalah (Optical Character Recognition)

OCR adalah teknologi yang dapat mengenali tulisan dalam sebuah gambar menjadi data teks yang dapat dibaca dalam sebuah komputer. Baik itu tulisan tangan ataupun tulisan digital.

Pernahkah kamu mengalami masalah seperti berikut? Saat kamu melakukan scan sebuah dokumen dan kamu ingin melakukan pengeditan atau apapun itu, pada teks yang telah kamu scan ke dalam sebuah program pengolahan data, misal Ms.Word. Apa yang terjadi?

Kamu pasti tidak akan dapat melakukan pengeditan teks tersebut, karena cara kerja pada scanner sendiri hanya mengubah teks atau dokumen kedalam bentuk gambar yang umumnya memiliki format JPG. 

Jangankan pengeditan, untuk melakukan copy paste kata-kata yang ada saja tidak mungkin bisa kamu lakukan. Berbeda halnya jika scanner kamu atau alat lain yang memiliki program Optical Character Recognition. 

Kamu pasti dapat langsung melakukan perubahan pada teks dokumen yang telah discan dengan alat yang memiliki sistem atau program OCR. Mengapa demikian? Yuk, simak cara kerjanya.

Teknologi Apa yang Ada Di Balik OCR?

Optical Character Recognition, atau OCR, adalah teknologi yang memungkinkan Kamu mengonversi berbagai jenis dokumen, seperti dokumen kertas yang dipindai, file PDF, atau gambar yang diambil dengan kamera digital menjadi data yang dapat diedit dan dicari.

Bayangkan Kamu memiliki dokumen kertas – misalnya, artikel majalah, brosur, atau kontrak PDF yang dikirimkan mitra Kamu kepada Kamu melalui email. Jelas, pemindai tidak cukup untuk membuat informasi ini tersedia untuk diedit, misalnya di Microsoft Word. Yang dapat dilakukan pemindai hanyalah membuat gambar atau snapshot dari dokumen yang tidak lebih dari kumpulan titik hitam dan putih atau titik warna, yang dikenal sebagai gambar raster. Untuk mengekstrak dan menggunakan kembali data dari dokumen yang dipindai, gambar kamera atau PDF gambar saja, Kamu memerlukan perangkat lunak OCR yang akan memilih huruf pada gambar, memasukkannya ke dalam kata-kata dan kemudian, kata-kata menjadi kalimat, sehingga memungkinkan Kamu untuk mengakses dan edit isi dokumen asli.

Optical Character Recognition (OCR) : Which solution to choose ? |  AI-Compare | Medium

Kasus penggunaan pengenalan karakter OCR adalah

OCR dapat digunakan untuk berbagai aplikasi, termasuk:

  • Memindai dokumen yang dicetak menjadi versi yang dapat diedit dengan pengolah kata, seperti Microsoft Word atau Google Docs.
  • Mengindeks materi cetak untuk mesin pencari.
  • Mengotomatiskan entri data, ekstraksi dan pengolahan.
  • Menguraikan dokumen menjadi teks yang dapat dibacakan untuk pengguna yang memiliki gangguan penglihatan atau tunanetra.
  • Mengarsipkan informasi bersejarah, seperti surat kabar, majalah atau buku telepon, ke dalam format yang dapat dicari.
  • Menyimpan cek secara elektronik tanpa perlu teller bank.
  • Menempatkan dokumen hukum penting yang ditandatangani ke dalam database elektronik.
  • Mengenali teks, seperti pelat nomor, dengan kamera atau perangkat lunak.
  • Menyortir surat untuk pengiriman surat.
  • Menerjemahkan kata-kata dalam gambar ke dalam bahasa tertentu.

Pada Prinsip Mana yang Berbasis FineReader OCR?

Sistem pengenalan karakter optik paling canggih, seperti ABBYY FineReader OCR, difokuskan pada penggandaan pengenalan alami atau “seperti binatang”. Inti dari sistem ini terletak pada tiga prinsip dasar: Integritas, Tujuan, dan Kemampuan Beradaptasi. Prinsip integritas mengatakan bahwa objek yang diamati harus selalu dianggap sebagai “keseluruhan” yang terdiri dari banyak bagian yang saling terkait. Prinsip tujuan mengandaian bahwa setiap interpretasi data harus selalu memiliki tujuan tertentu. Dan prinsip adaptabilitas berarti program harus mampu belajar mandiri.

Seseorang tidak perlu menjadi spesialis OCR untuk melihat keuntungan dari aplikasi OCR yang dibangun di atas prinsip IPA. Prinsip-prinsip ini memberikan program dengan fleksibilitas dan kecerdasan maksimum, membuatnya sedekat mungkin dengan pengenalan manusia.

Setelah bertahun-tahun melakukan penelitian, ABBYY dapat menerapkan prinsip-prinsip IPA yang dijelaskan di atas dalam teknologi OCR-nya.

Pengakuan Gambar Kamera Digital

Gambar yang diambil dengan kamera digital berbeda dari dokumen yang dipindai atau PDF gambar saja. Mereka sering memiliki cacat seperti distorsi di bagian tepi dan cahaya redup, sehingga menyulitkan sebagian besar aplikasi OCR untuk mengenali teks dengan benar. Versi terbaru ABBYY Fine Reader PDF mendukung teknologi pengenalan adaptif yang dirancang khusus untuk memproses gambar kamera. Ini menawarkan berbagai fitur untuk meningkatkan kualitas gambar tersebut, memberi Kamu kemampuan untuk sepenuhnya menggunakan kemampuan perangkat digital Kamu.

OCR Software for Scanned Document and Image Conversion

Menggunakan Software OCR

Menggunakan ABBYY FineReader OCR mudah: proses umumnya terdiri dari tiga tahap: Buka (Pindai) dokumen, Kenali, lalu Simpan dalam format yang sesuai (.DOC, .RTF, .XLS, .PDF, .HTML, .TXT, dll. .) atau mengekspor data secara langsung ke salah satu aplikasi Office seperti Microsoft Word, Excel, atau Adobe Acrobat.

Selain itu, versi terbaru ABBYY FineReader PDF mendukung mode Tugas Otomatis yang penting saat Kamu menangani tugas rutin secara teratur. Dengan fitur ini, tugas pengenalan berjalan secara otomatis tanpa harus menjalankan semua langkah yang disebutkan di atas secara manual.

OCR / Scanning, OCR Scanning Service - Raylon Technologies, Kolkata | ID:  4926808730

Manfaat Apa yang Dibawa OCR adalah bagi Kamu?

Dengan FineReader OCR, dokumen yang dikenali tampak seperti aslinya. Perangkat lunak OCR yang canggih dan canggih memungkinkan Kamu menghemat banyak waktu dan tenaga saat membuat, memproses, dan menggunakan kembali berbagai dokumen. Dengan ABBYY FineReader OCR, Kamu dapat memindai dokumen kertas untuk diedit lebih lanjut dan dibagikan dengan kolega dan mitra Kamu. Kamu dapat mengekstrak kutipan dari buku dan majalah dan menggunakannya untuk membuat studi kursus dan makalah Kamu tanpa perlu mengetik ulang. Dengan kamera digital dan FineReader OCR, Kamu dapat menangkap teks di luar ruangan dari spanduk, poster, dan jadwal dan kemudian menggunakan informasi yang diambil untuk tujuan Kamu. Dengan cara yang sama, Kamu dapat menangkap informasi dari dokumen kertas dan buku. Misalnya, jika tidak ada pemindai di dekat Kamu atau Kamu tidak dapat menggunakannya.

Seluruh proses konversi data dari dokumen kertas asli, gambar atau PDF membutuhkan waktu kurang dari satu menit, dan dokumen akhir yang dikenali terlihat seperti aslinya!

Pelajari lebih lanjut informasi tentang bagaimana perangkat lunak OCR kami dapat membantu Kamu dalam kehidupan sehari-hari dalam deskripsi fitur dan manfaat perangkat lunak FineReader untuk Windows dan Mac.

Elite | Records Management & Document System

Pengenalan Karakter OCR adalah

Mari kita lihat tiga langkah dasar pengenalan karakter optik: pra-pemrosesan gambar; pengenalan karakter; dan pasca-pemrosesan output.

Langkah 1: Pra-Pemrosesan Gambar di OCR

Perangkat lunak OCR sering melakukan pra-proses gambar untuk meningkatkan peluang pengenalan yang berhasil. Tujuan dari pengolahan awal citra adalah untuk memperbaiki data citra yang sebenarnya. Dengan cara ini, distorsi yang tidak diinginkan dapat ditekan dan fitur gambar tertentu ditingkatkan. Kedua proses ini penting untuk langkah-langkah berikut.

Langkah 2: Pengenalan Karakter di OCR

Pengakuan Karakter Pelat Lisensi

Untuk pengenalan karakter yang sebenarnya, penting untuk memahami apa itu “ekstraksi fitur”. Jika data masukan terlalu besar untuk diproses, hanya serangkaian fitur yang diperkecil yang dipilih. Fitur-fitur yang dipilih diharapkan menjadi yang penting sedangkan yang diduga mubazir diabaikan. Dengan menggunakan kumpulan data yang dikurangi alih-alih yang besar awal, kinerja ditingkatkan.

Untuk proses OCR, ini penting karena algoritme harus mendeteksi bagian atau bentuk tertentu dari aliran gambar atau video digital.

Langkah 3: Pasca Pemrosesan di OCR

Pasca-pemrosesan adalah teknik koreksi kesalahan lain yang memastikan akurasi tinggi OCR. Akurasi dapat ditingkatkan lebih lanjut jika keluarannya dibatasi oleh leksikon. Dengan begitu, algoritme dapat kembali ke daftar kata yang diizinkan muncul di dokumen yang dipindai, misalnya.

OCR tidak hanya digunakan untuk mengidentifikasi kata-kata yang tepat tetapi juga dapat membaca angka dan kode. Ini berguna untuk mengidentifikasi rangkaian panjang angka dan huruf, seperti nomor seri yang digunakan di banyak industri.

Untuk menangani dengan lebih baik berbagai jenis input OCR, beberapa penyedia mulai mengembangkan sistem OCR khusus. Sistem ini mampu menangani gambar khusus, dan untuk meningkatkan akurasi pengenalan, bahkan lebih, mereka menggabungkan berbagai teknik pengoptimalan.

Misalnya, mereka menggunakan aturan bisnis, ekspresi standar, atau informasi lengkap yang terdapat dalam gambar berwarna. Strategi penggabungan berbagai teknik pengoptimalan ini disebut “OCR berorientasi aplikasi” atau “OCR yang disesuaikan”. Ini digunakan dalam aplikasi seperti OCR kartu nama, OCR faktur, dan OCR kartu ID.

Cara kerja OCR (Optical Character Recognition)

Mengapa alat atau scanner yang memiliki sistem OCR dapat melakukan pengolahan data teks secara langsung? Sistem kerja OCR adalah melakukan scanning huruf per huruf yang ada dalam sebuah dokumen ataupun gambar.

Sehingga data yang dihasilkan memang data yang dikenali oleh program pengolahan kata sebagai huruf dan bukan gambar. Sangat jauh berbeda dari sistem kerja scanner biasa yang hanya mengubah sesuatu kedalam bentuk gambar

  • Isi form berikut ini untuk mendapatkan demo gratis aplikasi HR Suites hari ini.
  • This field is for validation purposes and should be left unchanged.

OCR sendiri tidak hanya terdapat bisa terdapat dalam sebuah scaner saja, tapi banyak aplikasi atau alat-alat lain dengan sistem satu ini, yang sangat membantu dan mempercepat proses digitalisasi tulisan.

Adapun langkah-langkah cara kerjanya adalah sebagia berikut:

Melakukan scan dokumen ke dalam bentuk gambar digital

setelah semua dokumen berhasil discan, selanjutnya software OCR mengubah dan membagi dokumen ke dalam dua jenis, hitam dan putih.

kemudian  hasil scan atau gambar yang ada diannalisa dalam bentuk bitmap dari dua jenis area, area terang dan gelap.

Area terang dikenali sebagai background, sedangkan area gelap dikenali sebagai objek atau karakter.

Sistem OCR memproses lebih lanjut untuk mengidentifikasi objek berupa huruf dan angka dari dokumen yang discan dengan sistem algoritme OCR.

Algoritme OCR (Optical Character Recognition)

Setiap pengembang OCR pasti memiliki teknik dan design algoritme yang berbeda-beda. Namun, ada dua jenis algoritme yang umumnya digunakan sebagai dasar pembuatan sistemnya. Apa saja dua algoritme yang dimaksud? Berikut penjelasannya.

  1. Pattern recognition, sistem OCR diberikan contoh-contoh dan sample-sample teks dan tulisan yang digunakan sebagai pembanding dan pengenal terhadap objek teks, tulisan, dan angka pada sebuah gambar.
  2. Feature detection, sistem OCR didesign untuk mengidentifikasi dan mengenali sebuah karakter secara spesifik. Sisitem OCR dibangun dengan fitur yang dapat mengenali sudut garis, garis melintang, dan garis lengkung pada sebuah karakter. Contoh huruf A, sistem OCR akan mengindentifikasi garis A sebagia dua garis diagonal yang mengerucut, dengan garis horizontal ditengahnya.

Contoh Penggunaan Sistem OCR (Optical Character Recognition)

Sebenarnya dalam kehidupan sehari-hari kita sudah banyak menggunakan aplikasi atau softwar yang memiliki sistem OCR, hanya saja kita tidak memperhatikannya. Contoh penggunaan sistem OCR adalah sebagai berikut:

  • scan hardcopy dokumen kedalam bentuk digital yang dapat diolah oleh software Ms.word ataupun google docs.
  • pengindexan material dalam search engine
  • mempermudah proses, extract, dan entry data
  • penguraian dokumen ke dalam teks yang dapat diubah ke dalam bentuk suara yang sangat berguna pada penyandang tunanetra.
  • membuat archieve dokumen yang mudah dikelola
  • mendigitalisasi legal dokumen 
  • dan masih banyak lagi.

7 Free OCR software yang Dapat Membatu Pekerjaanmu

Nah, pada bagian ini kamu akan menemukan software gratis yang dapat kamu gunakan untuk kebutuhan personal. Kamu juga dapat menggunakan versi premium berbayarnya yang tentunya memiliki fitur-fitur lebih dibandingkan versi gratisnya.

Software-software OCR adalah sebagai berikut:

Microsoft OneNote

Microsoft OneNote memiliki sistem OCR yang cukup canggih karena bisa mendeteksi kata baik dari gambar ataupun bentuk scan catatan  tulisan tangan. OneNote sendiri memiliki versi gratis yang diperuntukan untuk penggunaan personal dan memiliki versi berbayar dengan fitur-fitur tambahan yang ditawarkan.

Kamu hanya perlu membuka file gambar atau dokumen scan , klik kanan dan pilih pilihan “copy text from picture (printout)” dan selesai. Tentu saja, kualitan scan dan gambar akan mempengaruhi kualitas keakuratan teks yang dicopy.

Photo Scan

Photo Scan adalah freeware Windows 10 yang memiliki fungsi OCR yang dapat mengolah teks dari sebuah gambar. Diibuat oleh Define Studio aplikasi ini tidak hanya memiliki sistem OCR tetapi juga dapat melakukan scanning dan generate QR Code.

a9t9 Software

Satu lagi free software OCR adalah a9t9 Software, software ini merupakan open source software yang dapat kamu temukan di microsoft store dan dapat digunakan oleh siapapun.

Aplikasi ini mendukung 20 jenis bahasa mulai dari bahasa inggris, cina, jepang, korea, portugis, dan bahasa lainnya. Aplikasi ini sangat mudah dilakukan pemasangan dan kamu dapat melakukan imrovisasi dan penyesuaian program, karena a9t9 adalah open source software.

Capture2text

Capture2text juga merupakan software gratis yang memiliki sistem OCR. Untuk mengaktifkan aplikasi ini di laptop atau komputer kamu. Kamu hanya perlu menekan tombol keyboard shortcut WinKey + Q untuk mengaktifkan Capture2text dan menggunakan mouse untuk menandakan daerah mana yang ingin kamu ambil.

Capture2text mengadaptasi sistem OCR yang dimiliki oleh google, selain itu aplikasi ini mendukung lebih dari 100 jenis bahasa.

SimpleOCR

SimpleOCR adalah salah satu pilihan aplikasi OCR gratis yang dapat kamu temukan di internet. Aplikasi ini selain memiliki versi gratisnya juga memiliki versi berbayar yang tentuya memiliki fitur-fitur tambahan yang tidak dimiliki versi gratisnya.

Versi berbayarnya dapat mengenali huruf secara akurat meskipun kualitas sumbernya kurang bagus atau dalam dokumen memiliki multi kolom.

Easy Screen OCR

Aplikasi gratis selanjutnya adalah Easy Screen OCR. Sebenarnya aplikasi ini tidak gratis, tapi kamu bisa menggunakan aplikasi ini sebanyak 20 kali tanpa perlu berlangganan. Jadi apa bila hanya sesekali membutuhkan sistem OCR, Easy Screen OCR dapat menjadi pilihan.

GoogleDocs

Siapa sangka Google Docs yang semakin sering digunakan saat ini memiliki sistem OCR yang dapat mendeteksi dan mengenali tulisan dalam gambar ataupun dokumen dalam bentuk PDF.

Cara menggunakan sistem OCR dalam Google Docs langkah-langkahya adalah sebagai berikut.

  1. login ke dalam google drivemu
  2. masukan atau upload data yang kamu ingin ubah baik itu dokumen PDF atau gambar kedalam google drive kamu.
  3. Klik kanan pada file PDF atau gambar dan pilih pilhan “open with google docs “
  4. Dokumen PDF atau gambar kamu akan terbuka dalam google docs dan kamu sudah bisa langsung pengeditan teks. Mungkin ada beberapa kesalahan teks karena kualitas gambar yang kurang jelas.

Google Docs mendukung lebih dari 100 bahasa dan mengenali dokumen atau gambar dengan format JPEG, PNG, GIF, and PDF dengan ukuran files tidak lebih dari 2MB dan text harus memiliki ukuran 10 pixel atau lebih.

Salah satu terobosan sistem OCR adalah mempermudah penyimpanan bukti keuangan baik itu resi atau faktur yang penting dalam akuntansi sebagai alat bukti transaksi yang sah dalam pembukuan perushaan.

JojoExpense adalah aplikasi manajeman business expense yang memiliki sistem OCR yang dapat menyimpan resi, faktur dan bukti transaksi lainnya dan langsung menyimpan data tersebut kedalam cloud server Jojonomic.

Jojojexpense

Jadi proses administrasi, reimbursement dan pengelolaan expense menjadi lebih mudah, efisiensi dan produktifitas perusahaan pun semakin meningkat.