Deteksi Teks pada Gambar Menggunakan OCR (Optical Character Recognition)

Deteksi Teks pada Gambar Menggunakan OCR (Optical Character Recognition)

Apakah itu OCR ?

OCR (Optical Character Recognition) adalah teknologi yang memungkinkan Anda untuk mengkonversi berbagai jenis dokumen, seperti dokumen kertas yang dipindai, file PDF atau gambar yang diambil oleh kamera digital menjadi data yang dapat diedit dan dicari.

Secara harfiah, OCR adalah singkatan dari Optical Character Recognition. Ini adalah teknologi luas untuk mengenali teks di dalam gambar, seperti dokumen dan foto yang dipindai. Teknologi OCR digunakan untuk mengubah hampir semua jenis gambar yang mengandung teks tertulis (diketik, tulisan tangan atau dicetak) menjadi data teks yang dapat dibaca mesin.

Teknologi OCR menjadi populer di awal 1990-an ketika berusaha mendigitalkan surat kabar bersejarah. Sejak itu teknologi telah mengalami beberapa perbaikan. Saat ini solusi menghadirkan akurasi OCR yang mendekati sempurna. Metode canggih seperti Zonal OCR digunakan untuk mengotomatisasi alur kerja berbasis dokumen yang kompleks

Kasus penggunaan populer untuk teknologi OCR

Mungkin use case yang paling terkenal untuk OCR adalah mengubah dokumen kertas cetak menjadi dokumen teks yang dapat dibaca mesin. Setelah dokumen kertas yang dipindai melewati pemrosesan OCR, teks dokumen dapat diedit dengan pengolah kata seperti Microsoft Word atau Google Documents. Sebelum teknologi OCR tersedia, satu-satunya pilihan untuk mendigitalkan dokumen kertas tercetak adalah mengetik ulang teks secara manual. Ini tidak hanya menghabiskan banyak waktu, tetapi juga disertai dengan ketidakakuratan dan kesalahan pengetikan.

OCR sering digunakan sebagai teknologi "tersembunyi", memberi daya pada banyak sistem dan layanan terkenal dalam kehidupan kita sehari-hari. Teknologi kurang dikenal, tetapi yang terpenting kasus penggunaan untuk teknologi OCR termasuk otomatisasi entri data, pengindeksan dokumen untuk mesin pencari, pengenalan plat nomor otomatis, serta membantu orang buta dan tunanetra.

Teknologi OCR telah terbukti sangat berguna dalam mendigitalkan surat kabar dan teks bersejarah yang kini telah dikonversi ke dalam format yang sepenuhnya dapat dicari dan telah membuat mengakses teks-teks sebelumnya lebih mudah dan lebih cepat.

1. Meratakan gambar (Auto Deskewing)

File image (gambar) akan diatur kemiringannya, apabila hasil scan ada kemiringan, maka gambar akan dibuat sejajar atau lurus.

2. Menganalisa (Analysis)

Software (program) OCR akan menganalisa dan memisahkan bagian teks dan bagian gambar.

3. Otomatis mengatur arah gambar (Auto Orientation)

Software (program) OCR akan mengambil sebagian area pada file image (gambar) dan mengidentifikasi arah teks yang benar. File image (gambar) akan diputar ke arah yang benar, pilihannya adalah 90°, 180°, atau 270°.

4. Memisahkan setiap karakter huruf dan angka (Separating single character)

Software (program) OCR akan memisahkan setiap karakter yang terdapat pada image (gambar) menjadi sebuah huruf atau angka.

5. Mengidentifikasi gambar (Capturing the features of the characters and comparing)

Software (program) OCR akan mengidentifikasi satu persatu setiap gambar yang sudah dipisahkan, dan melakukan pengecekan terhadap database yang dimiliki oleh software (program) OCR, dan menetapkan huruf atau angka yang akan digunakan.

6. Menghasilkan file akhir (Recognition result output)

Setelah setiap image (gambar) sudah dirubah menjadi huruf atau angka (format teks) maka software (program) OCR akan menghasilkan sebuah file dengan format teks, seperti Microsoft Word, Microsoft Excel, TXT, Rich Text dan Searchable PDF, tergantung dari pengaturan awal.

Nah, begitulah cara kerja OCR hingga dapat mendeteksi teks pada gambar menjadi teks digital.

 

http://teknologi-scanner.blogspot.com/2013/08/bagaimana-cara-kerja-program-ocr.html

https://docparser.com/blog/what-is-ocr/

https://www.abbyy.com/en-us/finereader/what-is-ocr/