I.
Pendahuluan
1.1
Latar Belakang
Perkembangan teknologi pada era modern ini,
sudah sangat cepat dan maju. Salah satunya adalah perkembangan teknologi
komputer. Komputer pada era modern ini sudah bukan barang yang asing dan
mahal lagi, pada saat ini hampir di segala bidang membutuhkan komputer sebagai
alat bantu, karena memiliki kelebihan yaitu dari segi kecepatan dan ketelitian.
Misalnya saja dibidang kesehatan, bidang teknik, sipil, perbankan, ilmu
pengetahuan, bisnis baik oleh pemerintah maupun swasta. Dimana sekarang juga
berkembang teknologi jaringan komputer, dimana orang bisa berkomunikasi dengan
menggunakan komputer, yang tidak hanya dalam satu ruangan, tetapi bisa meliputi
antar benua, yaitu Internet. Jadi bisa dikatakan komputer telah memasuki segala
bidang kehidupan kita.
Perkembangan dan pemanfaatan teknologi OCR
pada awalnya diperkenalkan oleh Itellegent Machine Corp pada tahun 1959 di
Amerika Serikat. Kemampuan baca hanya untuk satu jenis dan ukuran huruf saja
dan digunakan untuk kebutuhan kerja pada lingkungan industry perbankan.
Pada tahun 1966 dilakukan standarisasi huruf
OCR. Standar di Negara Amerika dikategorikan sebagai OCR-A sedangkan standar di
Negara – Negara Eropa dikategorikan sebagai OCR-B.
Baru pada awal tahun 1980 dilakukan standar
baku internasional pada system OCR. Perkembangan kemampuannya sudah mampu
menterjemahkan karakter gambar dalam dokumen teks seperti tampilan garis dan
kurva. Namun masih memiliki kelemahan terutama jika tampilan dokumen teks
berasal dari media cetak yang kurang jelas dan buram.
Pada tahun 1986 Calera Recognition System
memperkenalkan system Omni Font yang mampu membaca document dari berbagai
halaman yang berisi tipe-tipe huruf campuran. Sistem ini diakui lebih baik dari
program sebelumnya.
Pada tahun 1993 dengan teknologi Adaptive
Recognition, system tersebut dikembangakn kedalam mesin jaringan dengan
kemampuan baca yang lebih akurat dan mampu mengenal setiap karakter huruf
selama proses OCR, termasuk informasi tentang ukuran huruf, tipe dan tingkat
degradasi dari sebuah dokumen, seperti hasil cetak dari mesin faksimili. Konsep
program OCR yang dibuat oleh perusahaan Caere Corp menambahkan system analisis
bahasa. System tersebut merupakan media kamus yang mampu menterjemahkan setiap
kosa kata bahasa yang terdapat dalam dokumen teks yang dimaksud. Perusahaan
Caere Corp mengeluarkan dua program OCR dengan nama Omnipage Pro dan Word Scan
yang keduanya memiliki kelebihan dan kelemahan.
Pada tahun 1994, perusahaan ini membeli
perusahaan Calera sehingga lahirlah program OCR yang lebih sempurna dari dua
konsep teknologi sebelumnya sehingga lahirlah konsep teknologi POWR(Predictive
Optical Word Recognition). Dua tahun kemudian berkembang menjadi POWR++ dengan
kemampuan program OCR yang lebih dinamis dan dapat menerjemahkan dalam bentuk
teks maupun karakter algoritma(bersifat aritmatika).
1.2 Rumusan Masalah
1.
Apa yang dimaksud
dengan teknologi OCR?
2.
Bagaimana system kerja
OCR?
3.
Apa saja fungsi dari
OCR?
4.
Apa yang dimaksud
dengan Office Lens?
5.
Bagaimana cara
menggunakan Office Lens?
II.
Pembahasan
Optical Character Recognize
2.1 Pengertian Teknologi OCR
Teknologi OCR(Optical Character Recognize) adalah teknologi yang
mengkonversi image(hasil scan atau foto) yang didalamnya mengandung teks hasil
cetak mesin atau printer menjadi file dokumen teks yang dapat diedit kembali,
misalnya dalam format word, excel, powerpoint, pdf searchable, dant txt.
2.2 Definisi lain dari OCR
OCR adalah sebuah sistem komputer yang dapat
membaca huruf, baik yang berasal dari sebuah pencetak (printer atau mesin
ketik) maupun yang berasal dari tulisan tangan. Adanya sistem pengenal huruf
ini akan meningkatkan fleksibilitas ataupun kemampuan dan kecerdasan system
komputer. Dengan adanya sistem OCR maka user dapat lebih leluasa memasukkan
data karena user tidak harus memakai papan ketik tetapi bisa menggunakan pena
elektronik untuk menulis sebagaimana user menulis di kertas.
OCR adalah sebuah sistim komputer yang dapat
membaca huruf baik yang berasal dari sebuah printer maupun berasal dari tulisan
tangan . Dari Wikipedia bahasa Indonesia, ensiklopedia bebas, Rekognisi
karakter optik atau pengenalan huruf optik (lebih populer dalam
istilah bahasa Inggris, optical character recognition, yang biasa
disingkat OCR) adalah alat mekanis atau elektronika yang digunakan untuk
menerjemahkan tulisan tangan ataupun naskah ketikan (biasanya dipindai
menggunakan pemindai) menjadi teks yang dapat diedit dengan suatu aplikasi
komputer.
2.3 Sistem Kerja OCR
Data capture merupakan
proses konversi suatu dokumen (hardcopy) menjadi suatu file gambar (BMP). Preprocessing
merupakan suatu proses untuk menghilangkan bagian-bagian yang tidak
diperlukan pada gambar input untuk proses selanjutnya. Beberapa contoh
preprocessing adalah noise filtering yang terdiri dari :
-Segmentation adalah proses memisahkan area pengamatan (region)
pada tiap karakter yang akan dideteksi.
-Normalization adalah
proses merubah dimensi region tiap karakter dan ketebalan karakter. Dalam OCR
algoritma yang digunakan pada proses ini adalah algoritma scaling dan thinning.
-Feature Extraction adalah proses untuk Recognition mengambil ciri-ciri tertentu dari karakter yang diamati. Recognition merupakan proses untuk mengenali karakter yang diamati dengan cara membandingkan ciri-ciri karakter yang diperoleh dengan ciri-ciri karakter yang ada pada database.
-Postprocessing pada umumnya proses yang dilakukan pada tahap ini adalah proses koreksi ejaan sesuai dengan bahasa yang digunakan.
-Feature Extraction adalah proses untuk Recognition mengambil ciri-ciri tertentu dari karakter yang diamati. Recognition merupakan proses untuk mengenali karakter yang diamati dengan cara membandingkan ciri-ciri karakter yang diperoleh dengan ciri-ciri karakter yang ada pada database.
-Postprocessing pada umumnya proses yang dilakukan pada tahap ini adalah proses koreksi ejaan sesuai dengan bahasa yang digunakan.
Software OCR
berfungsi untuk merubah file Image/Gambar menjadi file Teks dengan format TXT.
Hal ini berguna apabila kita ingin mendapatkan file teks dari sebuah surat tanpa harus mengetik ulang seluruh tulisan yg terdapat didalam surat tersebut.
Hal ini berguna apabila kita ingin mendapatkan file teks dari sebuah surat tanpa harus mengetik ulang seluruh tulisan yg terdapat didalam surat tersebut.
Cara kerja software OCR tersebut:
1. Meratakan gambar (Auto Deskewing).
file image (gambar) akan diatur kemiringannya, apabila hasil scan ada kemiringan, maka gambar akan dibuat sejajar atau lurus.
1. Meratakan gambar (Auto Deskewing).
file image (gambar) akan diatur kemiringannya, apabila hasil scan ada kemiringan, maka gambar akan dibuat sejajar atau lurus.
2. Menganalisa (Analysis).
software (program) OCR akan menganalisa dan memisahkan bagian teks dan bagian gambar.
3. Otomatis mengatur arah gambar (Auto Orientation).
software (program) OCR akan mengambil sebagian area pada file image (gambar) dan mengidentifikasi arah teks yang benar.
file image (gambar) akan diputar ke arah yang benar, pilihannya adalah 90⁰, 180⁰ atau 270⁰.
4. Memisahkan setiap karakter huruf dan angka (Separating single character).
software (program) OCR akan memisahkan setiap karakter yang terdapat pada image (gambar) menjadi sebuah huruf atau angka.
5. Mengidentifikasi gambar (Capturing the features of the characters and comparing).
software (program) OCR akan mengidentifikasi satu persatu setiap gambar yang sudah dipisahkan, dan melakukan pengecekan terhadap database yang dimiliki oleh software (program) OCR, dan menetapkan huruf atau angka yang akan digunakan.
6. Menghasilkan file akhir (Recognition result output).
Setelah setiap image (gambar) sudah dirubah menjadi huruf atau angka (format teks) maka software (program) OCR akan menghasilkan sebuah file dengan format teks, seperti Microsoft Word, Microsoft Excel, TXT, Rich Text dan Searchable PDF, tergantung dari pengaturan awal.
Catatan:
Untuk menghasilkan sebuah proses OCR yang sempurna, gunakan resolusi scan 300dpi, dengan format warna Grayscale.
Ada juga kebutuhkan untuk mengkonfersi buku menjadi "buku digital" sehingga kita tidak perlu repot-repot membawa buku lagi, semua buku kita sudah terdapat didalam komputer kita.
2.4 Fungsi OCR
-Mengkonversi document PDF menjadi searchable agar teks didalam
dokumen mudah dicari kembali.
-Mudah menciptakan dokumen kembali dari dokumen kertas yang
sudah ada. Misal dari kertas yang sudah diprint menjadi word, excel ataupun
powerpoint.
-Memudahkan penanganan pekerjaan yang memakai input tulisan
seperti penyortiran surat di kantor pos, pemasukan data buku di perpustakaan,
dll. Adanya sistem pengenal huruf yang cerdas akan sangat membantu usaha
besar-besaran yang saat ini dilakukan banyak pihak yakni usaha digitalisasi
informasi dan pengetahuan, misalnya dalam pembuatan koleksi pustaka digital,
koleksi sastra kuno digital, dll.
2.5 Akurasi OCR
Akurasi OCR sangat tergantung dari beberapa hal yaitu:
-Kualitas image yang dihasilkan scanner, apabila kualitas bagus
maka akurasinya semakin tinggi
-Bahasa yang disupport oleh software OCR. Misal: Dokumen
berbahasa Indonesia akan lebih akurat apabila diproses oleh software yang
mendukung bahasa Indonesia.
-Teknologi pengenalan objek-objek dalam suatu dokumen oleh
Software OCR yang bai. Software OCR yang baik harus membedakan image, table,
dan objek lain seperti header dan footer.
2.6 Pengertian Office lens
Office Lens adalah cara yang hebat untuk merekam catatan dan
info dari pada papan tulis, Menu, tanda, memo tulisan tangan, atau apa pun
dengan banyak teks. Anda tidak perlu menulis catatan, bergantung pada buram
gambar atau khawatir tentang penempatan apa pun. Sangat bagus bisa menangkap
sketsa, Gambar, dan persamaan terlalu, dan bahkan gambar tanpa teks.
Office Lens menghilangkan bayangan dan sudut
yang aneh sehingga gambar lebih mudah dibaca. Anda dapat mengunduh Office Lens
secara gratis dari Google Play.
Anda dapat menyimpan gambar dokumen dan papan tulis ke Word,
PowerPoint, OneNote, OneDrive, sebagai PDF, atau menyimpannya di Galeri Anda.
2.7 Cara menggunakan office lens
1. Pilih salah satu mode
Tersedia
tiga mode untuk mengambil foto pada Office Lens. Tiga mode tersebut yaitu:
- Photo mode. Mode ini untuk mengambil foto secara normal (objek
orang atau pemandangan).
- Document
mode. Mode ini digunakan untuk
mengambil foto dokumen, brosur, kartu nama dan lain sejenisnya. Hasil foto
akan otomatis memotong bagian dokumen pada foto yang diambil, sehingga
memudahkan untuk dibaca.
·
Whiteboard mode. Mode ini digunakan untuk mengambil foto dari papan tulis,
mencegah hasil foto berbayang dan mengoptimalkan kontras secara otomatis.
·
Kartu
nama . Mode ini
akan membantu Anda mengekstrak informasi kontak dan menyimpannya ke daftar
kontak Anda dan masuk ke OneNote. Mode ini berfungsi baik dengan kartu nama
dalam bahasa Inggris, Jerman, Spanyol, dan Cina sederhana.
2. Ambil gambar
Pilih apakah menggunakan atau tidak menggunakan flash, dan pilih
opsi lainnya seperti resolusi foto. Untuk memfoto item secara tepat, pastikan
item ada dalam bingkai, lalu gunakan tombol Kamera untuk mengambil gambar Anda.
2.8 Meninjau dan mengedit
Anda bisa mengedit foto sebelum menyimpannya sehingga sama
persis seperti yang Anda inginkan agar. Mengulang gambar dengan menghapus
pratinjau saat ini. Gunakan fitur pemotongan untuk memotong bagian gambar yang
tidak Anda perlukan. Tekan ikon putar untuk memutar gambar. Saat Anda sudah puas
dengan hasil editan Anda, pilih lokasi penyimpanan gambar Anda.
Untuk menangkap dalam mode foto, dokumen, atau
papan tulis, Anda bisa menyimpan gambar ke OneNote, OneDrive, sebagai file Word
atau PowerPoint, atau sebagai PDF. Untuk opsi ini, Anda akan diminta untuk
masuk dengan Microsoft, kantor, atau akun sekolah. Secara default, foto yang
disimpan ke OneNote akan berada di buku catatan utama. Anda juga bisa menyimpan
gambar ke Galeri telepon Anda.
Untuk menangkap diambil di mode kartu nama,
ketuk OneNote (gambar + kontak) untuk menyimpan gambar ke ponsel Anda kontak
sebagai vCard (.vcf file), atau menyimpan foto ke Galeri telepon Anda.
Ketuk tanda centang untuk menyelesaikan.
CATATAN:
Jika Anda baru menggunakan OneNote, Anda akan
menemukan foto Anda di bagian catatan cepat <Anda nama depan> buku
catatan. Jika Anda telah menggunakan OneNote untuk sementara waktu, buku
catatan Anda akan memiliki nama yang berbeda, seperti pribadi, pribadi (web),
atau buku catatan saya, dan konten yang Anda potret akan berada di bagian
catatan tak terarsip.
Ketika Anda menyimpan informasi kartu nama ke
OneNote, foto dan info kontak Anda akan berada di bagian kontak yang dibuat
OneNote dalam <Anda nama depan> buku catatan. OneNote (gambar + kontak)
akan mengenali detail kontak dan memungkinkan Anda menyimpannya ke kontak Anda.
Ini akan membuat dua output: Halaman OneNote dan .vcf file. Halaman OneNote
berisi informasi kontak dikenali, gambar yang dipindai dan VCF file. VCF file
memperlihatkan dikenali info kontak yang bisa Anda simpan ke kontak lokal Anda.
2.9 Informasi tambahan
Foto yang disimpan sebagai file Word dan
PowerPoint, atau sebagai PDF akan berada dalam folder Dokumen Anda di OneDrive,
sehingga Anda bisa mengakses file tersebut dari perangkat apa pun. Office Lens tidak
hanya mengambil gambar dan mengimpor gambar ke file Word atau PowerPoint.
Dokumen Word dan PowerPoint finalnya adalah dokumen Office asli.
Untuk Word, Office Lens mengenali teks,
tulisan tangan atau hasil cetak, dan tata letak dokumen. Semua teks, pemformatan
dan tata letak di dalam dokumen Word akan dibuatnya sepenuhnya dapat diedit —
sama seperti dokumen yang dibuat di meja Anda.
Untuk PowerPoint, semua garis dan goresan
tulisan tangan diubah menjadi objek gambar PowerPoint yang bisa diwarnai ulang,
diubah ukurannya, dipindahkan, dan diedit. Anda juga bisa menghapus latar
belakang gambar, yang membuat semakin mudah untuk menggunakan kembali gambar di
presentasi lain.
Untuk PDF, Office Lens mengekstrak informasi
teks. Anda bisa mencari konten dalam file dengan teks dan Anda bisa menyoroti
atau menyalin bagian halaman dengan aplikasi pembaca PDF Anda.
2.10 Aksesibilitas
Untuk mempermudah
untuk bekerja dengan Office Lens, Anda bisa menyambungkan keyboard ke perangkat
Anda dengan Bluetooth atau USB. Selain itu, Android memiliki pengaturan
aksesibilitas yang bisa membantu Anda menggunakan Office Lens dengan cara yang
sesuai untuk Anda. Aksesibilitas pengaturan biasanya mengatur selama penyetelan
awal perangkat tersebut, namun Anda bisa masuk ke pengaturan > Pengaturan
aksesibilitas untuk mengaktifkan fitur seperti TalkBack dan jelajahi
dengan sentuh. Anda bisa mempelajari selengkapnya di Android aksesibilitas
Bantuan Pusat.
Omnipage adalah salah satu aplikasi OCR yaitu program yang bisa
mengkonversi tulisan hasil scan menjadi tulisan yang bisa kita edit di program
pengolah kata seperti Microsoft Word atau Notepad (definisi kasarnya seperti
itu). Jadi kita ga per repot-repotngetik lagi bukan? Dengan hasil scanning yang
semakin semakin baik kini hadir dalam bentuk portable.
Men- Setting Scanner dengan Mode
OCR
OCR (Optical Character Recognition). Teknologi untuk
mengubah image suatu dokumen hasil scan menjadi bentuk teks (misalnya ke dalam
kode ASCII),yang dapat diedit dengan aplikasi pengolah .
Langkah- langkah men-setting scanner dengan program OCR:
1. Klik start >
program>scansoft omnipage pro 11.
2. Tempatkan dokumen yang
akan di-scan dengan posisi gokumen menghadap ke lensa dan diposisikan sudut
kanan atas permukaan mesin scanner, pastikan bahwa mesin scanner dalam kondisi
‘on’.
3. Klik menu Process-
Process Setting
4. Hilangkan tanda cek (v)
dari: Automatically Proofread in OCR
5. Klik OK
Ketika file laporan yang ada di desket rusak, sehingga tidak
dapat diakses. Kita lupa menyimpannya di harddisk dan tidak punya backup data.
Untungnya kita sudah punya print out-nya dan ingin mengedit
kembali karena laporan yang kita buat isinya belum lengkap dan ada beberapa
hasil ketikan yang salah. Kita juga ingin laporan tersebut dalam bentuk disket,
sehingga praktis membawanya dan mudah mempresentasikannya dengan klien.
Di bawah ini adalah cara untuk menampilkan program OCR:
1.Dengan program simple OCR
Klik start-program –simple OCR
Selain menggunakan software OCR bagi pengguna Office 2002(XP) ke
atas dapat menggunakan aplikasi microsoft office document scanning. Untuk
memulai menggunakannya pada OS Windown XP adalah klik start- all program-
microsoft office tools- lalu pilih microsoft office document scanning.
III.
Kesimpulan
Demikian yang dapat saya paparkan mengenai
OCR(Optical Character Recognize) pada Aplikasi Lensa Office, jadi Teknologi
OCR(Optical Character Recognize) adalah teknologi yang mengkonversi image(hasil
scan atau foto) yang didalamnya mengandung teks hasil cetak mesin atau printer
menjadi file dokumen teks yang dapat diedit kembali, misalnya dalam format
word, excel, powerpoint, pdf searchable, dant txt.
Fungsi OCR yaitu :
-Mengkonversi document PDF menjadi searchable agar teks didalam
dokumen mudah dicari kembali.
-Mudah menciptakan dokumen kembali dari dokumen kertas yang
sudah ada. Misal dari kertas yang sudah diprint menjadi word, excel ataupun
powerpoint.
-Memudahkan penanganan pekerjaan yang memakai input tulisan
seperti penyortiran surat di kantor pos, pemasukan data buku di perpustakaan,
dll.
Saya berharap para pembaca dapat memberikan kritik dan saran
yang membangun kepada penulis demi sempurnanya artikel ini kedepannya. Semoga
artikel ini berguna bagi penulis dan siapa saja yang membacanya.





