Các tài liệu đã scan thường ở dạng file ảnh nên nếu có điều kiện chúng ta hãy chuyển nó thành file text (có thể copy ,past được),vì các lý do sau đây:
+Có thể trích đoạn,post lên web
+Các công cụ tìm kiếm có thể biết được nội dung tài liệu
+Giúp người đọc dễ dàng hơn trong việc đón nhận thông tin,tài liệu scan rất gây khó chịu khi đọc

Giới thiệu về phần mệm VnDOCR 4.0
VnDOCR 4.0 Professional

Bạn cần tổng hợp thông tin từ nhiều loại giấy tờ, sách báo ư ? Thật là đơn giản nếu như bạn đã có một bộ Máy tính, Scanner (máy quét) thì hãy mua Phần mềm Nhận dạng chữ Việt in VnDOCR 4.0, tức là bạn đã tiết kiệm được rất nhiều công sức cũng như tiền bạc.

Môi trường
+ PC với hệ điều hành Windows 9x, Windows ME, Windows 2000, Windows XP hoặc Windows NT, Tiện ích : Bộ gõ chữ Việt và bộ phông ABC, VNI, Unicode..

Thông tin đưa vào
+ Quét trực tiếp các loại sách báo, văn bản qua máy quét (scanner).

+ Đọc và xử lý hơn 30 dạng tệp tin ảnh phổ dụng nhất như PCX, BMP, TIF, GIF, JPG, ...

Có thể nhận dạng trực tiếp tài liệu quét qua scanner, không cần lưu trữ dưới dạng tệp ảnh trung gian. Các trang tài liệu có thể được quét và lưu trữ dưới dạng tệp tin nhiều trang.

Có thể là các dạng tệp tin của Microsoft Word (.doc), tệp ký tự ASCII (.txt), Rich Text Format (.rtf), *.xls (đối với bảng biểu).

Độ chính xác 99 % ! VnDOCR cũng nhận dạng các tài liệu đã qua Photocopy.
http://www.vndocr.com/home/Products.asp?ProductID=2