OCR es la abreviatura de reconocimiento óptico de caracteres. Es una tecnología para extraer texto de archivos PDF escaneados o PDF de imagen. Permite al usuario editar, copiar y buscar el texto del documento PDF escaneado/PDF de imagen.
Puedes obtener más información desde este enlace: http://en.wikipedia.org/wiki/Optical_character_recognition