Создание книжных изданий и журналов в цифровом формате для чтения возможно благодаря PDF-редакторам. Такое ПО превращает бумажные страницы в файл PDF. Представленные ниже программные продукты позволяют выполнить поставленную задачу. Применяя последние технологии, программы помогут получить отсканированное изображение с последующей цветокоррекцией или отображением текста из листа и его редактированием.
Продукт компании Adobe, предназначенный для создания PDF документов. Существует три версии программы, которые в определенной степени отличаются. К примеру, преобразование в формат для работы с Autodesk AutoCAD , создание цифровой подписи и совместный доступ с другими пользователями есть в премиум-версии, но отсутствуют в стандартной. Все инструменты группируются в конкретных рубриках меню, а сам интерфейс выдержан и минималистичен. Непосредственно в рабочей области вы сможете конвертировать PDF в DOCX и XLSX, а также сохранять веб-страницы как PDF-объект. Благодаря всему этому собрать собственное портфолио и настроить готовые рабочие шаблоны не составит проблем.
ABBYY FineReader
Одно из самых известных приложений по распознаванию текста, которое позволяет сохранять его как PDF-документ. Программа распознает содержимое в PNG, JPG, PCX, DJVU, а сама оцифровка происходит сразу после открытия файла. Здесь можно редактировать документ и сохранить его в популярных форматах, к тому же, поддерживаются таблицы XLSX. Непосредственно из рабочей области FineReader подключаются принтеры для печати и сканеры для работы с бумагами и последующей их оцифровки. Софт универсальный и позволяет полностью обработать файл от бумажного листа до цифрового варианта.
Скан Корректор А4
Простая программа по коррекции отсканированных листов и изображений. В параметрах предоставляется изменение яркости, контрастности и цветового тона. К особенностям относится запоминание до десяти последовательно введенных изображений без сохранения их на компьютере. В рабочей области настраиваются границы формата А4, чтобы полностью отсканировать бумажный лист. Русскоязычный интерфейс программы будет легким в восприятии неопытными пользователями. ПО не устанавливается в систему, что позволяет использовать его, как портативную версию.
Итак, рассматриваемый софт дает возможность эффективно оцифровать фото для хранения на ПК или изменения цветового тона, а сканирование текста позволит конвертировать его из бумажного в электронный формат. Таким образом, программные продукты пригодятся в самых разных рабочих моментах.
Иногда нет времени для того чтобы создать новый документ и необходимо срочно:
- отредактировать сканированный чертеж или схему, внести в документ дополнения, комментарии;
- вставить в сканированный рисунок формы документа поля для заполнения;
- просто получить чистый, без помарок и лишнего грязного фона документ.
Для этого сканированный документ предварительно необходимо преобразовать в черно-белый, при необходимости устранить перекос, и очистить от "мусора".
Предвижу вопрос - почему бы не включить при сканировании черно-белый режим? Можно, но качество полученного изображения в этом случае будет на порядок ниже, чем в рассмотренном примере.
Существуют специализированные программы для этих целей, такие как Spotlight Pro, но они сложны в использовании, и для их освоения требуется значительное время.
Я хочу предложить более простой, но эффективный вариант обработки сканированных документов, с помощью программы оптического распознавания текста ABBYY FineReader 9.0.
Сканировать документ, можно непосредственно из интерфейса программы или вставить для обработки уже сканированный рисунок.
Для наглядности и усложнения задачи, мы возьмем уже сканированный разворот книги, с перекосом страниц и пожелтевшими от времени страницами. Используя программу ABBYY FineReader 9.0, преобразуем рисунок в черно-белый, исправим перекос и очистим от мусора.
- Запускаем программу ABBYY FineReader и в меню Сервис
, выбираем команду Опции
.
В открывшемся окне, во вкладке Сканировать/Открыть , отмечаем пункт Не обрабатывать полученные изображения , так как распознавать текст мы не будем - нам нужно только изображение. Выбираем параметры Обработки изображения : - Теперь очистим изображение от мусора - мелких точек. Для этого, просто нажмем 1-3 раза кнопку Очистить изображение
, при этом наблюдаем за процессом удаления мусора. при первом нажатии удаляются более мелкие точки, а при последующих, крупнее.
Участок рисунка до начала процесса очистки от мусора.
Участок рисунка после однократного нажатия на кнопку Очистить изображение
Участок рисунка после второго нажатия на кнопку Очистить изображение
- Теперь, осталось очистить изображение от крупных "клякс" и затемненных участков. Сделать это можно с помощью инструмента Ластик
.
Принцип работы этого инструмента, отличается от работы аналогичных инструментов других распространенных графических редакторов, и конечно в лучшую сторону. В данном случае, отпадает необходимость "ёрзать" пиктограммой листика по изображению, периодически выбирая команду отмена, после нечаянно стертой полезной информации. Стереть участок изображения в программе ABBYY FineReader, можно методом выделения этого участка.
Удерживая левую кнопку мыши, выделяем участок изображения любых размеров, и, убедившись, что в выделенный участок входят только элементы, предназначенные для удаления, отпускаем кнопку. Выделенный участок очищен. - Осматриваем получившийся очищенный рисунок, и на одной из страниц обнаруживаем небольшой нюанс. Строки текста слегка искажены. Но оказывается и от этого дефекта сканирования можно легко избавится. Нажимаем кнопку Исправить искажение строк
, и дефект исправлен.
Участок изображения до исправления искажения строк
Участок изображения после исправления искажения строк
- Вот и все, получилось чистое, без перекосов и искажения строк изображение.
Его можно распечатать, не тратя лишнюю краску на кляксы и грязь, отправить по электронной почте другу, без угрызения совести за не качественный скан, а так же сохранить для дальнейшего использования в любом из поддерживаемых форматов.
Для сохранения изображения в меню Файл
, выбираем команду Сохранить изображение как...
. Выбираем любой из поддерживаемых форматов:
Bitmap, черно-белый (*.bmp; *.dib; *.rle)
Bitmap, серый (*.bmp; *.dib; *.rle)
Bitmap, цветной (*.bmp; *.dib; *.rle)
DCX, черно-белый (*.dcx)
DCX, серый (*.dcx)
DCX, цветной (*.dcx)
JBIG2 (*.jb2; *.jbig2)
JPEG 2000, серый (*.jp2; *.j2k)
JPEG 2000, цветной (*.jp2; *.j2k)
JPEG, серый (*.jpg; *.jpeg)
JPEG, цветной (*.jpg; *.jpeg)
PCX, черно-белый (*.pcx)
PCX, серый (*.pcx)
PCX, цветной (*.pcx)
PNG, черно-белый (*.png)
PNG, серый (*.png)
PNG, цветной (*.png)
TIFF, черно-белый, несжатый (*.tif; *.tiff)
TIFF, черно-белый, packbits (*.tif; *.tiff)
TIFF, черно-белый, сжатие: ZIP (*.tif; *.tiff)
TIFF, черно-белый, сжатие: LZW (*.tif; *.tiff)
TIFF, черно-белый, Group4 (*.tif; *.tiff)
TIFF, серый, несжатый (*.tif; *.tiff)
TIFF, серый, Packbits (*.tif; *.tiff)
TIFF, серый, сжатие: JPEG (*.tif; *.tiff)
TIFF, серый, сжатие: ZIP (*.tif; *.tiff)
TIFF, серый, сжатие: LZW (*.tif; *.tiff)
TIFF, цветной, несжатый (*.tif; *.tiff)
TIFF, цветной, Packbits (*.tif; *.tiff)
TIFF, цветной, сжатие: JPEG (*.tif; *.tiff)
TIFF, цветной, сжатие: ZIP (*.tif; *.tiff)
TIFF, цветной, сжатие: LZW (*.tif; *.tiff)
PDF (*.pdf)
Очищенные сканы страниц от "мусора" и с исправленным искажением строк.
Хочется отметить, многие в настоящее время переводят свои документы (чертежи, схемы, книги...) в электронный вид. При большом объеме работ, удобнее использовать для этих целей фотоаппарат. С некоторыми моделями сканеров и фотоаппаратов, поддерживающих функцию переснятия документов, программа ABBYY FineReader, идет в комплекте. При выборе инструмента для перевода документов в электронный вид, следует учесть это, так как FineReader, с учетом её основного назначения - оптического распознавания текста, для тех, кто работает с документами не менее полезная программа, чем текстовый редактор.
Сканером или МФУ умеют пользоваться многие, но разобраться в настройках - далеко не все. Часто возникает необходимость сохранить отсканированные документы в определенном формате, например, для подачи в Пенсионный фонд, визовый центр или любые другие государственные структуры. Если сохранить скан-копии в неправильном формате, их скорее всего не примут. Мы предлагаем простой способ, как поменять формат сканированного документа быстро и легко.
Что потребуется для сканирования
Естественно нужен сканер. Необходимо установить программное обеспечение и проверить наличие драйвера для функции сканирования. Все это есть на установочном диске, который прилагается к оборудованию. Также есть возможность скачать драйвера на сайте производителя. В результате в закладке «Устройства и принтеры» должна отображаться иконка с изображением подключенного оборудования.
Настраиваем формат
Различные модели сканеров имеют индивидуальные настройки, описывать все подробно не имеет смысла. Чтобы их посмотреть, кликните по иконке сканирующего устройства и выберите функцию «Настройки». Обычное окно с настройками имеет такой вид:
Если такая опция в вашей модели сканера отсутствует, тогда формат документа можно указать в момент сохранения. Нужно просто выбрать формат, который вам требуется, в строке «Тип файла»:
Изменяем формат сканированной копии
Если у вас уже имеются отсканированные файлы и требуется изменить их формат, тогда нужно использовать специальный конвертор. Он конвертирует графические документы в нужный формат. Такое программное обеспечение можно легко найти и скачать в интернете. Достаточно набрать в поисковике «конверторы для графики» и появится список бесплатных и платных программ.
- Batch Thumbs - ПО для быстрой и удобной работы с графическими документами любого формата.
- Any DWG легко конвертирует DWG во все доступные форматы. Бесплатная программа.
- Acme CAD позволяет преображать файлы в пакетном режиме.
- Graphics2PDF создает документ в PDF-формате из графических скан-копий различного типа.
Хранить отсканированные документы на жестком диске компьютера или внешнем носителе удобно и безопасно. Однако как внести изменения в страницы, обычно представленные в виде изображения? Нам понадобятся специальные программы, об установке и управлении которыми мы расскажем ниже.
Как отсканировать документ перед редактированием?
Чтобы успешно манипулировать файлом в дальнейшем, важно правильно перевести его в формат “картинки”, а также учесть несколько простых, но полезных нюансов в самом процессе. Для этого:
- Разгладьте все заломы и складки, чтобы они не отобразились на скане и не привели к трудностям в распознавании букв.
- Для удобства обращения сохраните файл в формате PDF, JPG или TIFF.
- PDF-документ можно будет открыть и редактировать программой Adobe Acrobat (или любой другой, предназначенной для подобных целей).
- Зайдите на сайт компании-создателя сканера, либо поищите фирменную программу на прилагавшемся диске (часто известные бренды имеют собственные приложения для изменения отсканированных страниц).
- Для последующего использования файла в MS Office 2003 или 2007, установите утилиту Microsoft Office Document Scanning. Она производит конвертацию сканируемого файла автоматически, переводя его сразу в текст (программа не работает с более “свежими” версиями Офиса).
- Рекомендуется сканировать в черно-белой гамме, а не в цветной – это упрощает анализ текста.
- TIFF формат лучше всего применять для OCR конвертеров, то есть программ, производящих оптическое распознавание.
Как отредактировать отсканированный документ – работа с OCR-утилитами
Принцип метода Optical Character Recognition - считывание имеющихся на бумаге символов, их последующее сравнение с элементами из собственной базы данных. Таким образом происходит преобразование сплошной картинки в редактируемый текст. Яркие примеры программ, справляющихся с данной задачей – Adobe Acrobat и Evernote. Чтобы внести исправления в имеющийся скан, просто откройте его одним из таких приложений, весь последующий процесс произойдет автоматически. Когда программа закончит распознавание, то предложит пользователю сохранить документ в одном из доступных форматов.
Как отредактировать отсканированный документ PDF
Если отсканированный документ сохранен в файле PDF, мы с легкостью сможем отредактировать его в программе Acrobat DC. Для этого:
- открываем меню “Инструменты” -> “Редактировать PDF”;
- программа запускает процесс редактирования, показывая меню подсказок в правом углу сверху;
- щелкнув на ней и выбрав “Параметры”, можно указать язык распознавания;
- что внести изменения, просто щелкните на любой строке документа;
- документ, открытый для редактирования через OCR, сопровождается особой панелью с настройками, размещенной в правой стороне экрана;
- в разделе “Настройки”, кроме языка, также удобно выбирать отображаемый шрифт, отмечать страницы, которые необходимо редактировать (все или по одной).
Во всемирной сети существует доступная альтернатива устанавливаемым программам-конвертерам. Это онлайновые OCR, которые без труда переведут полученное изображение в любой текстовый формат. К примеру, сайт pdfonline.com позволит за несколько минут из отсканированного PDF-документа сделать обычный файл MS Word.
Сканер - устройство, распознающее объекты, изображения или документы и записывающее их визуальный образ в графический файл, который можно различным образом редактировать. С какой целью обычно производится данная операция? Как редактировать отсканированный документ?
Под словом «редактирование» следует в данном случае понимать:
Редактирование как модификация изображения
Как мы отметили выше, сканер, обрабатывая документ или иной объект, впоследствии создает на основе его образа статическую картинку в виде отдельного графического файла - например, в формате Jpeg. Потребности в ее редактировании чаще всего таковы:
- поверхностная корректировка (изменение размера, отражение, поворот на заданное количество градусов, настройка цветового баланса);
- редактирование элементов изображения (изменение их внешнего вида, удаление, добавление новых).
Поверхностная корректировка изображения, полученного со сканера, может осуществляться посредством самых доступных видов ПО, которые установлены в Windows по умолчанию. Какой программой редактировать отсканированный документ проще всего? Вероятно, это будет Paint. Важные опции редактирования файла находятся в меню программы, а также на панели инструментов ее интерфейса.
Запустить Paint очень легко: следует нажать (в Windows до версии 7 включительно) «Пуск», далее - «Все программы» - «Стандартные» - Paint. Затем с помощью интерфейса данного ПО открываем нужный файл и вносим в него необходимые корректировки.
Более сложная процедура - редактирование элементов изображения - может предполагать самый широкий спектр вероятных операций: от нанесения небольшой ретуши или букв на картинку до ее слияния с другим графическим файлом в виде коллажа. В зависимости от сложности соответствующей процедуры необходимо будет задействовать тот или иной вид ПО.
Если операции с изображением простые (например, дело ограничивается нанесением букв на него), то можно использовать тот же Paint. В панели инструментов данной программы, которая располагается в ее интерфейсе слева, нужно выбрать «Текст». С помощью него на изображение наносятся печатные буквы.
Редактирование текстов и других объектов форматирования на изображении
Как редактировать отсканированные документы с помощью указанных программ? Данные решения функционируют так: они обрабатывают изображение, распознают текст и иные объекты форматирования, присутствующие на нем, а затем заносят их в отдельный файл, который можно, в свою очередь, открывать с помощью текстовых редакторов - Word, OpenOffice и их аналогов - и свободно редактировать.
Впоследствии можно разместить измененный текст (таблицы, списки) на том же отсканированном изображении, с которого он был в исходном виде распознан. Для того чтобы осуществить данную процедуру, необходимо открыть соответствующий графический файл в программе для редактирования - например, Paint, в одном окне, в другом - распознанный и отредактированный текст (таблицы, списки). Сделав второе окно активным, нужно выполнить скриншот текста (снимок текущего изображения на экране монитора) с помощью клавиши Print Screen Sysrq, после - вставить его в Paint (с помощью сочетания Ctrl и V), а затем - разместить на отсканированном изображении так, как требуется.
Подобная необходимость может возникнуть, например, у дизайнера обложки журнала, которому нужно отредактировать размещенный на ней текст, и если у него по каким-то причинам нет исходного файла. Он может распознать нужные абзацы с бумажной страницы издания, внести в них правки, а затем - вновь разместить их, уже в измененном виде, на отсканированном изображении страницы.