Категория: Windows
Автоматизация проектирования пережила начальную стадию. Эйфория от замены кульмана на его компьютерный эквивалент на базе систем AutoCAD или КОМПАС прошла, конструкторы (архитекторы, топографы и др.), прошедшие этот этап, осознали одно из двух:
С теми, кто осознал первую идею, все понятно - они здорово рисуют карандашом и не надо им мешать - они до конца жизни будут это делать (правда, не очень понятно, что делать с заказчиками, которые теперь не воспринимают чертежи на бумаге, а требуют их компьютерного эквивалента?).
Те же, кто осознал вторую идею, начали искать системы. которые смогут помочь им в решении двух задач - моделирование и проектирование разрабатываемых объектов (конструкций) и выпуск рабочей конструкторской документации. Первая из этих задач крайне интересна, но ее обсуждение мы отложим до следующей статьи. Для решения второй задачи на сегодняшнем рынке предлагается целая гамма прикладных систем в области машиностроения (здесь несомненно лидируют разработки фирмы ИНТЕРМЕХ, г. Минск), архитектуры (фирма АПИО-Центр, г. Москва занимает ведущее положение), геоинформационных систем (значительное место, по-видимому, занимает американская фирма MapInfo Inc.), а также в других областях промышленности.
При работе со всеми этими системами приходит осознание того, что разрабатывемые конструкторские (и другие) документы необходимо упорядочивать и каким-то образом хранить. С другой стороны, пользователи с тоской поглядывают на горы бумаги под названием "АРХИВ Конcтрукторской Документации" и начинают размышлять на тему, каким бы образом ввести все это в компьютер и использовать.
И вот здесь как раз и возникает технология обработки сканированных (или растровых) графических документов.
Для начала определим понятия. После сканирования чертежа, схемы, карты, топоосновы появляется файл, представляющий собой изображение отсканированного материала в растровом виде (растровое изображение). Если материал черно-белый и/или используется монохромный сканер, то каждая точка представляется одним битом (т.е. черная она или белая). Если - цветной, то точка может представляться несколькими битами (кодирующими либо цвет, либо оттенки серого). Для промышленных целей в большинстве случаев хватает монохромного растрового изображения. Файл, создаваемый графической системой AutoCAD или другой подобной системой, обычно называется векторным изображением.
Существует легенда, что при хранении растровых чертежей, они занимают очень много места. С учетом современных алгоритмов сжатия при записи сканированных чертежей эта легенда критики не выдерживает - объемы изображения в монохромном растровом и векторных форматах очень мало отличаются друг от друга.
Первый вопрос, который обычно возникает - это на чем сканировать промышленные материалы? Отметим, что распространенные издательские сканеры формата А4/B4 для промышленных целей в большинстве случаев неприемлемы. Они ориентированы на сканирование цветных изображений небольшого формата для издательских целей. При работе в промышленности требуются крупноформатные монохромные сканеры, либо графопостроители со сканирующими головками. При этом довольно часто возникает вопрос о плохом качестве исходного материала - ветхость, неровный фон (результат ксерокопирования), изначально плохое качество самого изображения.
Сегодня на рынке крупноформатных сканеров реально предлагаются три серии устройств:
Графопостроители со сканирующими головками представляют собой неплохое экономичное решение, но обладают повышенными требованиями к сканируемому материалу. В инструкции по сканированию рекомендована целая процедура подготовки материала к сканированию - наклеивание на ватман и т.п.
Сканеры Contex и VIDAR имеют приблизительно одинаковые характеристики, но сканеры VIDAR обладают свойством динамического отделения фона изображения (что позволяет сканировать "синьки", восстанавливая качество оригинала) и очень бережно относятся к сканируемому материалу, что позволяет сканировать ветхие чертежи.
Существуют две ситуации, когда пользователи начинают задумываться о сканировании существующих чертежей и их последующей обработке в AutoCAD :
Рассмотрим обе эти ситуации.
В первой из них, действительно, разумно сосканировать весь имеющийся материал и, проведя его предварительную обработку (удаление грязи, выравнивание фона, фильтрацию и т.п.), создать архив (например, на базе программы SEARCH, ИНТЕРМЕХ, г. Минск), обеспечивающий поиск, просмотр и анализ выбранного чертежа, схемы или топоосновы. Объем архива, как было указано выше, при этом не будет сильно отличаться от архива векторных чертежей. И только, когда пользователь, найдя в архиве необходимый ему чертеж, собирается с ним работать, фактически возникает вторая ситуация.
Во второй ситуации пользователь должен решить, какой из способов обработки сканированного изображения для него подходит. А способов таких четыре:
Отметим, что каким бы ни было качество векторизации, ее нельзя считать панацеей от всех бед - после любой векторизации требуется внимательная ручная доводка чертежа, схемы или топоосновы. Фактически все векторизаторы не распознают текста (а уж тем более русского) и плохо работают с мелкими элементами (сравнимыми по размерам с текстом).
Ниже мы рассмотрим по одной программе, реализующей каждый из вышеперечисленных способов работы с растровыми материалами. Кроме рассмотренных программ существует целая серия других, но мы выбрали программы, оставившие наиболее профессиональное впечатление и обеспечивающие реальную работу с большими объемами растровой информации в приемлемое время.
Фактически все рассматриваемые ниже программы (кроме RxAutoIcon) поддерживают первоначальную обработку сканированного материала - чистку грязи, поворот на малые углы, калибровку, фильтрацию и т.п. А вот механизмы дальнейшей работы у них сильно различаются.
Теперь рассмотрим программы, предлагаемые в части обработки сканированных чертежей:
RXAUTOICON FOR WINDOWS (RASTEREX, Норвегия)Визуализация растровых изображений в AutoCAD
RxAutoIcon - программа, обеспечивающая обработку цветных, полутоновых и монохромных сканированных растровых изображений непосредственно в среде AutoCAD. При этом обеспечивается растровый "псевдослой", который может быть отмасштабирован в соответствии с реальными координатами и/или размерами и над которым полностью реализованы все операции масштабирования и панорамирования AutoCAD. Поддерживается одновременная работа с несколькими растровыми изображениями и маскирование их частей. RxAutoIcon также обеспечивает вывод гибридных (т.е. содержащих растровую и векторную часть) чертежей на твердую копию.
VECTORY FOR WINDOWS (Consistent Software, Норвегия, Россия)Векторизация растровых изображений
Vectory - программа, обеспечивающая преобразование отсканированных монохромных растровых чертежей (в первую очередь, машиностроительных) в векторный формат (в том числе и в форматы AutoCAD DWG/DXF/DXB). При этом Vectory обеспечивает распознавание максимального набора примитивов - отрезков, окружностей, дуг, полилиний, размеров и стрелок (в том числе наклонных), распознавание штриховых и штрих-пунктирных линий, обнаружение наклонных текстов и пересечения полилиний, а также распознавание некоторых дополнительных примитивов. Обеспечивается достаточно удобное управление процессом векторизации, очистка от "грязи", удаление разрывов, редактирование и фильтрация растрового изображения. Обеспечивается векторизация частей чертежа, выравнивание ортогональных линий, поиск, выделение текстовых областей и возможность ввода текста заново с использованием шрифтов AutoCAD.
Vectory включает в себя векторный редактор, обеспечивающий доведение векторного изображения до требуемого уровня соответствия растровому без перехода в AutoCAD. Векторный редактор позволяет не только редактировать автоматически полученные примитивы, но и создавать новые. Vectory имеет возможность настраивать ряд параметров векторизации, подстраиваясь тем самым под различные изображения: машиностроительные чертежи, архитектурные планы, карты, схемы. Пользователь может определить собственные наборы параметров, типичные для своего сканера, своих чертежей или даже частей чертежа. Vectory имеет удачный интерфейс, возможность ввода различных растровых форматов (RLC, RLP, TIFF, PCX, CALS, BMP) и вывода в векторные форматы (DWG, DXB, DXF, VCT).
Пакет рекомендуется для автоматической векторизации чертежей и схем в машиностроении, приборостроении и архитектуре.
SPOTLIGHT FOR WINDOWS (Consistent Software, Норвегия, Россия)Редактор сканированных чертежей
SpotLight - предназначен для редактирования и "автоматизированной" векторизации отсканированных монохромных растровых изображений промышленных форматов (до А0). Редактор позволяет проводить фильтрацию "грязи", выравнивание линий, разделение близко лежащих линий, поворот всего или части растрового изображения на малые углы, объединение нескольких растровых изображений в одно. Пакет обеспечивает линейную и нелинейную трансформацию растрового изображения: выравнивание по криволинейной сетке, "резиновую" деформацию, компенсацию трапециевидных искажений и т.п.
SpotLight также обеспечивает стандартные функции рисования и редактирования растровых изображений, в том числе пиксельное редактирование, использование шрифтов AutoCAD для нанесения текстов. Векторный редактор обеспечивает рисование и редактирование векторных примитивов, а также автоматическую коррекцию векторного рисунка: сопряжение дуг и отрезков, сведение концов векторных объектов, выравнивание отрезков прямых.
SpotLight обеспечивает автоматическую "трассировку" растровых линий, включая дуги, окружности, отрезки и полилинии, а также перевод любых векторных объектов в растровый формат. Пакет имеет возможность хранения, копирования, вставки, записи на диск и чтения с диска до 9 различных фрагментов растровых, векторных и гибридных изображений.
Рекомендуется для применения в картографии, векторизации топооснов, может использоваться как предварительный пакет для работы в гибридной технологии.
CAD OVERLAY ESP/LFX/GSX (SOFTDESK Inc. США)Обработка растровых изображений в AutoCAD
CAD Overlay ESP обеспечивает обработку монохромных сканированных растровых изображений непосредственно в среде AutoCAD. При этом создается растровый "псевдослой", который может быть отмасштабирован в соответствии с реальными координатами и/или размерами и над которым полностью реализованы все операции масштабирования и панорамирования AutoCAD. Обеспечивается также удаление "грязи" из растрового изображения, выравнивание его путем поворота на малые углы.
CAD Overlay ESP имеет возможность ограниченного редактирования в AutoCAD растровых изображений (очистка области, перенос, копирование и поворот области), а также перенос в растровое изображение любых векторных примитивов, созданных в AutoCAD, и удаление из растрового изображения уже "сколотых" элементов (отрезков, дуг, текстов и т.п.).
При "сколке" и/или создании векторного чертежа обеспечивается возможность "растровой" привязки, подобной объектной привязке, используемой непосредственно в AutoCAD. Растровая привязка может осуществляться на середину растровой линии, ее край, точку пересечения растровых линий и т.п. Кроме того, CAD Overlay ESP обеспечивает совместный вывод отредактированных растровых и векторных изображений на различные плоттеры и принтеры.
CAD Overlay LFX обеспечивает "трассировку" растровых линий, автоматическое масштабирование при уходе линии за экран, разложение линий по слоям и присвоение атрибутов. Реальное тестирование этой программы показало, что стабильно она работает только на замкнутых непересекающихся контурах и значительно слабее SpotLight.
CAD Overlay GSX обеспечивает работу с цветными и полутоновыми изображениями, но имеет более ограниченный набор функций.
CAD Overlay ESP рекомендуется как основной пакет для работы в гибридной технологии в любой отрасли промышленности.
Ни одна из рассмотренных программ не является идеальной и предназначены они для работы на разных растровых изображениях и в разной технологии. В идеальном случае, при необходимости серьезной обработки растровых сканированных графических изображений необходимы все рассмотренные программы. Тем не менее, в конкретных условиях возможно и автономное использование любой из них. Окончательный выбор программ обработки сканированных изображений, в первую очередь, определяется их спецификой (машиностроение, архитектура или картография, сборочные или детальные чертежи и т.п.), а также качеством сканируемого материала (оригиналы на ватмане или кальке, ксероксные копии и т.п.) и степенью его ветхости.
"Публикация на сайте", 2005 г.
RasterDesk/RasterDesk Pro 8.0 — профессиональный гибридный редактор, позволяющий осуществить полный комплекс работ со сканированными изображениями, загруженными в AutoCAD.
С помощью этой программы вы сможете:
- сканировать документы, значительно повышать их качество и корректировать искажения;
- быстро вносить необходимые изменения в сканированный документ, используя возможности как векторного, так и растрового редактора;
- одновременно работать с векторной и растровой графикой, используя технологию AutoCAD;
- векторизовать весь документ или необходимые фрагменты средствами автоматической или полуавтоматической векторизаци.
Интерфейс RasterDesk
Модуль сканирования WiseScan LE в RasterDesk представляет собой комплексную систему управления широкоформатными сканерами на аппаратном уровне или с помощью TWAIN-интерфейса.
Наряду с использованием всех функций вашего сканера, с помощью WiseScan LE можно:
- просматривать сканируемое изображение в отдельном окне;
- автоматически загружать изображения в текущий рисунок AutoCAD;
- применять команды автоматической коррекции изображений RasterDesk сразу после сканирования.
Spotlight/Spotlight Pro 8.0 - гибридный редактор, предназначенный для работы с растровой и векторной графикой, векторизации и растеризации. Позволяет осуществлять полный комплекс работ со сканированными чертежами, картами, схемами и другими графическими материалами: значительно повышать их качество, устранять искажения, создавать и редактировать растровую и векторную графику, преобразовывать растровую графику в векторную форму.
При помощи Spotlight вы сможете:
сканировать документы, значительно повышать их качество и корректировать искажения;
быстро вносить необходимые изменения в сканированный документ;
одновременно работать как с растровой, так и с векторной графикой, используя технологию, привычную для пользователей САПР;
векторизовать весь документ или необходимые фрагменты при помощи автоматической или полуавтоматической векторизации.
Интерфейс Spotlight
Полноцветные иконки, изменяемые размеры панелей инструментов, задаваемый уровень прозрачности диалоговых окон и панелей инструментов, создание пользовательских кнопок позволяют настраивать и оптимально использовать рабочее пространство проекта.
Сформированный набор пользовательских настроек программы можно сохранить в профиле. Создав несколько профилей, вы можете использовать их для быстрого переключения настроек при работе над разными документами в текущем сеансе программы или импортировать/экспортировать профили, что позволит работать с ними и другим пользователям.
Командная строка представляет собой интерактивное окно для ввода и отображения текстовой и гипертекстовой информации и предназначена для вызова команд, ввода параметров выполняемой команды, вывода сообщений и т.д.
Командная строка может использоваться совместно с окном Инспектор, панелями и контекстными (правокнопочными) меню для ускорения взаимодействия, что особенно удобно для пользователей, знакомых с работой в среде AutoCAD.
Режимы отображения: зуммирование, панорамирование, видовые экраны, именованные виды, общий вид, отключение видимости векторной или растровой графики, порядок отображения объектов, «курсоры-подсказки», отображающие выполняемую команду.
Многооконный предварительный просмотр, реализованный для многих команд, позволяет в момент настройки просматривать результаты в различных областях одного или нескольких обрабатываемых изображений.
MDI-интерфейс предоставляет возможность одновременной работы в нескольких документах.
Панель свойств: отображение и редактирование свойств объектов и параметров выполняемых команд в панели Инспектор. Возможность выполнения большинства операций со слоями. Вставка специальных символов.
Координатные системы: задание и использование нескольких именованных координатных систем, задание системы координат по нескольким точкам с известными координатами.Есть возможность отображать знак системы координат на рабочем поле документа. Отображение знака ПСК удобно для пользователей, работающих с картографическим материалом.
Минипроводник: встроенный браузер позволяет выполнять все операции с файлами, которые доступны в Windows Explorer (Проводник), а также ряд других операций (фильтрация файлов по расширению, назначение избранных директорий и т.д.).
SaaS (Software as a Service) можно расшифровать «программное обеспечение как услуга». Технология CORRECT: SaaS для обработки документов представляет собой программное обеспечение, установленное на удаленном сервере, позволяющее быстро и с высокой точностью в режиме онлайн перевести бумажные документы в электронный вид.
Для работы с данным программным обеспечением необходимо лишь зайти на сервер облачного сервиса CORRECT: SaaS и войти в систему с логином и паролем (логин: demo, пароль: demo).
Компания CORRECT обладает собственными ресурсами аутсорсингового центра обработки данных. Силами наши сотрудники могут производить ручной ввод документов, не поддающихся автоматическому программному распознаванию, а также проводить проверку (верификацию) для достижения 100% точности данных после автоматического распознавания.
Выгрузка и индивидуальная настройкаСервис работает со следующими видами документов:
Сервис может распознавать следующие типы файлов:
Преимущества системы CORRECT: SAAS Удобная система загрузки и сканированияОтсканировать или загрузить необходимый Вам документ для распознания не только просто, но и удобно. Удобный пользовательский интерфейс и работа с различными периферийными устройствами поможет Вам максимально эффективно упростить работу.
Поддержка работы с пакетами документовСистема поддерживает создание пакета документов, состоящего из одного или нескольких документов и отсканировать одну или несколько страниц документа в пакет.
Редактирование изображенийПрограмма позволяет пользователю сканировать и редактировать изображения перед отправкой на распознавание.
Работа с различными документамиПрограмма позволяет загружать для обработки различные виды документов: товарные накладные, счет-фактуры, счета, акты и т.д.
Данные в реальном времениПользователь получает возможность отслеживать в реальном времени результаты процесса распознания и просмотра статусов документов в системе.
Экспорт в любой форматФормирование результирующего документа в различные форматы (doc, xls, PDF) для возможности дальнейшей загрузки в учетные системы. Устанавливаются единообразные значения параметров шрифта, абзацев, производится формирование таблиц.
Верификация данныхПользователь может провести итоговую верификацию данных. При необходимости производится ручной дополнительный ввод текста, формул, таблиц, распознавание которых требует более детальной проработки.
Пробная версия сервисаСервис открыт для просмотра в тестовом режиме. Вы можете оценить качество обработки счетов-фактур и товарных накладных.
Для доступа к тестовой версии зайдите на сайт CORRECT: SaaS со следующими идентификационными данными:
Дополнительно система обработки CORRECT: SaaS может быть расширена формами автоматической обработки конкретно Ваших документов, также мы разрабатываем модули экспорта в систему организации.
преимущества и выгоды:Компьютер предназначен для работы с документами, имеющими электронную форму. В то же время, нам часто приходится иметь дело с бумажными изданиями и документами: журналами, книгами, письмами, служебными записками и т.д. Чтобы в работе с информацией такого рода тоже можно было использовать компьютер, необходимы средства преобразования бумажных документов в электронную форму.
Если предполагается, что документ содержит в основном текстовую информацию, то можно выделить следующие основные этапы такого преобразования:
в ходе сканирования при помощи устройств оцифровки изображения производится создание электронного образа (изображения) документа;
процесс распознавания позволяет преобразовать электронное изображение в текстовые данные (с сохранением элементов форматирования оригинала или без них);
для документов, исполненных на иностранном языке, применяют дополнительные средства автоматизированного перевода на другой язык.
11.2 Сканирование документовПроцесс создания электронного изображения бумажного документа напоминает его фотографирование и требует применения соответствующего устройства. Сегодня в качестве такого устройства выступает сканер. Последние поколения цифровых камер уже могут обеспечить для документов стандартного формата качество изображения, которое гарантировало бы их надежное распознавание, однако сканирование часто удобнее и производительнее, чем фотосъемка.
Сканер является внешним устройством и подключается к компьютеру через специальный разъем. При высоком разрешении и большой площади сканируемого документа объем передаваемых данных оказывается очень большим и требует производительной линии передачи. Современные сканеры чаще всего используют для подключения порт USB. Сканеры предыдущих поколений использовали порт принтера (обеспечивает низкую производительность) или интерфейс SCSI(SmallComputerSystemInterface).
Разные модели сканеров понимают разные управляющие команды. Чтобы избежать разнобоя, был принят универсальный стандарт взаимодействия сканера и приложений. Этот стандарт называется TWAIN. Приложение посылает командыдрайверуTWAIN, который преобразует их в инструкции, распознаваемые конкретным сканером. Таким образом, для приложения конкретная модель сканера перестает иметь значение. Операционная системаWindowsХР поддерживает интерфейсTWAIN, aвсе современные сканеры совместимы с ним и предоставляют необходимые драйверы нижнего уровня.
Сканирование через посредство интерфейса TWAIN осуществляется следующим образом. Сначала следует включить сканер. Команда сканирования располагается в выбранном пользователем приложении в менюФайл (например, в программе AdobePhotoshop соответствующий пункт запускается через меню Файл – Импорт – НазваниеTWAIN-драйвера сканера ). После выбора этой команды открывается диалоговое окно драйвераTWAIN, вид которого зависит от модели сканера. В этом окне задают параметры сканирования: черно-белый или цветной режим,разрешение. параметры коррекции яркости и контрастности. Большинство сканеров позволяют также произвестипредварительное черновое сканирование с низким разрешением и по его результатам точно задатьобласть сканирования – часть страницы документа.
После настройки всех параметров следует щелкнуть на кнопке «Сканировать» (надпись на кнопке может быть иной). Процесс сканирования происходит автоматически, и изображение передается в приложение. Диалоговое окно драйвера TWAIN автоматически не закрывается, так что в многооконных графических редакторах (таких, какAdobePhotoShop) можно сразу провести сканирование нескольких изображений.
11.3 Распознавание документовЭтап распознавания документа состоит в преобразовании электронного изображения (фактически набора цветных или черно-белых точек) в текстовый документ. Ранее для описания этого процесса обычно использовался терминOCR(OpticalCharacterRecognition) , который соответствует одному из используемых методов, При таком подходе происходит «сравнение» элемента изображения с эталонными вариантами начертания символов, после чего выбирается наиболее подходящий символ.Этот подход требует использования специального комплекта шрифтов, но дает на нем наилучшие результаты. Современные алгоритмы распознавания не привязаны к конкретному начертанию символов: программа, как и человек, способна узнавать буквы при любых начертаниях (а иногда и при значительных искажениях).
В ходе распознавания сначала в изображении выделяются крупные элементы текста: колонки, абзацы, отдельные текстовые блоки (например, подрисуночные подписи), ячейки таблиц. Этот этап называют сегментацией, он может выполняться автоматически или вручную. После этого выполняется автоматический этап распознавания: блоки разбиваются на строки, строки – на отдельные символы, каждый из которых распознается независимо и помещается в итоговый текстовый документ.
Все операции, необходимые в ходе преобразования бумажного документа в электронную форму, могут быть выполнены с помощью программы ABBYYFineReader. Эта программа способна выполнять сканирование и распознавание текстов на разных языках, в том числе и смешанных двуязычных текстов. С ее помощью можно выполнять пакетную обработку многостраничных документов, а также настраивать режим распознавания для улучшения соответствия электронного документа бумажному оригиналу при плохом качестве последнего или использовании в нем шрифтов, далеких от стандартных.
С точки зрения программы, процесс обработки документа состоит из пяти этапов:
Редактирование и проверка результата;
Сканирование документа. В программеFineReader сканирование может производиться как через драйверTWAIN, так и в обход его. Первый способ используют, когда требуется точная настройка параметров сканирования, когда документ включает цветные иллюстрации, которые необходимо сохранить, а также когда разные страницы многостраничного документа сильно различаются по качеству. Второй вариант обеспечивает максимальную скорость и удобство сканирования.
Процесс сканирования осуществляется автоматически и требует от пользователя только вспомогательных операций, таких, как смена сканируемой страницы. Возможность вмешательства в работу программы заблокирована размещением на экране специального диалогового окна, уведомляющего о том, что идет сканирование, и позволяющего прервать это процесс. Добавлять страницы в пакет можно не только путем сканирования, но и путем открытия файлов с изображениями, имеющихся на компьютере.
Сегментация есть процесс разбиения страницы на блоки текста.Обычная книжная страница представляет собой единый блок текста, который распознается в естественном порядке – по строкам, расположенным на странице сверху вниз и идущим от левого края до правого. Если страница содержит колонки, иллюстрации, врезки, подрисуночные подписи или таблицы, то порядок распознавания требует коррекции.
В таком случае содержимое страницы разбивается на блоки. Внутри каждого блока сохраняется естественный порядок распознавания. Блоки нумеруются, исходя из порядка включения их в документ. ПрограммаFineReader способна выполнить сегментацию (определить границы блоков) автоматически даже для весьма сложных страниц. При этом учитываются поля документа, просветы между колонками, рамки.
Если структура страницы очень сложна или содержит явные дефекты, которых не всегда удается избежать при сканировании, удобнее использовать ручную сегментацию или ручное редактирование результатов автоматической сегментации.
Разные типы блоков обрабатываются программой по-разному. Программа FineReader поддерживает следующие типы блоков:
Зона распознавания – на этапе распознавания блок анализируется и разбивается на другие блоки автоматически;
Текст – на этапе распознавания преобразуется в текст;
Таблица – представляет собой набор ячеек, каждая из которых преобразуется в текст по отдельности;при сохранении документа форматируется также в виде таблицы, если выходной формат это поддерживает;
Картинка – включается в документ без изменений как графическая иллюстрация,если формат сохранения преобразованного документа допускает вставные объекты.
Процесс распознавания текста после сегментации полностью автоматизирован. В ходе процесса отображается диалоговое окно, позволяющее оценить и прервать процесс. Кроме того, в этом окне отображаются сообщения, указывающие на наличие проблем при распознавании. Проблемы обычно вызываются неверными настройками или плохим качеством распознаваемого изображения. Если же дело в каких-то шрифтовых особенностях распознаваемого документа, применяют распознавание с обучением.
Распознавание с обучением. Распознавание с обучением состоит в формированииэталона, который используется в ходе распознавания в дальнейшем. Эталон настраивается так, чтобы соответствовать определенному документу или группе однотипных документов. Режим распознавания с обучением включается при настройке параметров работы программы (диалоговое окно настроек программы, вкладка, посвященная распознаванию).
Когда в ходе распознавания с обучением программа FineReader обнаруживает символ, который не может интерпретировать однозначно, на экран выдается диалоговое окноРучное обучение эталона. Программа указывает элемент изображения, вызвавший сомнения, и показывает, как именно он будет интерпретирован. Если допущена ошибка, можно указать нужный символ или уточнить область распознавания. Затем надо щелкнуть на кнопке «Обучить». Необходимые сведения сохраняются и используются при дальнейшем анализе изображения. Когда число ошибок станет незначительным, можно закрыть окно и продолжить распознавание в обычном режиме.
Редактирование документа. Заключительные этапы работы позволяют отредактировать полученный текст с помощью средств, напоминающих текстовый редакторWordPad. При желании можно провести проверку орфографии с учетом трудностей распознавания (сомнительных символов, в точности распознавания которых программа не уверена).
Сохранение документа. Мастер сохранения результатов позволяет сохранить распознанный текст или передать его в другую программу (например, вMicrosoftWord) для последующей обработки.
Попалась мне недавно программка Scan Tailor, которая предназначена для автоматической обработки отсканированных книг. С помощью этой программы можно разрезать страницы, если страницы сканировались не по одной, а целыми разворотами, можно исправить наклоны страниц, если они криво лежали в сканере, и провести еще некоторые полезные обработки.
Программа является бесплатной, да еще и с открытыми кодами, если версия под Винду, а можно из исходников скомпилить и под Линух. Официальный сайт — http://scantailor.sourceforge.net/ .
Книжки сканирую я, к счастью, не часто, а вот обрабатывать уже отсканированные кем-то иногда приходится, в основном чтобы разрезать отсканированные развороты страниц на отдельные страницы. Описать программу Scan Tailor я решил на примере такой обработки. Для экспериментов взял первую попавшуюся книжку в формате DJVU с двойными страницами (первой попалась книга Ю.Ю. Ненахова «Чудо-оружие третьего рейха») и для начала преобразовал все страницы в формат TIFF, потому что для Scan Tailor исходными данными являются отсканированные рисунки. Для преобразования DJVU -> TIFF я использовал программу DjvuOCR. В результате у меня получилось 310 файлов TIFF каждый из которых содержал по две страницы.
При запуске Scan Tailor спросил где находится папка с отсканированными файлами, указал на папку с TIFF-ами и создался новый проект. Внешний вид программы видно на следующем скриншоте:
Главное окно программы
Первым этапом обработки идет исправление ориентации страниц. В данном случае этот этап можно пропустить, все страницы расположены в нужной ориентации, но для эксперимента посмотрел сколько по времени программа будет вращать 310 файлов. Оказалось, что на моем компе на AMD 3500+ с гигом оперативки и WinXP + SP2 это заняло пару секунд. Вообще программа за все время работы не занимала больше 50 МБ оперативки.
Вторым этапом идет разрезка страниц. Scan Tailor автоматически пытается определить границы между страницами и в большинстве случаев ей это удается.
Но даже если она и ошибается, то за ней можно исправить огрехи, перемещая линию, разделяющую страницы. Причем программа даже может разделять страницы, если они отсканированы под углом. На следующем скриншоте это хорошо видно, заодно видно как Scan Tailor немного промахнулся:
Еще парочка промахов:
Разрезка страниц заняла чуть больше двух минут, а если точнее 2 минуты и 18 секунд, и на 310 разворотов программа ошиблась 14 раз, что, ИМХО, не так уж и плохо. На выходе получилось 620 одинарных страниц.
После этого наступает черед компенсации наклона. Программа просматривает все страницы и разворачивает их так, чтобы текст был строго горизонтально. Тоже это происходит автоматически, но при желании можно и вручную повращать страницы. Для удобства на отсканированные страницы при этом накладывается «листик в клеточку».
Компенсация наклона заняла полторы минуты и вмешиваться после автоматической коррекции не пришлось, программа отработала этот этап просто замечательно.
Четвертым этапом обработки идет определение полезной области. чтобы отсечь лишние пустые места. Это довольно долгий процесс, который для 620 страниц занял 22 минуты. Здесь программа тоже сработала без ошибок.
На пятом этапе задается так называемый макет страницы. то есть какого размера должны быть поля у отсканированного текста и выравнивание на странице. На следующем скриншоте я установил слева и справа нулевые поля (все-равно они остались от исходных отсканированных страниц, зачем их еще увеличивать), а по вертикали добавил по 5 мм.
Эта операция заняла несколько секунд.
И, наконец, на последнем, шестом этапе, происходит вывод результирующих файлов. Здесь можно задать некоторые обработки вроде удаления пятен. В результате программа создала папку out. куда сохранила полученные файлы тоже в формате TIFF. Поменять выходной формат нельзя. В результате получились файлы с именами вида XXXX_filename.tiff, где filename.tiff — изначальное имя каждого файла, а XXXX — порядковый номер страницы.
Это была самая долгая операция, она заняла 35 минут.
Итого. Мне программа очень даже понравилась, интерфейс работает шустро, на сколько быстро работают алгоритмы обработки сказать трудно, потому что мне не с чем сравнивать, с подобными программами я сталкиваюсь впервые. Обработать 620 страничную книгу удалось чуть больше, чем за час. Для сравнения закачал в обменник исходную книгу и ее же после обработки. Не обращайте внимания, что там не хватает пары страниц в 20-ых страницах, это не я их вырвал, это так и было. ??
Программа активно развивается, последняя на данный момент версия вышла 26 апреля этого года, автор принимает пожелания и сообщения об ошибках, в том числе и на форуме ru-board .
В Scan Tailor удобно, что если во время обработки увидел косяк, пропущенный на предыдущем шаге, то можно вернуться и исправить. Следующие шаги придется переделывать только для измененных страниц. Жаль, что программа сама не понимает формат DJVU, но это не такая уж и проблема преобразовать из/в DJVU сторонними программами. Хотя еще хотелось бы уметь открывать и сохранять PDF. Но, к сожалению, во время работы программа у меня пару раз вылетала, поэтому надо сохранять проект почаще. А в целом очень удобная софтина.
Еще раз напомню ссылку на официальный сайт — http://scantailor.sourceforge.net/ .
Пожалуйста, оцените запись