ДамОтвет.ру

Компьютеры и технологии

Восстановление данных

 

 

Устройства для работы с документами

 

Работа с документами - важный компонент системы управления содержанием любого предприятия. Далее мы рассмотрим одни из основных инструментов, используемых для этого на сегодняшний день.

Сканер - устройство, которое преобразовывает изображения, напечатанный или написанный от руки текст или какой-либо другой объект из бумажного формата в цифровой.

Сканер просчитывает "зелёный, красный, синий" (RGB) данные, затем эти данные обрабатываются с помощью специального алгоритма для того, чтобы внести некоторые изменения. Качество получаемой картинки зависит от цветовой глубины, разрешения, диапазона плотности, а также качества алгоритма. Длительное исследование настройки алгоритма привело к тому, что качество получаемого изображения в ходе сканирования лучше, чем у оригинала.

OCR или оптическое распознавание символов - технология для преобразования изображения текстовых документов в машиночитаемый текст. В то время как был достигнут высокий уровень точности признания печатного или машинописного текста, точность в случае с текстом, написанным от руки, остаётся несовершенной. Всё ещё остаётся необходимость в некоторой корректировке полученного текста.

Отсканированные изображения документов, а затем и преобразованные в машиночитаемый текст сохраняются на компьютере и копятся. Тут возникает вопрос: а не возникнет ли проблемы их дальнейшего поиска?

Если число подобных документов мало, то этот вопрос не возникнет. Однако если количество этих документов приближается к отметке в тысячу или даже миллиону, то их дальнейший поиск может стать реальной проблемой. Именно здесь стоит рассказать об индексации. Индексация данных позволяет работать с поисковой машиной, которая в кратчайшие сроки определит местонахождение определённого документа из числа массы всех сохранённых документов.

Индексирование базы данных так же легко провести, как и индексация текста - где каждое слово в документе вносится в указатель. При этом создаётся ключевое слово или индекс, по которому распознаётся документ. Индекс даётся документу в зависимости от его содержания.

Индексация предполагает, что индекс будет прикреплён к каждому документу. Даже изображения и другие виды нетекстовых файлов могут быть помечены и внесены в указатель.

Кроме этих инструментов, которые используются для преобразования и создания цифровой копии бумажного документа, в том числе и изображений или текста, существуют и другие методы: нецифровое копирование. Фотокопировальное устройство - устройство, которое производит бумажные копии. Такие копии могут пригодиться по различным причинам.

Устройство вывода на микрофильм создаёт изображение документа, после чего его очень удобно хранить.

В то время как всё вышеупомянутое - основные методы, существуют и более современные инструменты, имеющие сложные конфигурации и уровни способностей. Например, многофункциональное оборудование, обычно известное как MFP (многофункциональное периферийное устройство), которое имеет такие функции как:
- сканирование;
- печать;
- копирование;
- факс.

Передовое оборудование для обработки корреспонденции может работать с конвертами, просматривать документы, преобразовывать текстовые изображения в машиночитаемый текст, создавать метаданные и производить индексацию документов.

Современные сканеры используют множество новых технологий и алгоритмов, для создания высококачественных изображений, которые часто лучше, чем оригинал.

В заключение.

Инструменты для работы с документами включают в себя сканеры, технологию оптического распознавания символов (OCR), фотокопировальные устройства, и устройства вывода на микрофильм. Многие компании предлагают подобное оборудование, с различными конфигурациями и способностями. Используя эти устройства вместе с доступными алгоритмами индексации можно намного упростить процесс работы с документами.

 

 

Поиск схожих статей:

 

поиск индекса

 

бумажное оборудование