Как сканированный документ сделать в word?

Как отсканировать документ и распознать его в MS Word

Если Вы выбрали быстрый путь написания теоретической главы, о котором мы говорили в параграфе 2.1., вероятней всего Вам не обойтись без сканирования документов. В ином случае, этот пункт можете пропустить и начинать конспектировать материалы найденные в библиотеке.

Перед началом сканирования нужно определиться, что именно Вы хотите использовать при написании работы. А для этого нужно сначала просмотреть имеющуюся литературу и выделить карандашом нужные моменты.
Когда я впервые сканировал статью из журнала для своей первой курсовой, для меня это занятие было невообразимо сложным. В результате нескольких часов работы со сканером и FineReader’ом у меня на выходе вышла бредятина, не поддающаяся редактированию. В итоге пришлось все набирать руками. Чтобы у Вас не случилось подобного, рассмотрим подробнее все технические моменты сканирования.

Для сканирования вам понадобится:

  • Книга или журнал, который нужно отсканировать
  • Компьютер с установленным FineReader’ом
  • Качественный сканер

Сканер не обязательно покупать. Можно, например, взять на время у товарища. Я пользуюсь сканером CanoScan Lide 60. Это хоть и не самая новая модель, но мне очень нравится этот компактный, быстрый и удобный в работе “девайс”. Если Вы взяли на время сканер, для того чтобы он работал нужно сначала установить программу-драйвер. Драйвера и руководство по установке всегда можно найти на установочном диске, который прилагается к устройству или скачать на сайте у производителя. После установки драйвера, подключите сканер к компьютеру с помощью соединительного шнура. Теперь можно уже непосредственно приступить к сканированию.

Но сначала немного теории. Вы должны знать, что процесс сканирования состоит из двух этапов:

1. Непосредственно сканирование документа. На этом этапе сканнер как бы фотографирует поверхность сканируемого документа и сохраняет полученное изображение на компьютер в виде обычного файла .jpg .gif или в другом формате;

2. Распознавание документа. Это процесс преобразования текста из изображения сделанного сканером в обычный тест, который потом можно сохранить в Word и редактировать. Распознавание осуществляется без участия сканера, с помощью специальной программы (самая популярная Adobe FineReader). Таким образом, Вы можете сначала отсканировать несколько листов текста и сохранить их в виде изображения и только потом преобразовывать в текст.

Итак, начнем этап первый – сканирование:

Запускаем драйвер сканера:

Пуск – Все программы – Canon – ScanGear (название драйвера я указываю для своего сканера). Появится окно драйвера:

Открываем крышку сканера и кладем книгу. Книгу, журнал или что у вас там есть нужно класть текстом вниз, как можно ровнее по отношению к краям рабочей поверхности сканера:

Очень важно сделать так, чтобы крышка сканера как можно плотнее прижимала сканируемый документ, не допуская попадания внешнего освещения не рабочую поверхность сканера, которая соприкасается с документом.

Выполним необходимые установки в драйвере сканера.

Первым делом нужно установить разрешение, в котором будет отсканирован документ. Разрешение – это показатель, который определяет уровень детализации объекта при сканировании и определяется в точках на дюйм (dpi, или т/д). Чем больше разрешение, тем качественнее получается изображение. Но, при сканировании текстовых документов нет смысла устанавливать максимальное разрешение, поскольку толку от этого будет ноль. Кроме того, сканирование с большим разрешением занимает больше времени. Я рекомендую устанавливать разрешение в пределах 400-500 т/д (dpi). При такой настройке изображения получаются достаточно качественными для хорошего их распознания, а сам процесс сканирования не занимает много времени. Посмотрите скриншот установок моего сканера:

Для начала нужно перейти в “Расширенный режим”. Источником всегда будет “Планшет” (планшетный сканер). Цветной режим лучше установить “Черно-белый”, ведь для сканирования текста нам цвета не нужны, а это уменьшит размер изображений на выходе. Разрешение, как я уже сказал, следует установить 400 т/д. Выходной размер изображения – обязательно “А4”. Теперь можно смело жать на кнопку “Сканировать”. Мой сканер устроен таким образом, что сначала запоминает отсканированные изображения во внутренней памяти, и только при закрытии окна драйвера предлагает сохранить их на компьютер. Мне остается только указать место, куда будут сохранены результаты работы.

У вас должны получаться файлы такого типа:

При увеличении такого изображения должен быть отчетливо виден текст.

Второй этапраспознание полученных изображений и их преобразование в текст. Как я уже говорил, для этого понадобится специальная программа – FineReader. Скачайте программу по этой ссылке (72Мб). Чтобы скачать нажмите на стрелочку в правом верхнем углу окна. Распакуйте архив и в папке afr_lrp найдите файл – ABBYY FineReader 12.0.101.exe. Двойной клик на этом файле запустит установку программы на вашем компьютере. Эта версия программы достаточно новая. Все скриншоты ниже я делал используя более старую версию, поэтому интерфейс программы будет немного отличаться от скриншотов. Учтите это при изучении данной инструкции.

Окно FineReader имеет следующий вид:

После установки языка, на котором напечатаны отсканированные Вами ранее документы, можно начинать распознание. Если в тексте присутствует сразу два языка (например, русский и английский) установку сделайте соответственно.

Чтобы начать распознание нажмите на стрелку справа от первой кнопки Сканировать – а затем – Открыть изображение:

Откроется окно выбора изображений. Откройте папку в которую Вы сохранили отсканированные изображения, нажмите CTRL + A (английское) на клавиатуре и нажмите на кнопку Открыть.

Читать еще:  Как сделать файл word?

После этого слева в окне FineReader’а появятся эскизы добавленных файлов, по центру – на данный момент выделенный эскиз в увеличенном виде, снизу – еще большее увеличение, а справа результат распознания:

Для примера я взял всего два изображения. На скриншоте выше выделено первое из них, его сейчас и распознаем. Как видите, изображение отсканировано вертикально, чтобы распознать текст снимок нужно сначала развернуть на 90 градусов. Для этого воспользуемся кнопками и . Следующим шагом нужно указать программе, какую именно часть изображения нужно распознать, а также задать тип данных, которые должны получиться на выходе текст, таблица или изображение. Для этого существуют кнопки, соответственно: . Например, если нужно отметить текстовый блок, нажимаем левой кнопкой на , после этого нажимаем левой кнопкой мышки в левом верхнем углу текстового блока и, удерживая левую кнопку, перетягиваем в правый нижний угол. Для примера я полностью подготовил к распознанию одно изображение:

Как видите, все текстовые блоки в примере выше выделены зеленым, а рисунки – красным. Таблицы подготавливаются к распознанию аналогично. Для этого предназначена кнопка . Для того, чтобы перейти к следующему снимку, кликните левой кнопкой мыши на его эскизе слева. Таким образом подготавливаются к распознанию все полученные в результате сканирования изображения. После того, как подготовка изображений завершена, следует выделить их все. Для этого кликните левой кнопкой в пустом месте на панели эскизов (она называется Пакет) и нажмите Ctrl+A (английское) на клавиатуре. Далее кликните на кнопку и подождите пока FineReader преобразует изображения в текст. После этого можно сохранять полученный текст в Word с помощью кнопки , после нажатия на которую откроется окно Мастер сохранения результатов. В нем необходимо выбрать формат для сохранения – Microsoft Word, а также поставить отметку чтобы сохранились все страницы:

После нажатия кнопки ОК программа создаст документ Word и вставит в него текст из распознанных страниц в том порядке, в котором они находятся на панели эскизов (Пакет). Полученный документ сразу же сохраните в папку в файловой структуре дипломной работы и можете приступать к редактированию. Как это делается, описано в моем бесплатном курсе.

И последний момент. Эсли Вы сканировали газету или журнал, текст там часто дается в виде колонок (как в рассматриваемом примере выше). Эти колонки в Ворде нужно преобразовать в одну. Выделите текст в виде колонок и выполните команду: Формат – Колонки – Одна – ОК. Только после этого можно ставить Книжную ориентацию в Параметрах страницы, отступы полей, шрифт и т.д.

kak.manesu.com

13.05.2019 admin Комментарии Нет комментариев

Те люди, которые активно работают с документами и прочей текстовой информацией, однозначно видят необходимость в сканировании различных материалов. Важно помнить о том, что для получения качественных документов наличие сканера и вовсе не обсуждается. Однако в определенных ситуациях может сгодиться и фотография необходимого текста, однако снимок также должен отличаться высоким качеством.

Как отсканировать документ в Word

  • В первую очередь происходит сканирование документа. Для этого дела лучше выбирать формат png или jpg. Размер изображения также должен быть внушительным (от 400 dpi), чтобы при распознавании не было никаких проблем.
  • Полученные изображения сохраняются в конкретном месте, после чего потребуется сама программа для распознавания текста. Лучше всего сделать выбор в пользу Adobe FineReader. Это универсальное программное обеспечение, которое по качеству своей работы не вызывает никаких нареканий. Важно отметить, что после установки данной программы соответствующая вкладка должна появиться и в MS Word, соответственно, использование функционала существенно упрощается.
  • Через Adobe FineReader нужно выбрать пункт меню «Файл» и «Открыть», выбираем необходимые изображения. Далее появится меню обработки изображения, нам необходимо выбрать язык, который используется в документе, а также некоторые другие опции, среди которых словари и прочие настройки (не столь важные для получения результата).
  • Нажимаем кнопку «Распознать» и ждем, пока процесс завершится. Вполне вероятно, что распознается далеко не все, поэтому те слова, которые программа не смогла определить, будут выделены другим цветом, их можно редактировать прямо в программе.
  • Если текст в самом отсканированном документе немного смещен, то в Adobe FineReader необходимо выбрать те или иные абзацы текста при помощи выделения. Это позволит не пропустить текст при распознавании.
  • В итоге нужно нажать на кнопку «Сохранить», после чего появляется возможность выбрать место сохранения документа, а также его формат. Конечно же, в случае с MS Word нужно выбирать расширение doc или docx.
  • Если перед сохранением оказывается, что документ разбит на несколько колонок, то необходимо выбрать меню «Формат», далее перейти в «Колонки» и выбрать «Одна», чтобы документ смотрелся просто и гармонично. Также в «Параметрах страницы» присутствует возможность настройки полей, отступов и шрифтов.


В итоге документ можно свободно редактировать прямо в офисном пакете MS Office. Важно отметить, что при распознавании документа прямо в Word, форматирование происходит еще проще, так как функционал единый, как для исходных документов, так и для распознаваемых.

Что касается распознавания с фотографий или других материалов, то здесь не так уж просто получить высокое качество распознавания, так как речь идет о смещенных полях, отступах и прочих деталях документов, на исправление которых придется потратить немало времени.

Сканирование в Microsoft Word

С помощью стартового окна вы можете создавать документы Word при помощи сканера или фотоаппарата.

  1. На закладке Сканировать нажмите Сканировать в Microsoft Word.
  2. Выберите устройство и задайте параметры сканирования.
  3. Нажмите кнопку Просмотр или в любом месте области сканирования.
  4. Просмотрите полученное изображение, при необходимости измените параметры и снова нажмите Просмотр.
  5. Укажите настройки выбранного формата.Внешний вид и свойства полученного документа будут зависеть от выбранных вами настроек.
  1. Сохранять форматирование. Выбор режима сохранения форматирования зависит от того, как вы будете использовать созданный документ в дальнейшем:
  • Точная копияВозможность редактирования выходного документа ограничена, но при этом максимально точно сохраняется внешний вид документа.
  • Редактируемая копияОформление выходного документа может незначительно отличаться от оригинала. Полученный документ легко редактируется.
  • Форматированный текстСохраняются только шрифты, их размеры и начертание, разбиение на абзацы. Полученный документ содержит сплошной текст, записанный в одну колонку.
  • Простой текстСохраняется только разбиение на абзацы. Весь текст форматируется одним шрифтом и располагается в одной колонке.
Читать еще:  Как через word сделать шпоры?
  • Языки распознавания — необходимо правильно указать языки документа. Подробнее см. «Языки распознавания».
  • Сохранять картинки — отметьте эту опцию, если вы хотите сохранять иллюстрации в полученном документе.
  • Сохранять колонтитулы и номера страниц — в полученном документе будут сохранены колонтитулы и номера страниц.
  • Настройки предобработки изображений… — вы можете задать настройки обработки файлов изображений, включая определение ориентации страницы и автоматическую обработку изображений. Эти настройки позволяют значительно улучшить исходное изображение и получить более точные результаты конвертации. Подробнее см. «Параметры обработки изображений».
  • Другие настройки… — позволяет открыть Настройки форматов на закладке DOC(X)/RTF/ODT диалога Настройки (меню Инструменты > Настройки…) и задать дополнительные настройки.
  • Нажмите Сканировать в Microsoft Word.
  • После запуска на экране появится панель выполнения задачи, содержащая индикатор выполнения и подсказки.
  • После завершения сканирования текущей страницы на экране появится диалог выбора дальнейшего действия. Нажмите Сканировать снова, чтобы запустить процесс сканирования следующих страниц с текущими настройками, или Завершить сканирование, чтобы закрыть диалог.
  • Укажите папку для сохранения полученного Word-документа.

    По завершении задачи документ Microsoft Word будет создан в указанной папке. Кроме того, все изображения будут добавлены в OCR-редактор и доступны для обработки.

    Загрузка и сканирование

    Для запуска процесса:

    Данная программа автоматом выделит фрагменты документа, рисунки и таблицы, при необходимости повернет сканированный текст по нужному направлению. После завершения сканирования, в данной программе требуется выбрать язык для расшифровки написанного.Выбрать его можно в выпадающем окне «Язык документа», если загруженный скан будет написан на нескольких иностранных языках – следует выбрать автоматический режим.

    Как изменить отсканированный документ в word

    С помощью программы FineReader можно легко преобразовать текст с бумажного носителя в файл формата Ворд и отредактировать его при необходимости.

    Узнать все этапы проведения данной процедуры можно в представленной статье.

    Большое количество пользователей, работающих с документами, нередко сталкиваются с необходимостью копирования текста с бумажного носителя в Word. В этом случае самым оптимальным выбором будет сканирование текста и его дальнейшее редактирование.

    Сделать это возможно с помощью современной программы FineReader, она успешно преобразует обычную фотографию, полученную со скана, в осмысленный набор слов.

    Работа с документом в FineReader

    FineReader – наиболее актуальная программа автоматического распознавания отсканированного документа, она была создана российскими программистами. Ее главными достоинствами можно считать возможность поддерживания большого количества языков, среди которых имеются даже самые древние.

    Помимо этого в этой программе допускается пакетная обработка многостраничного текста.

    Ее преимуществами также можно назвать:

    • распознавание текста, набранного различными шрифтами, в том числе и рукописного написания;
    • корректное распознавание картинок и таблиц в файле;
    • распознавание некачественных текстов;

  • удобный перевод текста документа в файл Word.
  • Пробную версию данной программы можно загрузить на официальном сайте, ее единственный недостаток заключается в том, что там установлено ограничение. Бесплатно можно обработать не более пятидесяти отсканированных страниц текста.

    Полная версия программы стоит около пятидесяти долларов, на ней подобное ограничение отсутствует.

    Загрузка и сканирование

    Самым первым этапом работы в FineReader является загрузка и сканирование файла.

    Для запуска процесса:

    • в меню нужно выбрать окно «Сканирование»;
    • спустя некоторое время программа обработает документ и перенесет его на экран программы в виде изображения;

  • далее необходимо будет расшифровать сканированный текст;
    • перенести его в формат файла Ворд, а затем сохранить.

    Данная программа автоматом выделит фрагменты документа, рисунки и таблицы, при необходимости повернет сканированный текст по нужному направлению. После завершения сканирования, в данной программе требуется выбрать язык для расшифровки написанного.

    Выбрать его можно в выпадающем окне «Язык документа», если загруженный скан будет написан на нескольких иностранных языках – следует выбрать автоматический режим.

    Удаление форматирования из документа

    Сейчас мы более подробно разберем, как можно отредактировать отсканированный документ в программе FineReader. На представленном изображении таблицы, картинки и тексты будут отличаться разными цветами.

    Данные области расшифровываются автоматически в зависимости от своего типа. В дальнейшем работать с ними в данной программе позволяет раздел под названием «Проверьте области», он располагается в правом окне FineReader.

    Для удаления какой-либо области из документа необходимо выбрать в выпадающем меню кнопку «Удалить область», а затем можно будет щелкать мышкой по тем фрагментам, которые следует удалить.

    Допускается уничтожение всех картинок и таблиц, можно оставить только лишь нужный для распознавания и дальнейшего сохранения текст.

    Видео: Как изображение перевести в Microsoft Word

    Редактирование

    Чтобы выделить какую-либо область требуется выполнить следующие действия:

    1. кликнуть мышью по кнопке «Выделить область Текст»;
    2. нажатой левой кнопкой обвести границы текстового блока в рамку.

    А чтобы выделить картинку или таблицу потребуется:

    • выбрать кнопку «Выделить область Картинка» или же «Выделить область Таблица»;
    • точно также обвести границы блока также левой кнопкой мыши.

    Многих пользователей интересует, можно ли в программе FineReader поменять размеры выделенного фрагмента. Это вполне реально, необходимо лишь щелкнуть мышью по нужному фрагменту, навести курсор на его границу до возникновения специального курсива.

    Именно на нее требуется нажать левой кнопкой мыши и, удерживая, менять размер, перемещая мышь в большую или меньшую сторону.

    Конвертирование в формат Word

    После того, как все области будут выделены и отредактированы так, как нужно, можно будет приступить к распознаванию написанного документа и его сохранению в формате Word. Для проведения подобной процедуры следует нажать кнопку «Конвертировать» в меню программы.

    Пользователю нужно будет подождать некоторое количество времени, после чего он сможет просмотреть результаты проделанной работы. Для сохранения текста необходимо ввести имя файла, выбрать для него место и формат сохранения.

    Для создания файла в формате Microsoft Word нужно выбрать в окне «Rich Text Format (*.rtf)».

    Завершающее редактирование отсканированного документа в Ворде

    После проведенных манипуляций документ будет создан в формате Ворд, пользователь может открыть его и сравнить с оригиналом. Если будут выявлены какие-либо ошибки, их можно будет без труда отредактировать в обычном режиме программы.

    Как правило, программа FineReader отлично распознает написанное на любом языке, но при плохом качестве исходника некоторые слова могут быть распознаны неверно.

    Программа FineReader позволяет пользователям существенно экономить свое время при обработке текста, таблиц или картинок с бумажного носителя. Для того чтобы действительно оценить все преимущества работы с ней, можно скачать бесплатную пробную версию программы на пятнадцать дней на официальном сайте.

    Как перевести отсканированный документ в Word

    С помощью программы FineReader можно легко преобразовать текст с бумажного носителя в файл формата Ворд и отредактировать его при необходимости.

    Узнать все этапы проведения данной процедуры можно в представленной статье.

    Большое количество пользователей, работающих с документами, нередко сталкиваются с необходимостью копирования текста с бумажного носителя в Word. В этом случае самым оптимальным выбором будет сканирование текста и его дальнейшее редактирование.

    Сделать это возможно с помощью современной программы FineReader, она успешно преобразует обычную фотографию, полученную со скана, в осмысленный набор слов.

    Работа с документом в FineReader

    FineReader — наиболее актуальная программа автоматического распознавания отсканированного документа, она была создана российскими программистами. Ее главными достоинствами можно считать возможность поддерживания большого количества языков, среди которых имеются даже самые древние.

    Помимо этого в этой программе допускается пакетная обработка многостраничного текста.

    Ее преимуществами также можно назвать:

    • распознавание текста, набранного различными шрифтами, в том числе и рукописного написания;
    • корректное распознавание картинок и таблиц в файле;
    • распознавание некачественных текстов;

    Фото: преимущества программы

    Пробную версию данной программы можно загрузить на официальном сайте, ее единственный недостаток заключается в том, что там установлено ограничение. Бесплатно можно обработать не более пятидесяти отсканированных страниц текста.

    Полная версия программы стоит около пятидесяти долларов, на ней подобное ограничение отсутствует.

    Загрузка и сканирование

    Самым первым этапом работы в FineReader является загрузка и сканирование файла.

    Для запуска процесса:

    • в меню нужно выбрать окно «Сканирование»;
    • спустя некоторое время программа обработает документ и перенесет его на экран программы в виде изображения;

    Фото: процесс добавления изображения

    • перенести его в формат файла Ворд, а затем сохранить.

    Фото: перенос текста в вордовский формат

    Данная программа автоматом выделит фрагменты документа, рисунки и таблицы, при необходимости повернет сканированный текст по нужному направлению. После завершения сканирования, в данной программе требуется выбрать язык для расшифровки написанного.

    Удаление форматирования из документа

    Сейчас мы более подробно разберем, как можно отредактировать отсканированный документ в программе FineReader. На представленном изображении таблицы, картинки и тексты будут отличаться разными цветами.

    Данные области расшифровываются автоматически в зависимости от своего типа. В дальнейшем работать с ними в данной программе позволяет раздел под названием «Проверьте области», он располагается в правом окне FineReader.

    Для удаления какой-либо области из документа необходимо выбрать в выпадающем меню кнопку «Удалить область», а затем можно будет щелкать мышкой по тем фрагментам, которые следует удалить.

    Допускается уничтожение всех картинок и таблиц, можно оставить только лишь нужный для распознавания и дальнейшего сохранения текст.

    Видео: Как изображение перевести в Microsoft Word

    Редактирование

    Чтобы выделить какую-либо область требуется выполнить следующие действия:

    1. кликнуть мышью по кнопке «Выделить область Текст»;
    2. нажатой левой кнопкой обвести границы текстового блока в рамку.

    А чтобы выделить картинку или таблицу потребуется:

    • выбрать кнопку «Выделить область Картинка» или же «Выделить область Таблица»;
    • точно также обвести границы блока также левой кнопкой мыши.

    Многих пользователей интересует, можно ли в программе FineReader поменять размеры выделенного фрагмента. Это вполне реально, необходимо лишь щелкнуть мышью по нужному фрагменту, навести курсор на его границу до возникновения специального курсива.

    Именно на нее требуется нажать левой кнопкой мыши и, удерживая, менять размер, перемещая мышь в большую или меньшую сторону.

    Конвертирование в формат Word

    После того, как все области будут выделены и отредактированы так, как нужно, можно будет приступить к распознаванию написанного документа и его сохранению в формате Word. Для проведения подобной процедуры следует нажать кнопку «Конвертировать» в меню программы.

    Пользователю нужно будет подождать некоторое количество времени, после чего он сможет просмотреть результаты проделанной работы. Для сохранения текста необходимо ввести имя файла, выбрать для него место и формат сохранения.

    Для создания файла в формате Microsoft Word нужно выбрать в окне «Rich Text Format (*.rtf)».

    Завершающее редактирование отсканированного документа в Ворде

    После проведенных манипуляций документ будет создан в формате Ворд, пользователь может открыть его и сравнить с оригиналом. Если будут выявлены какие-либо ошибки, их можно будет без труда отредактировать в обычном режиме программы.

    Как правило, программа FineReader отлично распознает написанное на любом языке, но при плохом качестве исходника некоторые слова могут быть распознаны неверно.

    Выпала кнопка, как вставить ее назад в клавиатуру ноутбука? Решение далее.

    Как разблокировать планшет от графического ключа? Инструкция по ссылке.

    Ссылка на основную публикацию
    Adblock
    detector