Суббота, 20.04.2024, 13:28
Приветствую Вас Гость | RSS
Главная » Файлы » Мои файлы

Распознавание текста.
[ ] 28.06.2009, 20:32


В решении данной проблемы можно выделить два различных подхода:


1. Непосредственное распознавание, когда изображение текста распознаётся и информация записывается в виде текста. В результате, текстовый файл займёт очень мало места. Однако у этого метода есть свои недостатки.


2. Второй заключается в том, что на фотографии текста убирается фон, а изображение текста оформляется одним цветом. Если сравнить две фотографии одного и того же текста с переработкой и без, записанных в сжатом виде, то переработанная фотография займёт места, приблизительно, в 10 раз меньше.


Второй вариант технически реализовать проще, и он более универсален. Однако и здесь есть свои трудности. Для таких случаев я разработал программу, которая может помочь преодолеть возникшие трудности.


 Это экспериментальная версия программы. Хотелось бы узнать Ваше мнение и пожелания о программе.

 


 

Вот пример работы программы.

 Мне не удалось обработать стандартными методами последнюю страницу диссертации Дубкова (см. диссертации). И я обработал её при помощи своей программы - белые буквы на чёрном фоне.

Вот что получилось:



И так по поводу того как пользоваться программой.
Программа выглядит:


  Вначале надо открыть меню "file" и выбрать картинку с текстом. После чего картинка изображается на экране (левое изображение). Справа появится изображение которое будет изменяться. Далее надо определить область картинки с которой мы будем работать - первоначально она определяется при открытии файла (x1,x2,y1,y2).
  Далее надо определить, сначала уровень1, потом уровень 2, если потребуется. Практика показала, что  обычно уровень1 надо выбирать более 100.
  Кнопка ч/б работает как переключатель и определяет каким будет фон - белым или чёрным.
  Далее надо нажать кнопу "уровень", после чего запуститься программа обработки изображения.
  После, того как программа сделала своё дело, заполниться таблица.
 Таблица соответствует выбранной области, т.е. она ееё разбивает на 81 часть. Параметры внутри таблицы можно менять.
  Кнопка просмотр работает как переключатель и позволяет рассмотреть результат в истинном размере (масштаб 1:1).
  Кнопки x,y,сдвиг нужны для перемещения картинки, когда она отображается в истинном размере.

  Собственно вроде всё.
  Область обработки в процессе можно менять.
  Результат записывается из меню "file".
  Кнопка 30%, как оказалось, не нужна - она влияет на значение уровня2, но его можно установить вручную.
  Для 211 страницы я брал уровень1=100.

  В настоящее время диссертации обрабатываются именно в этой программе.
 Для сравнения объёмов занимаемой памяти я приведу пример обработки 10 страниц диссертации:

JPG - файлы
наша обработка файлов

Файлы в формате bmp заняли бы более 6 мегабайт (сжатые rar) - я не стал сюда их помещать. В формат bmp можно легко перевести любой графический файл, практически, в любой программе.



Категория: Мои файлы | Добавил: rznusl
Просмотров: 2703 | Загрузок: 210 | Комментарии: 28 | Рейтинг: 4.0/4 |
Всего комментариев: 271 2 3 »
27 tatia  
Программа не новая да и для пользования нужен сканер, зато для некоторых людей которые медленно печатают и быстро пишут плохим почерком, эта программа может помочь.

26 Дмитрий  
Программа просто отличная. Побольше форматов что бы распознавала и цены бы ей не было. Как только появится .jpg бросаю FineReader и пользуюсь этой.

25 Ira  
Всегда пользуюсь ABBYY FineReader , приходиться много исправлять в ручную...сделай что бы в программе можно было открыть формат jpg.

24 Алексей  
Данная программа очень подойдет мне, поскольку пишу диплом и печать не очень то и хочется. Работал с другими программами, но эта более удобная и простенькая.

23 Ростислав  
Спасибо за программу,дочке очень пригодилась при написании реферата.Но неплохо было бы изменить интерфейс,сделать его более понятным.

22 ret  
скачал программу. мне она понравилась.очень удобна и проста в использовании.вот только один не большой минус не поддерживает *.jpg постоянно приходится менять формат. а так программа очень хорошая. спасибо автору.

21 Маргарита  
порадовало то,что вы хорошо расписали программу действий.Вкладывайте в архив текстовый документ,чтобы без помощи сайта можно было пользоватьс программой

20 smelik  
Программу скачал и запустил открыл фаил а дальше нечего не понятно во первых не поддерживает ipe приходится переделывать в bmp и дальше как сохранять и переводить в редактор мне сие не понятно. Мне кажется проще работать в FineReader.

19 Goreck  
Признаюсь интересная программа, думаю попробовать в использовании. Ну интерфейс сделать попроще б немножко и хорошо что б с подказками было. Я что то не нашол негде раздела помощь. Тоже очень нужная вещь, для начинающих пользователей.

18 fander  
Не плохая программа, сэкономит время и силы. Думаю было бы хорошо если бы немножко модернизировали её интерфейс, обычный юзер может сразу не понять что к чему!

1-10 11-20 21-26
Добавлять комментарии могут только зарегистрированные пользователи.
[ Регистрация | Вход ]