Главная » Файлы » Мои файлы |
Распознавание текста.
[ ] | 28.06.2009, 20:32 |
1. Непосредственное распознавание, когда изображение текста распознаётся и информация записывается в виде текста. В результате, текстовый файл займёт очень мало места. Однако у этого метода есть свои недостатки. 2. Второй заключается в том, что на фотографии текста убирается фон, а изображение текста оформляется одним цветом. Если сравнить две фотографии одного и того же текста с переработкой и без, записанных в сжатом виде, то переработанная фотография займёт места, приблизительно, в 10 раз меньше. Второй вариант технически реализовать проще, и он более универсален. Однако и здесь есть свои трудности. Для таких случаев я разработал программу, которая может помочь преодолеть возникшие трудности. Это экспериментальная версия программы. Хотелось бы узнать Ваше мнение и пожелания о программе. И так по поводу того как пользоваться программой. Программа выглядит: Вначале надо открыть меню "file" и выбрать картинку с текстом. После чего картинка изображается на экране (левое изображение). Справа появится изображение которое будет изменяться. Далее надо определить область картинки с которой мы будем работать - первоначально она определяется при открытии файла (x1,x2,y1,y2). Далее надо определить, сначала уровень1, потом уровень 2, если потребуется. Практика показала, что обычно уровень1 надо выбирать более 100. Кнопка ч/б работает как переключатель и определяет каким будет фон - белым или чёрным. Далее надо нажать кнопу "уровень", после чего запуститься программа обработки изображения. После, того как программа сделала своё дело, заполниться таблица. Таблица соответствует выбранной области, т.е. она ееё разбивает на 81 часть. Параметры внутри таблицы можно менять. Кнопка просмотр работает как переключатель и позволяет рассмотреть результат в истинном размере (масштаб 1:1). Кнопки x,y,сдвиг нужны для перемещения картинки, когда она отображается в истинном размере. Собственно вроде всё. Область обработки в процессе можно менять. Результат записывается из меню "file". Кнопка 30%, как оказалось, не нужна - она влияет на значение уровня2, но его можно установить вручную. Для 211 страницы я брал уровень1=100. В настоящее время диссертации обрабатываются именно в этой программе. Для сравнения объёмов занимаемой памяти я приведу пример обработки 10 страниц диссертации: JPG - файлы наша обработка файлов Файлы в формате bmp заняли бы более 6 мегабайт (сжатые rar) - я не стал сюда их помещать. В формат bmp можно легко перевести любой графический файл, практически, в любой программе. | |
Категория: Мои файлы | Добавил: rznusl | |
Просмотров: 2703 | Загрузок: 210 | Комментарии: 28 | Рейтинг: 4.0/4 | |
Всего комментариев: 27 | 1 2 3 » | ||||||||||
| |||||||||||
1-10 11-20 21-26 | |||||||||||