Партнеры

Счетчики






Попробуйте прочитать это и не только это

grigorlukashenko

Демо версия программы распознавания образов. Позволяет распознавать образы очень низкого качества и низкого разрешения, может распознавать образы лучше человека.

Программа предназначена для ввода текстовой информации с графических устройств: таких как сканер и фотокамера. И позволяет распознавать образы даже очень низкого разрешения и очень низкого качества, при этом качество распознавания в несколько раз лучше, чем у программы Fine Reader, и может превосходить точность распознавания человеком, а по скорости распознавания значительно опережает его.Для просмотра необходимо запустить файл demo_ocr.exe. После старта автоматически загружается первый тест и распознается. В результатах приводиться информация: распознанная текстовая строка, информация о том с какой точностью был распознан каждый символ и проверка правильности распознавания теста. Для распознавания следующего теста достаточно нажать кнопку (Следующий файл).

В файлах BMP приведен пример реальной фотографии номера на вагоне с которой производилась деформация различными фильтрами в программе Photoshop, и это еще не предел возможностей программы, вы сами можете попробовать изменить параметры распознавания и тестовые файлы. Отзывы присылайте по адресу E-Mail: grigorlukashenko@mail.ru

Для алгоритма совершенно нет никакой разницы какие символы распознавать: цифры, буквы или любой другой язык. Для наглядности сравнения можете попытаться распознать прилагаемые тесты с помощью программы Fine Reader 4 и прочувствуйте разницу.

Если вам не поверится что программа действительно распознает образы, а просто реагирует на нажатие клавиш, то можете отредактировать тестовые файлы. При нажатии на кнопку (Распознать образ) программа распознает загруженный файл. Вы можете изменить показатель точность распознавания от 1 до 200%, который задает с какой точностью программа должна распознать символ, если символ распознан с меньшей точностью, то он будет пропущен. В данном примере последние цифры распознаются с меньшей точностью, и если заданная точность будет высокой, то эти символы будут пропущены.

Некоторые комментарии и дополнения

Иногда приходят письма от людей которые пробовали подставлять свои файлы для распознавания в программе, но у них ничего не получилось:

Привет Григорий.

Честно признаюсь я не поверил Вашим заявлениям, особенно сомневался что программа способна распознать БитМап под номером 20. Зря распознала. Решил удостоверится в её крутизне. Прорисовал ряд цифр в поинте и о чудо : не распознала. Странно. Опять же по заверениям она должна распознавать даже те образы которые человек не может распознать а тут всего на всего четкие цифры на черном фоне.

Может я не прав но у меня сложилось 100% отношение что это чистой воды подлог. А вместо распознавания подставляются числа с помощью random.

С уважением, Дмитрий.

Да, мне понятны вашы сомнения. Конечно для большей ясности в данном вопросе, требуется комментарий. Программа распознавания не делает ничего сверхъестественного, она сравнивает эталон образа с тем что видит и пытается определить что это такое. Возможности программ такого класса определяют не только алгоритм но и эталоны которые хранятся в памяти.

Для того чтобы программа работала ее необходимо предварительно обучить. В данном случае я обучил программу на базе первого образа, а дальше после применения различных фильтров, исказил исходную фотографию и сохранил в фотографиях с последующими номерами. Алгоритм пытается найти исходные образы в искаженной фотографии на базе имеющихся эталонов. Функция обучения в демонстрационной версии отключена и вы не сможете проверить ее работу, а только работу OCR алгоритма.

Проблема распознавания образов дополняется и тем, что кроме разных образов есть различные классы образов, например на фотографии 256 оттенков серого и черно-белой фотографиях, похожие символы для человека будут совершенно различными для компьютера. И если вы попытаетесь распознать чорнобелый образ, с помощью программы, которая была предварительно обучена на базе образов 256 оттенков серого, то программа выдаст неадекватный ответ. Но даже если вы попытаетесь распознать образы в формате 256 цветов, скорее всего у вас программа будет часто ошибаться. Дело в том что на класс образа влияет и оборудование с помощью которого производилась съемка и условия освещения и другие многочисленные факторы. Кроме того программа не идеальна и находится в стадии разработки.

Демонстрационной версии программы уже более 2-х лет с тех времен значительно улучшилась технология распознавания и оптимизирован алгоритм по скорости и качеству, но у меня нет пока времени, чтобы собрать в кучу новую версию. Кроме того пока и старой версии есть, что показать. В демонстрационной версии я просто хотел показать, что умеет программа и ни о каком жульничестве не было и мысли, просто сложности процесса распознавания образов требуют более детального подхода для успешного понимания.

Если посмотреть на фотографию с номером 20, то программу для распознавание такого образа я не планировал делать, и с другой стороны невозможно распознать уверенно такую фотографию, просто она демонстрирует предельные возможности программы где она начинает ошибаться. После проведения первых испытаний я увидел работоспособность моего алгоритма, которая поразила даже меня.

Не пытайтесь распознавать образы созданные в графическом редакторе программа их не распознает, если вы сомневаетесь, что программа действительно распознает файлы по содержимому а не по названию, вы можете отредактировать тестовые файлы применяя различные фильтры к существующим фотографиям, но не пытайтесь рисовать цифры или печатать их разными шрифтами, текущие эталоны не рассчитаны на распознавание образов созданных на компьютере, они были отсканированы с фотографии и могут работать только с образами данного класса.

Надеюсь этот комментарий хоть немного изменит вашу точку зрения.

Демо версия программы распознавания образов

Скачать демо версию 182 Кбайт


Источник: http://www.ocrai.narod.ru/demoocr.htm (Распознавание образов и искусственный интеллект)
Hosted by uCoz