Научите ИИ читать ваш почерк.

*Вся информация, представленная ниже, получена по ссылке, добавленной в конце*

В этой части курса Джабрил Эш знакомит нас с «Как заставить ИИ читать ваш почерк».

Например, при создании инструмента искусственного интеллекта мы можем использовать язык под названием Python в пространстве под названием Google Collaboratory.

В качестве отказа от ответственности: в последнем случае вы можете написать свой код, запустить его и объяснить, что вы сделали. Вы когда-нибудь использовали SPPSS для анализа данных? Это аналогичный инструмент, но разработанный Google.

Цель этого инструмента — заставить его распознавать наш почерк и преобразовывать его в печатный текст. Есть некоторые проблемы, такие как разработка кода, который может определить, где заканчивается одна буква и начинается другая — даже если она беспорядочна — это называется проблемой сегментации.

«Но мой почерк не такой, как у моего друга…»

Точно! Вот почему мы будем обучать машину распознавать скороговорку, а не запоминать конкретную букву, как указал Джабриль.

Нейронным сетям (NN) требуется большой набор размеченных данных, чтобы понять, как выглядит каждая буква, поэтому это сразу становится нашим первым шагом:

Шаг 1: Поиск/создание помеченного набора данных для обучения НС.

Мы будем использовать это как в тренировочном, так и в тестовом наборе.

Шаг 2: Создайте NN.

Мы настраиваем его с входным, скрытым и выходным слоями.

Шаг 3: протестируйте и исправьте наш код.

Шаг 4: задействуйте алгоритм!

Шаг 1: Найдите или создайте помеченный набор данных.

Если вы планируете создать размеченный набор данных… удачи.

Мы можем использовать наборы данных, которые уже помечены и доступны для нашего использования. Примером, представленным в курсе, является набор данных Extended Modified National Institute of Standards and Technology (EMNIST).

Чтобы поддерживать точность, нам нужно обучать и тестировать машину отдельно, гарантируя, что машина не видела изображения раньше.

Каждый пиксель представляет собой значение шкалы серого от 0 до 255. Чтобы идентифицировать изображения, машина получит значение 1 пикселя и разделит его между 255. Это приведет к значению в диапазоне от 0 до 1 для каждого пикселя и каждого изображения. Чтобы упростить обработку данных, мы используем метод, называемый предварительной обработкой, и для каждого типа данных требуется свой метод.

Сбор данных является ключевым шагом для правильного обучения нашей нейронной сети.

Шаг 2: Создайте NN.

В ходе курса они используют нейронную сеть многослойного персептрона (MLP) для этого тематического исследования.

В Python есть несколько библиотек, содержащих код для построения NN. В этом случае мы будем использовать библиотеку SKLEARN, сокращенную форму SCI KIT LEARN.

Дж. Эш добавляет в ходе курса, что «если наше изображение имеет ширину и высоту 28 пикселей, и каждый из этих пикселей представлен одним входным нейроном. Итак, всего у нас будет 784 нейрона. Каждый из этих пикселей имеет разную шкалу серого и, следовательно, значение от 0 до 1 благодаря обработке, которую мы выполнили на предыдущих этапах».

Теперь, когда вы знаете, что у нас будет 784 нейрона, как вы думаете, насколько большим будет выходной слой?

Что ж, размер будет зависеть от # типов меток, которые мы просим угадать NN. В данном случае в ходе курса они пытаются угадывать буквы, а в английском алфавите их 26, в результате чего в итоге получается 26 выходных нейронов.

О скрытых слоях…?

Мы будем экспериментировать и попробуем одиночные скрытые слои, содержащие x нейронов, и изображения будут обрабатываться входными нейронами, скрытые слои будут выбирать различные аспекты каждого изображения, а выходные будут пытаться сделать наилучшее предположение: это называется итерацией. или эпоха.

После предположения машина сравнивает его с размеченными данными и корректирует свои веса, пока оно не станет максимально точным. После нескольких эпох догадки будут лучше. В ходе обучения они обучают НС с 50 скрытыми слоями и 20 эпохами. Эш указывает на недостатки использования библиотек для создания NN, учитывая, что мы не совсем осознаем, что происходит в строках кода, которые мы используем. По этой причине вам нужно несколько библиотек.

Шаг 3: Обучите, протестируйте и исправьте свою NN.

По словам Дж. Эша, «для каждой эпохи программа выводит число, называемое ошибкой функции потерь». Оно показывает, насколько ошибочным было предположение. Нам нужно знать, насколько хорошо он показал себя на тренировках.

В коллаборатории Google вы получите тестовый балл. «Чтобы понять, почему он допустил большинство ошибок, мы можем создать матрицу путаницы, которая представляет количество элементов в этой ячейке, а более яркий цвет означает большее количество элементов».

Эта матрица содержит ось правильных значений и ось прогнозируемых значений, которые в данном случае содержат числа от 0 до 26, учитывая, что мы берем в качестве эталона английский алфавит, который состоит из 26 букв — . В этом случае 0=А, 1=В, 2=С…

Наша машина, однако, может прекрасно спутать букву U с буквой V или букву I с буквой L. Когда это происходит, мы хотим повысить точность, запрограммировав другую нейронную сеть. По ходу рекомендуется добавлять больше эпох, больше слоев и больше нейронов в скрытых слоях.

Шаг 4: запустите NN!

получить данные в нужном формате: отсканируйте документы, которые вы хотите преобразовать в печатный текст.
Импортируйте их в Google Collaboratory, предварительно сохранив их в репозитории GitHub, чтобы получить их онлайн.
Измените размер каждого изображения и поместите его в тот же формат.
Вы можете инвертировать код каждого изображения, поставив черный фон и белый почерк.
Запустите код.

По ходу случается ошибка. Знаете какой?

Мы никогда не обучали машину распознавать пустые места. После исправления запустите его снова. Он показывает, что вы хотели? В курсе этого не было.

Для этого было изучено, как обрабатывался набор данных EMNIST, чтобы сделать наши изображения более похожими на наш набор обучающих данных. На веб-сайте EMNIST мы можем найти «дополнительную информацию о содержании набора данных и процессе преобразования».

Вы можете найти его здесь: https://arxiv.org/abs/1702.05373v1

К счастью, Эш предоставил нам резюме. Что они сделали:

А. Примените фильтр к изображениям, чтобы смягчить края.

B. Отцентрируйте каждую букву на квадратном изображении.

C. Изменение их размера.

При повторном запуске кода они обнаружили, что программа путает некоторые похожие буквы. Однако это значительно упрощает повышение точности и достижение того, что мы видим ниже:

Подробнее о распознавании рукописного ввода читайте здесь:

Распознавание рукописного ввода в 2021 году: подробное руководство
Сегодня технология оптического распознавания символов обеспечивает точность более 99 % для печатных символов на высококачественных изображениях. Однако…research.aimultiple.com

Вы можете получить доступ к курсу здесь:

Вы можете подписаться на меня в LinkedIn здесь:

Нур Юнис - Менеджер по внешним связям - Первый совет - Erasmus Tech Consulting | LinkedIn
Подробнее о технологиях читайте здесь: https://nuryounis.medium.com/ Ищу стажировку в качестве аналитика в венчурном капитале…www.linkedin.com

Подробнее о технологии можно прочитать здесь:

Нур Юнис — Медиум
Нейронные сети используют алгоритм — Обратное распространение ошибки — чтобы убедиться, что все нейроны, вносящие вклад в ошибку, корректируют свои…nuryounis.medium.com

материалы по теме:

Новые материалы

[Архив поста] Предварительная обработка данных МРТ для PROSTATex Challenge

Обратите внимание, что этот пост предназначен для моих собственных образовательных целей. https://github.com/saifengliu/PROSTATex/blob/master/prostatex-data-preprocessing-20180425.pdf Как..

Я обязательно пройду курс.

Я обязательно пройду курс. Я взял версию Python несколько лет назад на EDX (Введение в вычислительное мышление в Python), который преподавал великий профессор Эрик Гримсон из Массачусетского..

Регрессивный анализ

Регрессивный анализ RASeries#3 — Регрессия Регресс? Как только мы определим, что между X и Y существует значительная линейная зависимость, для представления этой линейной зависимости..

Что делать, когда травят?

Расскажите об этом своим родителям. Если это произойдет даже в школе, немедленно сообщите об этом администрации школы. Чтобы сообщить о: Facebook, нажмите здесь:..

Шаблон проектирования посредника — 3-минутная серия

Это супер коммуникатор и центральный контроллер. _00 / Концепция Инкапсулируйте всю бизнес-логику внутри посредника. Участник будет общаться только с Медиатором. Он не будет знать, есть..

Первые принципы программирования: секрет раскрытия вашего потенциала и создания прорыва…

Раскройте свой творческий потенциал и выделитесь среди остальных: руководство для начинающих по основам программирования Когда дело доходит до решения проблем и создания инновационных..

Наш взгляд на IJCAI 2022

Международная объединенная конференция по искусственному интеллекту (IJCAI) — главное событие для исследователей, работающих во всех областях ИИ. Среди специализированных треков по глубокому..

Machine Learning JavaScript Data Science Artificial Intelligence Software Development Python Web Development Deep Learning Coding React AI Software Engineering Tech Front End Development Nodejs Development Algorithms HTML Angular Computer Science Typescript Data Data Analysis Javascript Tips Javascript Development CSS Education DevOps Java Learning Interview Productivity ES6 Neural Networks Startup API Mobile App Development Mathematics

Научите ИИ читать ваш почерк.

Шаг 1: Поиск/создание помеченного набора данных для обучения НС.

Шаг 2: Создайте NN.

Шаг 3: протестируйте и исправьте наш код.

Шаг 4: задействуйте алгоритм!

Шаг 1: Найдите или создайте помеченный набор данных.

Шаг 2: Создайте NN.

Шаг 3: Обучите, протестируйте и исправьте свою NN.

Шаг 4: запустите NN!

материалы по теме:

Новые материалы

[Архив поста] Предварительная обработка данных МРТ для PROSTATex Challenge

Я обязательно пройду курс.

Регрессивный анализ

Что делать, когда травят?

Шаблон проектирования посредника — 3-минутная серия

Первые принципы программирования: секрет раскрытия вашего потенциала и создания прорыва…

Наш взгляд на IJCAI 2022

Теги