Пару дней назад я получил электронное письмо от старшеклассника (он не сказал мне, откуда) с просьбой о помощи в проекте, над которым он работал, потому что он не смог добиться какой-либо точности на искусственной нейронной сети, которую он имел. созданный. Я посмотрел на его код и, изучив целевую переменную, понял, что он пытался классифицировать проблему регрессии. Я не хотел вносить слишком много изменений в код, потому что не хотел нарушать целостность проекта. Однако мне пришлось изменить модель глубокого обучения, потому что она должна была иметь линейную функцию активации в выходном слое.

Я сохранил блокнот Jupyter в своем каталоге Google Colab и поделился им со студентом, когда внес необходимые исправления, чтобы заставить его работать, пытаясь сохранить первоначальную целостность блокнота. Google Colab — отличная платформа для использования, особенно когда речь идет о совместном использовании работы с другими соавторами.

Библиотеки должны быть импортированы в начале программы, и именно по этому пути студенты по большей части и пошли. Лично я импортирую библиотеки только по мере необходимости, за исключением pandas, numpy, matplotlib и seaborn: -

Я сохранил набор данных на своем диске Google. Я поделился набором данных, и к нему можно получить доступ здесь: https://docs.google.com/spreadsheets/d/1OZpIzbvUyWON-6jWAT9tmCoyUvRE64TdM7Vc_vasD60/edit?usp=sharing

Pandas использовался для чтения файла csv и преобразования его в фрейм данных, df.

Все нулевые значения автоматически отбрасывались, поэтому не нужно было выполнять вменение:

Первый столбец фрейма данных, df, был безымянным столбцом, который был дубликатом индекса. Этот столбец был на самом деле не нужен, поэтому я удалил его: -

Y, или зависимая переменная, была определена как столбец hg/ha_yield, поэтому она была извлечена из фрейма данных…