Машинное обучение (ML) - это последняя тенденция в области компьютерных наук, и любой, кто хоть как-то склонен к науке о данных, может увидеть, как пытается узнать о машинном обучении и о том, как его применять для решения реальных проблем или просто для создания рыночного продукта.

С публикацией программных библиотек, таких как Keras, ScikitLearn, TensorFlow и PyTorch и многих других, процесс разработка моделей машинного обучения значительно упростилась. Тем не менее, люди по-прежнему сталкиваются с проблемами при настройке среды кодирования, которая может обрабатывать такие библиотеки, и у многих людей есть компьютеры, на которых требуется очень много времени для выполнения операций машинного обучения даже с умеренно большими наборами данных.

Если вы столкнулись с этими проблемами или просто ищете лучшую среду для программирования машинного обучения, не бойтесь, что Google вас поддержит!

Что такое Google Colab? Почему вы должны его использовать?

В 2018 году Google запустил потрясающую платформу под названием «Google Colaboratory» (широко известную как «Google Colab» или просто «Colab»). Colab - это облачная онлайн-платформа, основанная на платформе Jupyter Notebook, предназначенная в основном для использования в операциях машинного обучения и глубокого обучения. Есть много отличительных особенностей, которые отличают его от любой другой среды программирования.

Предустановленные библиотеки

Одним из основных преимуществ использования Colab является то, что он имеет большинство общих библиотек, необходимых для машинного обучения, таких как TensorFlow, Keras, ScikitLearn. , OpenCV, numpy, pandas и т. д. предустановлены. Наличие всех этих зависимостей означает, что вы можете просто открыть записную книжку и начать кодирование, вообще ничего не настраивая. Любые библиотеки, которые не были предварительно установлены, также можно установить с помощью стандартных команд терминала. Хотя синтаксис для выполнения команд терминала остается прежним, вы должны добавить восклицательный знак (!) В начале команды, чтобы компилятор мог идентифицировать его как команду терминала.

На основе облака

Еще одна особенность заключается в том, что среда Colab не зависит от вычислительной мощности вашего компьютера. Поскольку это облачная система, при наличии подключения к Интернету вы можете запускать даже тяжелые операции машинного обучения на относительно старом компьютере, который обычно не может справиться с нагрузкой, связанной с выполнением этих операций локально. Кроме того, Google также бесплатно предлагает графический процессор (графический процессор) и TPU (тензорный процессор). Эти аппаратные ускорители позволяют выполнять тяжелые операции машинного обучения с большими наборами данных намного быстрее, чем в любой локальной среде.

Универсальность данных

Хотя Colab позволяет загружать файлы в среду выполнения каждый раз, когда вы ее используете, я считаю, что загрузка и повторная выгрузка больших наборов данных каждый раз при перезапуске среды выполнения может вызывать разочарование. Colab также предлагает универсальность данных - простую альтернативу, позволяющую «подключить» Google Диск к ноутбуку. Для этой операции требуется всего две строки кода, которые Colab вставляет для вас одним нажатием кнопки, и это позволяет вам читать файлы, которые вы загрузили на Google Диск. Это означает, что вам не нужно повторно загружать файлы после каждого перезапуска среды выполнения. Вы можете просто загрузить их один раз и получить к ним доступ, просто установив Google Диск.

На рисунке рядом показаны кнопки для загрузки файлов или монтирования Google Диска. Если вы хотите увидеть код, необходимый для монтирования вашего Google Диска, он будет приведен ниже в статье.

Беспрепятственная совместная работа и доступ

Как и другие платформы для редактирования онлайн-документов Google, такие как Google docs, Google Slide s, Google Sheets и т. Д., Colab также предлагает аналогичные варианты совместного использования, позволяя вам беспрепятственно сотрудничать с другими в совместных проектах кодирования. Следует иметь в виду, что когда вы предоставляете общий доступ к записной книжке, другие пользователи не могут видеть вывод и результаты кода, который вы выполняете. Кроме того, если вы загрузите некоторые файлы со своего компьютера в записную книжку, другие соавторы не смогут их увидеть, поэтому лучше загрузить эти файлы на Google Диск, а затем получить к ним доступ оттуда, чтобы все могли видеть и использовать файлы.

Если вы потратили некоторое время на кодирование в локальной среде, вы можете просто загрузить эти файлы в colab и продолжить работу там. Точно так же вы всегда можете загрузить свои записные книжки colab в формате .py или .ipynb. Вы также можете сохранить свои записные книжки на Google Диске или сохранить их прямо на GitHub. Colab имеет функцию автосохранения, аналогичную той, что используется в документах, слайдах Google и т. д., но вы также можете сохранять записные книжки вручную.

Советы и рекомендации по использованию Colab

Когда вы впервые открываете Google Colab, вы можете сразу получить доступ к нескольким заранее написанным блокнотам для обучения, чтобы начать работу. Они могут быть очень полезны, если у вас мало или вообще нет опыта работы с машинным обучением. Вы также можете открыть новую записную книжку (поддерживается Python 3). Вы также можете получить доступ к своим недавним записным книжкам. В качестве альтернативы, если вы просматриваете некоторые из базовых руководств на веб-сайтах TensorFlow или PyTorch, часто присутствуют ссылки на их реализации Colab. на самом сайте.

После того, как вы открыли записную книжку, вам нужно нажать кнопку «Подключить» в правом верхнем углу, прежде чем вы сможете выполнить какой-либо код, но иногда это делается автоматически. Если вы выполните код до нажатия этой кнопки, он автоматически подключается к среде выполнения, а затем выполняет ее.

На панели инструментов в левом верхнем углу, если вы наведете указатель мыши на «Runtime», вы можете выбрать опцию «Change Runtime Type», а затем выбрать, какой аппаратный ускоритель использовать (GPU или TPU), если вам нужно больше вычислительных ресурсов и скорости, чем то, что предлагается стандартной средой выполнения ЦП. Графический процессор значительно быстрее, чем среда выполнения по умолчанию (ЦП), а TPU намного быстрее, чем даже графический процессор, поэтому эти ускорители позволяют работать с большими объемами данных по гораздо более быстрой цене, без необходимости тратить большие суммы денег на покупку GPU или TPU.

Имейте в виду, что при перезапуске среды выполнения вы теряете все сохраненные состояния переменных, и вам придется повторно выполнить весь код, который вы выполнили до сих пор.

Чтобы смонтировать Google Диск, вы можете написать следующий код:

from google.colab import drive
drive.mount('/content/gdrive')

Или вы можете нажать кнопку «Смонтировать диск» слева. Вам будет показана ссылка, по которой вам нужно будет нажать. Вам нужно будет дать разрешение из своей учетной записи Google (для этого может потребоваться вход в систему), после чего вам будет представлен ключ активации, который вам нужно будет вставить в поле, указанное в Colab, для проверки что вы дали разрешение на доступ к файлам Google Диска.

Вы также можете переключаться между светлым режимом и темным режимом и можете настраивать параметры в палитре команд, чтобы изменить внешний вид вашего кода. Вы также можете решить, отображать ли номера строк рядом с кодом.

Если вы хотите хорошо документировать свой код, помимо простой вставки комментариев, вы можете вставить целые текстовые поля в записную книжку, чтобы правильно документировать информацию, аналогично тому, как вы можете вставлять текстовые поля в Jupyter Notebooks.

Выводы

Google Colab - это лучший бесплатный инструмент для людей, желающих заняться наукой о данных. Различные преимущества автоматического сохранения кода, связанного с вашим Google Диском, в сочетании с их разделительной частью - бесплатный графический процессор и TPU делают Colab удобной платформой, на которой люди, желающие принять участие в области науки о данных, будут найти много полезного в. Для получения дополнительной информации вы можете посетить страницу часто задаваемых вопросов Google.

Вы можете ознакомиться с другими моими статьями здесь: