Не зацикливайтесь на вопросах, на которые уже есть ответы. Вот три вещи, которые я хотел бы знать перед тем, как начать карьеру в Data Science.

Вы достигли точки в своей карьере, когда нет смысла продолжать делать то же самое. Может быть, вам скучно, вы не зарабатываете столько, сколько заслуживаете, или, как и я, вам просто никогда не нравилась ваша работа. Во время карьерных потрясений вы столкнулись с наукой о данных и заметили, что смена профессии открывает огромные возможности. Кроме того, вы нашли на YouTube несколько руководств по программированию от специалистов по данным.

Однако, несмотря на то, что в Интернете много экспертов, возможно, некоторые из них уже сделали карьеру в области науки о данных. Вероятно, даже меньше людей сделали такое изменение из совершенно несвязанной области в свои 30 с небольшим. Это говорит о том, что то, что вы смотрели / читали, может не относиться к вашей реальности. Тем не менее, вы должны смотреть эти видео с некоторой долей скептицизма. В конце концов, вы не хотите тратить зря свое драгоценное время. Итак, вот три вещи, которые я хотел бы, чтобы кто-то, кто находится на аналогичном этапе карьеры и жизни, сказал мне, прежде чем сменить карьеру на науку о данных:

1- Выберите Python и двигайтесь дальше.

Если вы сделали домашнее задание, то знаете, что в основном есть два языка программирования, оптимальных для карьеры в области науки о данных: R и Python. Хотя R используется статистиками и исследователями, и его можно использовать в науке о данных, Python, безусловно, ваш лучший выбор.

Для тех, у кого мало или совсем нет опыта в программировании, Python - самый доступный язык программирования. Его невероятно легко изучить благодаря упрощенному синтаксису, который ускоряет кодирование по сравнению с другими языками программирования, такими как Java. Это преимущество, поскольку Python позволяет программистам-любителям читать ваш код и сотрудничать с вами. Таким образом, Python может повысить продуктивность и ускорить переход к карьере.

Python позволяет получать данные прямо из Интернета, что идеально подходит для тех, кто хочет работать с анализом данных и генерировать идеи или предсказывать определенные виды человеческого поведения. Сбор данных будет безболезненным, а это значит, что вы можете создать собственное портфолио на GitHub в удобном для вас темпе. Что еще более важно, большая часть обработки данных с использованием машинного обучения и исследований в области искусственного интеллекта разрабатывается на языке Python. Это связано с тем, что Python предлагает сотни библиотек, таких как TensorFlow для нейронных сетей и NumPy для работы с массивами, матрицами и математическими функциями высокого уровня.

Не зацикливайтесь на том, какой язык программирования вам нужно выучить. Это решение может сэкономить ваше драгоценное время, особенно если вам за 30. Итак, выбирайте Python и двигайтесь дальше.

2- Не попадайтесь на быстрые обучающие материалы, отдавайте предпочтение структурированному курсу.

Поскольку наука о данных - горячая тема, несколько пользователей YouTube предлагают быстрые альтернативы для начинающих: «Изучите Python быстро и легко» или «Панды за 10 минут». Однако исследователи говорят, что процесс обучения относительно медленный, требует повторения и наиболее эффективен. при распределении по интервалам [1] [2]. Следовательно, хорошо структурированная учебная программа жизненно важна для создания прочной основы для новых навыков, таких как программирование. Также не забывайте, что программирование требует как когнитивных (новый синтаксис), так и моторных навыков (набор текста). Это означает, что новичкам практически невозможно выучить Python за несколько часов, не говоря уже о десяти минутах после просмотра видео на своем мобильном телефоне.

Каково решение? Это зависит от того, сколько вы хотите инвестировать на данном этапе. Ниже представлены три варианта:

- Бесплатно без сертификата: просто зайдите на Coursera и найдите Программирование для всех (начало работы с Python) из Университета Мичигана.

- Единовременный платеж и низкая стоимость: перейдите в Udemy и выполните поиск по запросу Complete Python Bootcamp From Zero to Hero in Python от Jose Portilla.

- Ежемесячное членство и немного дороже: в этой категории вы можете выбрать одну из трех платформ (DataCamp, Codecademy или DataQuest). Все эти платформы предлагают курс Data Science with Python.

Я рекомендую попробовать DataQuest. Не только из-за хорошо структурированной учебной программы, но и из-за того, что может вас удивить, и это подводит меня к третьей и последней вещи, о которой я бы хотел, чтобы кто-то сказал мне раньше.

3- Учитесь, делая, а не наблюдая - буквально.

Просмотр видеоуроков кажется предпочтительным методом обучения в 21 веке. Видео в Интернете легко найти; вам нужно только нажать кнопку воспроизведения, и вы можете даже выполнять несколько задач одновременно. Однако при изучении науки о данных и программирования просмотр видео НЕ является оптимальным форматом обучения.

Я уверен, что вы смотрели видео о том, как написать функцию или код. Но смотрели ли вы это, пытаясь понять логику кода и печатая на клавиатуре? Поскольку Python и функции усложняются, изучение видео не работает. Как следствие, вам часто придется снова и снова следить за одним и тем же объяснением, что менее эффективно и требует много времени. Как правило, вы будете тратить много времени на то, чтобы поставить видео на паузу и попытаться найти точную минуту / секунду, с которой вы хотите снова начать просмотр. Это раздражает.

Тем не менее, я настоятельно рекомендую DataQuest, потому что их лекции - это не видео, а тексты. Вы должны прочитать, а затем начать печатать то, что читаете. Это кажется немного устаревшим, но он действительно хорошо работает для новичков, которым требуется больше времени, чтобы осмыслить то, что они изучают. Они предоставляют вам инструкции и область сценария для тестирования вашего кода на одном экране. Их формат просто идеален для тех, кто хочет оптимизировать свое учебное время.

И последнее, но не менее важное: учебная программа DataQuest создана на основе реальных данных, таких как приложения для Android и iOS, произведения искусства MoMa, S & P500. Это важно, потому что вы будете учиться на практике. Их подход значительно улучшит вашу кривую обучения. Опять же, это сэкономит ваше драгоценное время и сделает вас более мотивированным для смены карьеры, когда вы увидите, каково это работать специалистом по анализу данных. Я напишу более подробный обзор DataQuest, так что смотрите это пространство.

Заключение

В заключение, если вы находитесь на этапе перехода к Data Science, возможно, вам за 30, то вы не хотите тратить время на вопросы, на которые уже есть четкий ответ. По этой причине я обрисовал в общих чертах то, что мне хотелось бы, чтобы кто-нибудь сказал мне перед тем, как начать карьеру:

(1) сосредоточьтесь на Python.

(2) выберите хорошо структурированный курс, чтобы получить прочную основу при переходе к более сложным темам, таким как машинное обучение.

(3) учитесь, выполняя реальные проекты, а не просматривая простые видео.

Надеюсь, этот пост вам в чем-то помог. Если вы хотите попробовать DataQuest, просто посетите их веб-сайт и запустите их бесплатную пробную версию. В качестве отказа от ответственности я не получаю никакой компенсации от DataQuest или любой другой платформы, упомянутой в этом сообщении, в обмен на мою рекомендацию. Итак, приступим к работе.

Хотите получить полный доступ к статьям Medium и поддержать мою работу? Подпишитесь, используя ссылку ниже:



Ссылки:

[1] Дж. Д. Карпике и А. Бауэрншмидт. Раздельное извлечение: абсолютный интервал улучшает обучение независимо от относительного интервала (2011). J. Exp. Psychol. 37 (5) 1250–1257.

[2] Н. Дж. Сепеда, и др.. Эффекты интервала в обучении. Временной хребет оптимального удержания (2008). Sage Journals Psychological Science 19 (11): 1095–1102