В науку о данных сложно проникнуть. Это мультидисциплинарная область, в основном вращающаяся вокруг математики, статистики и программирования. Если вы работаете в какой-то другой сфере и хотите сменить, или если вы выбираете специальность и хотите вернуться к темам, которыми вы были в состоянии алкогольного опьянения в предыдущие годы, эта статья для вас.

Хорошо, вы знаете, что будет математика. И это может показаться устрашающим, но за такими причудливыми терминами, как собственное разложение и частные производные, кроются понятные темы - то есть, если вы потратите достаточно времени.

Я поделюсь с вами списком ресурсов, которые я использовал при запуске, и ресурсов, которые я использую до сих пор ежедневно. Они не отсортированы в каком-либо определенном порядке, поэтому не стесняйтесь выбирать тот, который лучше всего соответствует вашим временным рамкам и стилю обучения.

Хорошо, готовы начать? Ну вот.

Линейная алгебра

Ах, это одна из тех тем, которые звучат так абстрактно. Это не так.

По крайней мере, не на том уровне, который вам нужен. Вам не нужно знать все, что знает математик, поскольку вы им не являетесь. Однако вы должны понимать основы и иметь за этим хорошую интуицию.

Если вы один из тех, кто получает промах (не знаю слова для читательниц) при глубоком теоретическом погружении в предмет, я настоятельно рекомендую видеолекции от MIT:



Несмотря на то, что лекции в Массачусетском технологическом институте не так уж и сложно читать, если у вас есть некоторые предварительные знания, я обнаружил, что Khan Academy более удобна для новичков. К тому же Сал - классный парень:



Это САМЫЙ канал для вас. Я не могу сказать достаточно добрых слов о парне, стоящем за этим. Плейлист по линейной алгебре - это, безусловно, лучшее, что вы можете посмотреть, чтобы развить интуицию, лежащую в основе темы. Обменяйте на это пару ночей в Netflix. Добро пожаловать.

И, наконец, в качестве краткого обзора наиболее важных тем линейной алгебры я рекомендую пару сообщений, которые я написал недавно. Они ни в коем случае не должны быть единственным материалом, с которым вы можете столкнуться. Вы должны хорошо разбираться в теме и прочитать их, когда будете готовы реализовать все на Python:





Исчисление

Если вы искали в Интернете предварительные условия для науки о данных, то наверняка заметили в списке многомерное исчисление.

И это круто. Проблема, однако, в том, что многомерное исчисление - не первое, что вам следует изучить. Еще раз, MIT позаботился о вас.

Вот список видеолекций по исчислению одной переменной (логическая предпосылка его многомерного брата):



Следующим шагом, если вы решите пойти по маршруту MIT, будет его старший брат:



Не любите лекции Массачусетского технологического института? Наш старый приятель позаботился о вас. Вот плейлист по Calculus 1:



Как только вы это сделаете, вы сможете приступить к многомерному исчислению:



Помните 3Blue1Brown? Он не остановился на линейной алгебре, он также написал эту фантастическую серию из 12 частей по исчислению. Он утверждает, что после просмотра вы должны почувствовать, что могли изобрести исчисление. Однако это смелое заявление, я бы не сказал, что он ошибается.

Мне также нравится эта страница, на ней есть короткие по существу статьи по каждой важной теме, так что ознакомьтесь с ней:



Исчисление
Слово« Исчисление
происходит от латинского, означающего маленький камень , потому что это похоже на понимание чего-то, глядя на… www.mathsisfun.com»



Статистика и вероятность

Хотя статистика - это не машинное обучение, нет сомнений в том, что машинное обучение позаимствовало многие концепции у своего «предшественника». Если вам вообще не показывали такую ​​статистику, начните здесь. Это примерно 700 страниц, но в книге много изображений и она много повторяется, поэтому ключевые моменты остаются неизменными:



Не любите старые добрые 10-фунтовые книги? Сэл из Khan Academy снова вас рассказал:



У вас нет времени? Вот 6-часовой курс статистики и вероятностей на Python. Он довольно динамичный, но охватывает большинство необходимых тем:



Я чуть не заплакал, когда искал плейлист со статистикой из 3Blue1Brown. Его не существует. Однако затем я наткнулся на этого парня, и он, вероятно, лучший парень на YouTube, который научит вас статистике и ML в будущем (Я все еще не могу привыкнуть к этим вступительным песням ...) :

Тогда есть эта книга. Он охватывает массу вещей, может быть, больше, чем любой другой предоставленный ресурс, но не содержит таких подробностей. Этого достаточно, чтобы вы начали (и далее), и вы всегда можете что-то погуглить, если вам это не понятно:



Программирование

Математика и статистика вам не помогут, если вы не умеете программировать!

Это было мое первое знакомство с Python, и этого более чем достаточно, чтобы доставить вас туда, где вам нужно. Хосе - один из моих любимых инструкторов по Удеми:



Более продвинутый курс от того же парня. Вам не обязательно знать, как кодировать двоичное дерево поиска, как начинающему специалисту по данным, но вопросы собеседования поднимут ваши мыслительные способности в небо! Вы будете гораздо меньше гуглить, и когда вы гуглите, речь не идет о тривиальных вещах (в большинстве случаев):



Если вы больше любите читать, чем смотреть видео, я настоятельно рекомендую эту книгу. Он не только очень хорошо объясняет Python, но также углубляется в его приложения, которые актуальны в реальном мире (ну, может быть, с некоторыми изменениями):



Заключительные слова

Вот и все. 19 ресурсов для начала. Необязательно проходить их все, прежде чем погрузиться в науку о данных, но полезно знать основы.

Ключ не в том, чтобы следовать только одному курсу или одной книге, ключ заключается в том, что вы охватываете их все за определенный период и, следовательно, сталкиваетесь с одними и теми же материалами несколько раз, возможно, с разных точек зрения. Тогда и только тогда вы поймете его суть.

К тем, кто уже в поле, какие ресурсы вы использовали при запуске? Не стесняйтесь поделиться!