Skip to the content.

Всем привет! Меня часто спрашивают люди с различным математическим бэкграундом с чего начать изучать машинное обучение. Тут стоит остановиться и рассказать о моей простой классификации датасаентистов:

  1. Обычные датасаентисты. Описание: могут работать со множествами уже написанных библиотек, знают статистику, линал , могут объяснить работу многих алгоритмов. Их плюсы и минусы. Это твой бро
  2. Fit-Predict датасаентисты. Описание: знают с помощью какой функции вызывать некоторые алгоритмы, могут поговорить за офигенность датасаенса и кричать “МАШИНКА-МАШИНКА-МАШИНКА”. Это не бро

Так вот. Для джуна в машинке математика не нужна. Можно делать фит-предикт. Но это будет ваш потолок. Для чего-то большего начинайте с базовых вещей по математике, если чувствуете, что в чем-то есть проблемы. А так, идеальный, по моему мнению алгоритм по изучению машинного обучения (здесь будут только открытые курсы, без учебных но, если они есть, то это даже и круче):

  1. На входе требуется базовое знакомство с Python и математикой
  2. Начать с курса https://www.coursera.org/learn/vvedenie-mashinnoe-obuchenie . Hint: под кнопкой “Enroll” нажимаем “Apply for Financial Aid” тратим 10 минут на заполнение инфы и спустя некоторое время (вроде сейчас это 3 недели) получаем курс практически бесплатно
  3. Пока отправляете заявку, начните с изучения https://habr.com/company/ods/blog/322626/ параллельно подтягиваем питон на https://www.hackerrank.com и регистрируемся в ods.ai
  4. Практика, практика, практика. Со школы в голове у меня фраза “Лучше образование — самообразование”. Это действительно так: сами не захотите понять что-то, не поймете. Читаем ods и подписывается на интересные каналы и варимся до приготовления. В идеале нужно сделать так, чтобы могли могли взять любой кейс и рассказать его решение. Например, как отличить программистские запросы от обычных: начиная от майнинга данных, заканчивая встраиванием моделей в продакшн.
  5. Во всех этих курсах вся математика скрыта за кучей рукомаханий. Это плохо. Мы же не хотим быть фит-предиктерами, поэтому идем на курс от ВШЭ и яндекса https://www.coursera.org/learn/vvedenie-mashinnoe-obuchenie
  6. К этому моменту мы чет понимаем и в алгоритмах, и в их структуре. Дальше уже стоит углубиться в какое-то направление: например, компьютерное зрение и тексты)

P. S. Всякие ШАДы (https://yandexdataschool.ru) и другие курсы, которые требуют отбора я в расчет не беру, в силу незнания вашего уровня знаний.