5 книг, которые должен прочитать каждый специалист по анализу данных в 2021 году
Не знаете, что добавить в свой список для чтения на 2021 год? Придерживайтесь самого необходимого.
Справочник по науке о данных
Эта книга обязательно должна быть на полке каждого специалиста по данным: она содержит интервью с 25 специалистами по данным из разных компаний, отраслей и уровней опыта. Они дадут вам ценную информацию о том, как спланировать свою карьеру в долгосрочной перспективе, в каких компаниях работать, как продолжать учиться и как они видят изменения в этой сфере в ближайшие годы. Эта книга добавляет много ценностей и полезных идей, особенно если вы новичок. Для более подробного резюме прочтите эту статью с 10 основными уроками из книги.
В качестве упражнения я рекомендую вам получить некоторые из наиболее интересных вопросов из книги и задать их специалисту по данным, который работает в компании, в которой вы действительно хотите работать, или кому-то, кто работает в вашей стране или регионе (свяжитесь с ними по LinkedIn). Таким образом вы сможете получить то же самое понимание, но с учетом вашей реальности и целей.
Практическая статистика для специалистов по данным
Есть два основных обстоятельства, при которых вы получите пользу от этой книги: у вас технический опыт и вам нужно больше узнать о статистике, или вы пришли с академическим образованием и имеете много теоретических знаний в области статистики, но еще не сделали этого. очень часто использовал это на практике. Книга познакомит вас с основными понятиями статистики, такими как t-тесты, распределения и машинное обучение, и покажет, как они работают на практике с использованием Python и R. Это хорошая книга среднего уровня, которая фокусируется на применении, а не на теории.
Я настоятельно рекомендую вам поиграть с кодом из книги, попытаться воспроизвести некоторые фрагменты кода и настроить их, чтобы посмотреть, как они будут работать.
Разработка функций для машинного обучения
Разработка функций, возможно, является одним из самых важных шагов в рабочем процессе обработки данных. Когда у вас будет хорошее общее представление об этом рабочем процессе и об основных алгоритмах, вам определенно следует начать оттачивать свои навыки проектирования функций. В основном это означает владение множеством различных инструментов и определение того, когда их использовать, в зависимости от ваших данных и ваших целей.
В этой книге хорошо сочетаются теория, практическое применение и интуиция, и я рекомендую вам читать ее, делая множество заметок, а затем держать ее под рукой в качестве справочного руководства.
Для получения дополнительной информации о разработке функций вы можете прочитать эту статью.
Книга по машинному обучению на сотня страницах
Одна из лучших книг для понимания математики основных алгоритмов машинного обучения. Объяснения ясны и просты, но точны. Это должна быть одна из первых книг, которые вы прочитаете, начиная свой путь к машинному обучению, особенно если вы уже знакомы с математикой и ее обозначениями. Если вы не так хорошо знакомы с математикой, возможно, вам следует сначала освоиться с интуицией алгоритмов, прежде чем углубляться в нее.
Если вы действительно хотите изучить эту книгу подробно, я рекомендую вам попробовать реализовать алгоритмы в ней, используя язык программирования по вашему выбору, чтобы убедиться, что вы закрепили свои знания.
Подумайте о Байесе
Начав изучать статистику, вы часто будете читать о Байесе и некоторых байесовских алгоритмах. Через некоторое время вы также услышите об определенных спорах между байесовскими и частотными подходами. Если вы не знаете разницы между этими двумя подходами, я приглашаю вас посмотреть Видео Кэсси Козыркова, где она очень интуитивно научит вас этому примерно за 7 минут.
Как только вы поймете эту разницу, может быть очень полезно изучить байесовскую статистику, чтобы освоить байесовские алгоритмы (некоторые из которых действительно мощные) и добавить их в свой арсенал. Я рекомендую эту книгу, особенно если у вас есть опыт работы в статистике, но никогда раньше не изучали подробно байесовские методы: она не слишком углубляется в предмет, но достаточно хороша, чтобы дать вам некоторую интуицию и показать вам, как использовать байесовские методы. статистика с Python.
Если вам нравится изучать науку о данных по книгам, вам также может понравиться эта статья:
Не стесняйтесь обращаться ко мне в LinkedIn, если вы хотите продолжить обсуждение, это будет приятно (честно).