Статистические методы являются ключевой частью науки о данных. Однако очень немногие аналитики данных обучены статистике должным образом, поскольку нет книг по статистике, написанных специально для аналитиков данных.
С другой стороны, многие ресурсы, посвященные науке о данных, содержат статистические методы, но не раскрывают перспективы применения этих методов достаточно глубоко.
Предлагаемая книга, написанная доступным языком, устраняет этот пробел. Если вы немного знакомы с языком программирования R и математической статистикой, то легко освоите материал и существенно повысите свой профессиональный уровень
Во второе издание включены примеры на языке Python, что расширяет практическое применение книги.
Прочитав эту книгу, вы узнаете:
• почему разведывательный анализ данных является ключевым предварительным шагом в науке о данных;
• как случайная выборка может уменьшить смещение и привести к более высококачественному набору данных, даже в условиях больших данных;
• как принципы планирования эксперимента помогают получить наиболее полные ответы на вопросы;
• как использовать регрессию для оценки результатов и выявления аномалий.
Вы освоите:
• ключевые методы классификации для предсказания, к какой категории относится запись;
• статистические методы машинного обучения, которые «обучаются» на данных;
• методы обучения без учителя для извлечения информации из немаркированных данных.
2-е издание, переработанное и дополненное.
%text%