Публикации по теме 'data-mining'


Наука о данных против машинного обучения против искусственного интеллекта против глубокого обучения против интеллектуального анализа данных: знайте различия
Поскольку данные становятся движущей силой современного мира, почти все в какой-то момент сталкивались с такими терминами, как наука о данных, машинное обучение, искусственный интеллект, глубокое обучение и интеллектуальный анализ данных. Но что именно означают эти термины? Какие различия и отношения существуют между ними? Перечисленные термины при этом все взаимосвязаны, не могут использоваться взаимозаменяемо. Независимо от того, являетесь ли вы специалистом, интересующимся..

Автоматизация реализации модели машинного обучения с помощью Sklearn Pipeline
В этом руководстве мы увидим, как ускорить этап реализации модели при разработке алгоритма машинного обучения. Много раз, работая над проблемами машинного обучения, мы сталкиваемся с задачей машинного обучения, в которой мы хотим предварительно обработать наши данные и протестировать нашу модель с различными классификаторами, чтобы выбрать лучший. В таких случаях подгонка каждого классификатора индивидуально к обучающим данным с последующим тестированием модели является слишком..

Хребтовая регрессия с мультиколлинеарностью в Пихтоне
Хребтовая регрессия с мультиколлинеарностью в Пихтоне Регрессия по определению гребня Ридж-регрессия - это метод анализа данных множественной регрессии, страдающих мультиколлинеарностью. Конкретный вид, используемый в гребневой регрессии, известен как регуляризация L2. В регрессии гребня штраф - это сумма квадратов коэффициентов. Регуляризация L2, также известная как Регуляризация хребта - это добавляет в модель условия регуляризации, которые являются функцией квадрата..

Набор данных Airbnb для майнинга
Факторы, влияющие на прибыль Airbnb CRISP-DM (межотраслевой стандартный процесс интеллектуального анализа данных) Понимание бизнеса Понимание данных Подготовка данных Моделирование Оценка Развертывание Понимание бизнеса Airbnb — это основанная на сообществе онлайн-платформа для размещения и аренды местных домов. Он связывает хозяев и путешественников и облегчает процесс аренды, не владея никакими комнатами. Кроме того, он культивирует экономику совместного использования,..

Наука о данных и ее ближайшие соседи
Я начал свой путь в науке о данных в 2012 году, в то время наука о данных, машинное обучение и искусственный интеллект, все эти термины были для меня похожи. Мне потребовалось некоторое время, чтобы понять нюансы этих похожих терминов. Я до сих пор вижу, как новички и энтузиасты путаются между этими терминами. В этой статье я расскажу о своем понимании этих терминов и о том, чем отличаются эти похожие на вид поля. Итак, приступим… Наука о данных Наука о данных — это..

Здоровые угощения
Абстрактный: Паратхи известны как один из лучших и популярных завтраков в Индии. Он возник в Пешаваре, а затем распространился по северным частям Индии и начинался как полезная еда, которую часто ели на завтрак. Это лепешка, которая возникла на Индийском субконтиненте. Обычно его готовят из цельнозерновой муки, обжаривают на топленом масле или растительном масле и часто фаршируют овощами, особенно вареным картофелем, редисом или цветной капустой и / или паниром (индийский сыр). Цель..

Изучение библиотеки Python Pandas для науки о данных
Часть 1. Управление набором данных о COVID-19 Pandas - одна из наиболее часто используемых библиотек Python для анализа данных, статистического анализа, обработки данных, временных рядов и многого другого. Panda имеет два типа структур данных: Series и DataFrame . Серия - это одномерный массив с однородной типизацией (столбец), а Данные Frame - это общая двухмерная помеченная табличная структура с изменяемым размером. с потенциально неоднородно типизированным столбцом..