Публикации по теме 'business-intelligence'


Природа машинного обучения
То, о чем мы думаем, когда думаем о машинном обучении, через святую троицу машинного обучения — данные, модель и оборудование. Это вторая часть моего блога, состоящего из трех частей, о том, что такое этот чертов ИИ на самом деле. Это отражение моего пути к получению степени магистра в области бизнес-аналитики. Если вы хотите увидеть первую часть этого блога (введение), нажмите здесь . Во-первых, мы поговорим о природе проектов машинного обучения. Я считаю это его святой..

Данные «Святая Троица»
Данные «Святая Троица» Три платформы данных для модернизации вашего стека данных Три — это волшебное число — по крайней мере, так говорят, — поэтому я придумал свои 3 лучшие платформы данных на 2020 год. Ничто из этого не должно быть новостью для тех, кто следит за сценой стека данных. Эти платформы являются действительно инновационными, когда речь идет о хранении, обработке данных и самообслуживании BI. Для каждого из них я дал несколько причин, по которым вам следует и не следует..

Оптимизация цены продукта с помощью регрессии
Прикладная наука о данных Оптимизация цены продукта с помощью регрессии Реализация Python оптимизации цен для максимизации дохода Цена и количество - это два основных показателя, которые определяют чистую прибыль каждого бизнеса, и установление правильной цены - одно из наиболее важных решений, которые может принять компания. Занижение цен наносит ущерб доходам компании, если потребители готовы платить больше, и, с другой стороны, завышение цен может нанести ущерб аналогичным..

Классификация с помощью kNN в RStudio
Лумонга Бинтанг Юстисия Введение kNN — это непараметрический метод обучения с учителем, в котором мы пытаемся классифицировать точку данных по заданной категории с помощью обучающего набора. Проще говоря, он собирает информацию обо всех обучающих случаях и классифицирует новые случаи на основе сходства. (Источник: https://www.r-bloggers.com/k-nearest-neighbor-step-by-step-tutorial/ ) Проблема: Классификация с kNN для набора данных классификации от kaggle. Получите набор..

Масштабно-инвариантная кластеризация и регрессия
Влияние изменения масштаба, например, использования лет вместо дней в качестве единицы измерения одной переменной в задаче кластеризации, может быть значительным. Это может привести к совершенно другой структуре кластера. Часто это нежелательное свойство, но редко упоминается в учебниках. Я думаю, что все программное обеспечение для кластеризации должно указывать в своем руководстве пользователя, что алгоритм чувствителен к масштабу. Здесь мы иллюстрируем проблему и предлагаем..

Наука о данных и ее ближайшие соседи
Я начал свой путь в науке о данных в 2012 году, в то время наука о данных, машинное обучение и искусственный интеллект, все эти термины были для меня похожи. Мне потребовалось некоторое время, чтобы понять нюансы этих похожих терминов. Я до сих пор вижу, как новички и энтузиасты путаются между этими терминами. В этой статье я расскажу о своем понимании этих терминов и о том, чем отличаются эти похожие на вид поля. Итак, приступим… Наука о данных Наука о данных — это..

Эта неделя в подготовке данных
Это второй пост в этой еженедельной серии постов в блоге, целью которой является отражение текущих событий в мире подготовки данных. Давайте посмотрим, что произошло в домене с прошлой недели. Бостонский стартап по машинному обучению DataRobot приобрел Paxata , стартап из Редвуд-Сити, специализирующийся на подготовке данных самообслуживания и структуре данных. В своем заявлении один из основателей DataRobot, Джереми Ачин, признал, что подготовка данных для ИИ была давней проблемой..