Публикации по теме 'dataset'


Расширение набора данных машинного обучения 101 — часть A
Общее руководство по типам аугментации и советы по созданию качественных наборов данных Введение: В этой статье мы объясним каждый тип аугментации, их значение и несколько советов, о которых следует помнить при выборе конкретной техники аугментации. Расширение обнаружения объектов листать — — — — — — — — — — — — — — — — — — — — — — — — — — — — Перевернутое изображение или перевернутое изображение  – это изображение, созданное путем зеркального переворачивания оригинала по..

Наборы данных и где их найти
В области машинного обучения нам всегда нужно работать с данными. Открытые наборы данных — это хороший способ проверки концепций или идей или обучения. Знание наборов данных, на которых обучались популярные сети, также может быть полезным. Их много для каждого типа задач. Давайте посмотрим на некоторые из них и узнаем, где найти больше. Малый и средний наборы данных MNIST (модифицированная база данных Национального института стандартов и технологий)

Исследовательский анализ данных опухолей рака молочной железы в Python
Тематическое исследование Цель этого тематического исследования — продемонстрировать, как машины опорных векторов (SVM) можно использовать для прогнозирования того, является ли опухоль молочной железы злокачественной или доброкачественной, на основе ее особенностей. Набор данных, использованный в этом тематическом исследовании, представляет собой набор данных «Рак молочной железы, штат Висконсин» (диагностический), который содержит информацию об опухолях рака молочной железы у пациентов в..

Прогноз меланомы с использованием методов CNN. Часть 1
Аннотация Часть 2 Мотивация Уход за кожей является важной ежедневной темой для многих людей во всем мире. Интернет-портал (aad.org, stats-melanoma, 2022) сообщает, что «меланома может поразить любого. На самом деле более 1 миллиона американцев живут с меланомой». Люди заботятся о своей коже, чтобы избежать развития худших сценариев, таких как меланома. Меланома кожи или рак кожи находится в группе самой высокой выживаемости в США, процент составляет 93% (Giaquinto, A.N. et al.,..

COVID-19 и первая война науки о данных
В подзаголовке своей замечательной истории о гонке за ядерной бомбой писатель и историк науки Джим Бэгготт назвал Вторую мировую войну «первой войной физиков». Сегодня усилия, предпринимаемые для обуздания пандемии COVID-19, могут стать первым примером широкомасштабного глобального реагирования, основанного на данных, на мировой кризис и, как таковое, возможно, первой войной науки о данных. Трудно переоценить, сколько данных стало доступно за чрезвычайно короткое время, а открытая наука и..

Интеллектуальный анализ данных набора данных Geolife
Цель проекта - подготовить набор данных (Geolife) для прогнозирования типа транспортного средства, используемого для выполнения определенного маршрута. Набор данных ( Траектории геологической жизни 1.3 ) был разработан Microsoft Research Asia путем сбора данных о траекториях (или путях) GPS, представленных 24 876 978 точками, записанными 182 пользователями в период с апреля 2007 по август 2012 года. Каждая папка набора данных содержит файл GPS-траекторий одного пользователя в формате..

5 лучших наборов данных с открытым исходным кодом для машинного обучения от PerceptiLabs
Тем, кто разрабатывает модели машинного обучения (ML) или только впервые начинает заниматься машинным обучением, это хорошо, потому что никогда раньше не было так много наборов данных с открытым исходным кодом, которые были бы доступны в свободном доступе для начала. Доступ к наборам данных с открытым исходным кодом дает ряд преимуществ. Во-первых, это позволяет вам сосредоточиться на разработке вашей модели, а не на управлении данными, при котором вы сначала собираете большие..