Вопросы по теме 'mahout'

Рекомендации Mahout с категориями
Я новичок в Mahout, поэтому, пожалуйста, извините меня, если я спрашиваю что-то тривиальное. Я хотел бы выполнить рекомендации, но проблема, которую я пытаюсь решить, непростая. У меня есть элементы с оценками, которые относятся к разным категориям...
179 просмотров
schedule 24.05.2024

Создание элемента сходства с предварительно скомпилированным списком сходства элементов в Mahout
У меня уже есть список предметов и их сходства из задания ItemSimilarity. Теперь я хочу использовать это, чтобы получить рекомендации для конкретного пользователя. Код Java, который у меня есть сейчас, не работает, потому что я не могу найти...
372 просмотров
schedule 14.01.2024

java.lang.IllegalStateException: кластеры не найдены. Проверьте путь -c
Я использую следующую команду в командной строке для кластеризации данных с использованием алгоритма Mahout kmeans mahout kmeans -i /vect_out/tfidf-vectors/ -c /out_canopy -o /out_kmeans -dm...
478 просмотров

Вывод cvb в mahout 0.7
Я использую Mahout 0.7 на Hadoop 1.0.4. Я хочу увидеть результат набора данных Reuters для задачи тематического моделирования. Однако я получаю бесполезный результат, когда использую инструменты vectordump в Mahout. Я прочитал следующий набор...
571 просмотров
schedule 04.03.2024

Mahout: java.lang.NumberFormatException: для входной строки:
Я пытаюсь заставить mahout работать, и я получаю следующую ошибку: 3/05/16 22:48:53 INFO mapred.MapTask: record buffer = 262144/327680 13/05/16 22:48:53 WARN mapred.LocalJobRunner: job_local_0001 java.lang.NumberFormatException: For input string:...
2689 просмотров
schedule 12.05.2024

Оценка реализации рекомендателя на основе Mahout
Я использую mahout 0.7 для реализации рекомендательной системы. Чтобы оценить качество предоставленных рекомендаций, я использую AverageAbsoluteDifferenceRecommenderEvaluator , который позволяет мне оценить MAE (среднюю среднюю ошибку). Когда я...
1291 просмотров
schedule 09.07.2022

Mahout rowСходство
Я пытаюсь вычислить сходство строк между документами википедии. У меня есть векторы tf-idf в формате Key class: class org.apache.hadoop.io.Text Value Class: class org.apache.mahout.math.VectorWritable . Я следую краткому обзору текстового анализа...
2645 просмотров
schedule 23.11.2023

Проблема производительности с рекомендателем на основе элементов в Mahout
Я пытаюсь использовать рекомендацию на основе элементов в mahout. Он содержит 2,5 млн пользователей, взаимодействующих с элементами, без значений предпочтений. Около 100 элементов и 100 000 пользователей. Чтобы порекомендовать, требуется около 10...
306 просмотров

Совместная фильтрация с учетом доверия Mahout
Я пытаюсь разработать подход к совместной фильтрации с учетом доверия. У меня есть два набора данных epinions. Тот, кто кому доверяет: <ID_truster, ID_trusted> . И один с рейтингом: <ID_truster, ITEM, RATING> . Как я могу давать...
108 просмотров
schedule 12.04.2024

Логистическая регрессия с использованием Mahout
Я только что прочитал эту интересную статью о логистической регрессии с использованием Mahout. Учебник мне понятен... но как будет выглядеть реальный вариант использования? Например, при первом запуске [веб-приложения] необходимо обработать...
92 просмотров
schedule 08.02.2024

Заключительный этап saveAsTextFile искрового сходства Mahout очень медленный
Я использую Mahout 0.11.0 на Spark 1.5.1 в режиме клиента YARN на кластере HDP 2.2 из cli. Мой ввод составляет около 325 МБ, разбитых на 1000 файлов частей. Вот точная команда, которую я вызываю: $MAHOUT_HOME/bin/mahout...
544 просмотров