Вопросы по теме 'mahout'
Рекомендации Mahout с категориями
Я новичок в Mahout, поэтому, пожалуйста, извините меня, если я спрашиваю что-то тривиальное. Я хотел бы выполнить рекомендации, но проблема, которую я пытаюсь решить, непростая. У меня есть элементы с оценками, которые относятся к разным категориям...
179 просмотров
schedule
24.05.2024
Создание элемента сходства с предварительно скомпилированным списком сходства элементов в Mahout
У меня уже есть список предметов и их сходства из задания ItemSimilarity. Теперь я хочу использовать это, чтобы получить рекомендации для конкретного пользователя. Код Java, который у меня есть сейчас, не работает, потому что я не могу найти...
372 просмотров
schedule
14.01.2024
java.lang.IllegalStateException: кластеры не найдены. Проверьте путь -c
Я использую следующую команду в командной строке для кластеризации данных с использованием алгоритма Mahout kmeans
mahout kmeans -i /vect_out/tfidf-vectors/ -c /out_canopy -o /out_kmeans -dm...
478 просмотров
schedule
18.12.2023
Вывод cvb в mahout 0.7
Я использую Mahout 0.7 на Hadoop 1.0.4. Я хочу увидеть результат набора данных Reuters для задачи тематического моделирования. Однако я получаю бесполезный результат, когда использую инструменты vectordump в Mahout. Я прочитал следующий набор...
571 просмотров
schedule
04.03.2024
Mahout: java.lang.NumberFormatException: для входной строки:
Я пытаюсь заставить mahout работать, и я получаю следующую ошибку:
3/05/16 22:48:53 INFO mapred.MapTask: record buffer = 262144/327680
13/05/16 22:48:53 WARN mapred.LocalJobRunner: job_local_0001
java.lang.NumberFormatException: For input string:...
2689 просмотров
schedule
12.05.2024
Оценка реализации рекомендателя на основе Mahout
Я использую mahout 0.7 для реализации рекомендательной системы.
Чтобы оценить качество предоставленных рекомендаций, я использую AverageAbsoluteDifferenceRecommenderEvaluator , который позволяет мне оценить MAE (среднюю среднюю ошибку). Когда я...
1291 просмотров
schedule
09.07.2022
Mahout rowСходство
Я пытаюсь вычислить сходство строк между документами википедии. У меня есть векторы tf-idf в формате Key class: class org.apache.hadoop.io.Text Value Class: class org.apache.mahout.math.VectorWritable . Я следую краткому обзору текстового анализа...
2645 просмотров
schedule
23.11.2023
Проблема производительности с рекомендателем на основе элементов в Mahout
Я пытаюсь использовать рекомендацию на основе элементов в mahout. Он содержит 2,5 млн пользователей, взаимодействующих с элементами, без значений предпочтений. Около 100 элементов и 100 000 пользователей. Чтобы порекомендовать, требуется около 10...
306 просмотров
schedule
24.01.2024
Совместная фильтрация с учетом доверия Mahout
Я пытаюсь разработать подход к совместной фильтрации с учетом доверия. У меня есть два набора данных epinions. Тот, кто кому доверяет: <ID_truster, ID_trusted> . И один с рейтингом: <ID_truster, ITEM, RATING> .
Как я могу давать...
108 просмотров
schedule
12.04.2024
Логистическая регрессия с использованием Mahout
Я только что прочитал эту интересную статью о логистической регрессии с использованием Mahout. Учебник мне понятен... но как будет выглядеть реальный вариант использования? Например, при первом запуске [веб-приложения] необходимо обработать...
92 просмотров
schedule
08.02.2024
Заключительный этап saveAsTextFile искрового сходства Mahout очень медленный
Я использую Mahout 0.11.0 на Spark 1.5.1 в режиме клиента YARN на кластере HDP 2.2 из cli. Мой ввод составляет около 325 МБ, разбитых на 1000 файлов частей. Вот точная команда, которую я вызываю:
$MAHOUT_HOME/bin/mahout...
544 просмотров
schedule
27.06.2022