Вопросы по теме 'edit-distance'

Эффективный способ вычисления оценок сходства строк при большом размере выборки?
Предположим, у вас есть список из 10 000 адресов электронной почты, и вы хотите узнать, какие из ближайших «соседей» в этом списке определены как адреса электронной почты, которые подозрительно близки к другим адресам электронной почты в вашем списке....
4855 просмотров

Расстояние Левенштейна, где меня интересуют только слова
Я хочу проверить расстояние между двумя строками с точки зрения вставки/удаления/редактирования слов. Это похоже на расстояние Левенштейна, но меня интересуют только слова, а не символы. Например: «Кошка села на коврик» и «Собака осторожно села...
493 просмотров
schedule 19.03.2024

Оптимизируйте код R для создания матрицы расстояний на основе настраиваемой функции расстояния.
Я пытаюсь создать матрицу расстояний (для использования для кластеризации) для строк на основе настраиваемой функции расстояния. Я запустил код в списке из 6000 слов, и он все еще работает с последних 90 минут. У меня 8 ГБ ОЗУ и Intel-i5, поэтому...
1294 просмотров

В R расстояние между двумя предложениями: сравнение на уровне слов по минимальному расстоянию редактирования
Пытаясь изучить R, я хочу реализовать в R приведенный ниже алгоритм. Рассмотрим два списка ниже: List 1: "crashed", "red", "car" List 2: "crashed", "blue", "bus" Я хочу узнать, сколько действий потребуется, чтобы преобразовать «список1» в...
673 просмотров
schedule 06.09.2022