Вопросы по теме 'edit-distance'
Эффективный способ вычисления оценок сходства строк при большом размере выборки?
Предположим, у вас есть список из 10 000 адресов электронной почты, и вы хотите узнать, какие из ближайших «соседей» в этом списке определены как адреса электронной почты, которые подозрительно близки к другим адресам электронной почты в вашем списке....
4855 просмотров
schedule
18.05.2024
Расстояние Левенштейна, где меня интересуют только слова
Я хочу проверить расстояние между двумя строками с точки зрения вставки/удаления/редактирования слов. Это похоже на расстояние Левенштейна, но меня интересуют только слова, а не символы. Например:
«Кошка села на коврик» и «Собака осторожно села...
493 просмотров
schedule
19.03.2024
Оптимизируйте код R для создания матрицы расстояний на основе настраиваемой функции расстояния.
Я пытаюсь создать матрицу расстояний (для использования для кластеризации) для строк на основе настраиваемой функции расстояния. Я запустил код в списке из 6000 слов, и он все еще работает с последних 90 минут. У меня 8 ГБ ОЗУ и Intel-i5, поэтому...
1294 просмотров
schedule
11.09.2022
В R расстояние между двумя предложениями: сравнение на уровне слов по минимальному расстоянию редактирования
Пытаясь изучить R, я хочу реализовать в R приведенный ниже алгоритм. Рассмотрим два списка ниже:
List 1: "crashed", "red", "car"
List 2: "crashed", "blue", "bus"
Я хочу узнать, сколько действий потребуется, чтобы преобразовать «список1» в...
673 просмотров
schedule
06.09.2022