Я нашел следующие формулы для межкластерных и внутрикластерных расстояний, и я не уверен, что понимаю, как они работают.

Межкластерное расстояние

Разве в приведенных выше формулах не должен быть квадратный корень?
Межкластерные и внутрикластерные:


Почему индекс j начинается с N+1? А не с 1 на N2?
Какой из них правильный? Или есть аналоги? Или я должен выбрать расстояние между центроидами для межкластерного расстояния? Кажется довольно простым. А как насчет внутрикластерного расстояния?
Я нашел формулы из Википедии http://en.wikipedia.org/wiki/Cluster_analysis#Internal_evaluation еще труднее понять.
Мне нужно вычислить эти расстояния, чтобы правильно сгруппировать цвета, чтобы создать уменьшенную цветовую палитру, поэтому я думаю, что чем точнее эти расстояния, тем точнее группировка (формула вместо расстояния между центроидами расстояние для межкластерного ). Векторы являются трехмерными (компоненты RGB).