Distância de Jaro-Winkler

A métrica de distância Jaro-Winkler [1] é a medida da similaridade entre duas strings. É uma variação da métrica Jaro distance [2].

A métrica Jaro distance [2] estabelece que dadas duas strings s 1 {\displaystyle s_{1}} and s 2 {\displaystyle s_{2}} , sua distância d j {\displaystyle d_{j}} é:

d j = m 3 a + m 3 b + m t 3 m {\displaystyle d_{j}={\frac {m}{3a}}+{\frac {m}{3b}}+{\frac {m-t}{3m}}}

onde:

  • m {\displaystyle m} é o número de correlações entre caracteres;
  • a {\displaystyle a} e b {\displaystyle b} são os tamanhos de s 1 {\displaystyle s_{1}} e s 2 {\displaystyle s_{2}} , respectivamente;
  • t {\displaystyle t} é o número de transposições.

Referências

  1. WINKLER, 1999.
  2. a b JARO, 1989, 1995

Ligações externas

  • Open Source implementation in Java and .NET
Ícone de esboço Este artigo sobre matemática é um esboço. Você pode ajudar a Wikipédia expandindo-o.
  • v
  • d
  • e