Dostosowanie wyszukiwania za pomocą współczynnika niedokładności wyszukiwania

Oprócz zrozumienia i wykorzystania podstaw tokenów i właściwości wyszukiwania w celu uzyskania dokładniejszego wyszukiwania w programie Vault (zobacz sekcję Wyszukiwanie w repozytorium) administratorzy mogą również zmieniać zakres wyników wyszukiwania, jakie użytkownicy otrzymują przez zmodyfikowanie współczynnika niedokładności wyszukiwania Lucene w pliku web.config.

Współczynnik niedokładności wyszukiwania określa, jak wiele pozycji może wystąpić pomiędzy dowolnymi dwoma słowami w wyszukiwanej frazie, aby nadal była traktowana jako dopasowana. Te pozycje mogą być dokładnymi dopasowaniami ciągu wyszukiwania, ale także dowolną kombinacją tego ciągu.

Niedokładność to odległość w edycji, w której jednostka odległości jest liczbą przesunięć, o które fragmenty wyrażenia zapytania mogą zostać przemieszczone i nadal być uwzględniane w wyszukiwaniu. Na przykład zmiana kolejności dwóch słów w wyszukiwaniu wymaga dwóch przesunięć. Pierwsze przesunięcie umieszcza wyrazy w tym samym miejscu, a drugie zmienia ich kolejność. Zatem, aby możliwa była zmiana kolejności dwóch słów lub wyrażeń w ciągu wyszukiwania, niedokładność musi wynosić co najmniej 2.

Mówiąc inaczej, współczynnik niedokładności określa, jak bardzo kolejność wyrażeń może zostać zmieniona, zanim zostaną one wykluczone z wyników wyszukiwania. Domyślnie bardziej dokładne dopasowania mają pierwszeństwo, ale wartość ta wpływa na łączną liczbę wyników.

Konfigurowanie współczynnika niedokładności

  1. W pliku Web.config (C:\Program Files\Autodesk\Vault Server 20xx) znajdź dwa następujące wiersze:
```
!-- slop factor provided to lucene search -->

<add key="SearchSlopFactor" value="10" />
```
  1. Zmień wartość „SearchSlopFactor” na serwerze ADMS, aby zmienić wyniki zwracane przez dane wyszukiwanie. W zależności od wprowadzonych zmian zestaw wyników wyszukiwania będzie bardziej precyzyjny lub bardziej otwarty.
Domyślnym ustawieniem niedokładności jest 10. Wartość tę można ustawić na 0, aby uzyskać wyłącznie dokładne dopasowania, lub zwiększyć do żądanej wartości.

Uwaga: Należy jednak mieć na uwadze, w jaki sposób zmiany wpływają na jakość wyszukiwania. Jeśli wartość jest zbyt niska, użytkownicy mogą być niezadowoleni, jeśli nie będą mogli znaleźć poprawnych danych. Jeśli wartość jest zbyt wysoka, użytkownicy mogą otrzymać zbyt wiele wyników wyszukiwania.

Przykład 1: Wyszukiwanie z wieloma wyrażeniami

Przypuśćmy, że chcemy wyszukać plik A-055401-321.ipt. To wyszukiwanie jest reprezentowane przez sześć (6) wyrażeń:

Jeśli jako kryterium wyszukiwania wprowadzę A-055*, przy współczynniku niedokładności ustawionym na 10, otrzymam dodatkowe wyniki podobne do następujących, które odpowiadają takiemu ustawieniu współczynnika niedokładności:

Jeśli jako kryterium wyszukiwania wprowadzę A-055*, ale współczynnik niedokładności zostanie ustawiony na 6, to zwrócone zostaną dokładnie te same wyniki, ponieważ wyrażenia są nadal w „odległości edycji” ustawionej przez współczynnik niedokładności.

Jeśli jednak wprowadzę A-055* jako kryterium wyszukiwania, ale współczynnik niedokładności wynosi 4, liczba wyników spadnie do 5. Powodem, dla którego w wynikach nie będzie już pliku B-055401-321.ipt, jest to, że znaki w ciągu B-055401-321-A.ipt są rozłożone zbyt daleko od siebie, aby spełnić ograniczenie niedokładności lub odległości edycji. Poczynając od pierwszego myślnika, musielibyśmy przesunąć „A” o 5 pozycji, aby dopasować ciąg A-055*.

Jeśli jako kryterium wyszukiwania wprowadzę A-055*, ale współczynnik niedokładności będzie równy 2, wyświetlone zostaną tylko 4 wyniki.

Uwaga: ustawienie 2 jest minimalną wartością, w której system zwraca wyszukiwane wyrażenia w niewłaściwej kolejności.

Plik B-321-055401-A.ipt zostanie pominięty, gdyż „A” należałoby przesunąć o trzy pozycje, aby dopasować wyszukiwaną frazę A-055*.

Na koniec, jeśli jako kryterium wyszukiwania wprowadzę A-055*, ale współczynnik niedokładności będzie wynosił 0, zwrócone zostaną tylko dokładnie dopasowane wyrażenia.

Przykład 2: Wyszukiwanie z mniejszą liczbą wyrażeń

Co się stanie, jeśli powtórzę wyszukiwanie z użyciem mniejszej liczby wyrażeń? Tym razem wyszukam ciąg A055*.

Uwaga: myślnik został usunięty, co zmniejszyło liczbę wyrażeń.

Jeśli jako kryterium wyszukiwania wprowadzę A055*, a współczynnik niedokładności = 5, otrzymam 6 wyników, ponieważ zmniejszona została liczba pozycji wymaganych do przesunięcia wyrażeń w celu uzyskania dopasowania. Współczynnik niedokładności nie musi być tak wysoki, aby zwracał 6 wyników:

Jeśli jako kryterium wyszukiwania wprowadzę A055*, a współczynnik niedokładności będzie równy 3, otrzymam 5 wyników. Ponownie odległość edycji jest mniejsza niż w poprzednim przykładzie, ale wyniki są takie same i nie ma w nich pliku B-055401-321-A.ipt:

Jeśli jako kryterium wyszukiwania wprowadzę A055*, a współczynnik niedokładności będzie wynosił 1, wyświetlane będą tylko 2 wyniki.

Jednakże po usunięciu znaku „-” wyszukiwanie nazw plików zawierających A055* ze współczynnikiem niedokładności równym 0 nie zwróci żadnych wyników, gdyż w tym przypadku nie będzie dokładnych dopasowań.