Správci mohou kromě pochopení a vyladění základních operací s tokeny a vlastnostmi vyhledávání zdokonalit vyhledávání v úložišti, aby vracelo přesnější výsledky (viz část Prohledávání úložiště). Kromě toho mohou také řídit rozsah výsledků vyhledávání v úložišti úpravou faktoru tolerance vyhledávání prostředí Lucene v souboru web.config.
Faktor tolerance vyhledávání určuje počet vzájemných pozic dvou libovolných termínů v hledaném výrazu, při kterém se stále jedná o shodu. Počet těchto pozic se pohybuje v rozsahu od přesné shody s vyhledávaným řetězcem po určitý počet variací tohoto řetězce.
Tolerance je rozsah úpravy, ve kterém jsou přesuny jednotlivých tokenů mimo původní pozici považovány za jednotky, které určují, zda bude hledaný výraz stále obsažen ve výsledcích vyhledávání. Změna pořadí dvou slov ve vyhledávání například vyžaduje dva přesuny. Při prvním přesunu se umístí jedno slovo nad druhé a při druhém jsou obě slova opět uspořádána. Chcete-li proto například povolit změnu uspořádání vyhledávacího řetězce o dvou slovech či tokenech, tolerance musí být nastavena nejméně na hodnotu 2.
Faktor tolerance tedy jednoduše řečeno určuje povolenou odchylku pořadí tokenů vyhledávání před jejich vyloučením z výsledků vyhledávání. Ve výchozím nastavení jsou upřednostňovány přesné shody, avšak touto hodnotou lze přímo ovlivnit celkový počet výsledků vyhledávání.
V souboru Web.config (C:\Program Files\Autodesk\ADMS Professional 20xx\Server\Web\Services) vyhledejte následující dva řádky:
!-- slop factor provided to lucene search --> <add key="SearchSlopFactor" value="10" />
Ve výchozím nastavení má tolerance hodnotu 10. Hodnotu můžete snížit až na 0, aby vyhledávání vracelo jen přesné shody, nebo tento rozsah zvýšit na libovolnou hodnotu.
Příklad 1: Vyhledávání s větším počtem tokenů
Pokud jako kritérium vyhledávání zadáte výraz A-055* a faktor tolerance nastavíte na hodnotu 10, obdržíte libovolný počet dalších výsledků podobných těm, které splňují nastavení faktoru tolerance:
Pokud jako kritérium vyhledávání zadáte výraz A-055* a faktor tolerance nastavíte na hodnotu 6, budou vráceny tytéž výsledky, protože tokeny se stále nacházejí v „rozsahu úpravy“ daném faktorem tolerance.
Pokud však jako kritérium vyhledávání zadáte výraz A-055* a faktor tolerance nastavíte na hodnotu 4, počet výsledků bude omezen na 5. Výsledky již nebudou zahrnovat soubor B-055401-321.ipt, protože tokeny v názvu souboru B-055401-321-A.ipt jsou od sebe příliš vzdálené a nesplňují proto omezení tolerance nebo povolený rozsah úpravy. Aby pozice písmene A odpovídala kritériu vyhledávání A-055*, bylo by nutné ji od první pomlčky posunout o 5 míst.
Pokud jako kritérium vyhledávání zadáte výraz A-055* a faktor tolerance nastavíte na hodnotu 2, získáte pouze 4 výsledky.
Výsledek B-321-055401-A.ipt bude vynechán, protože písmeno A by bylo třeba posunout o 3 místa, aby odpovídalo vyhledávací frázi A-055*.
Pokud jako kritérium vyhledávání zadáte výraz A-055* a faktor tolerance nastavíte na hodnotu 0, budou vráceny jen přesné shody tokenů.
Příklad 2: Vyhledávání s menším počtem tokenů
Co se stane, když zopakujete vyhledávání s menším počtem tokenů? Nyní budete vyhledávat řetězec A055*.
Pokud jako kritérium vyhledávání zadáte výraz A055* a faktor tolerance nastavíte na hodnotu 5, získáte 6 výsledků, protože jste účinně snížili počet míst, o které je nutné tokeny přesunout, aby byla nalezena shoda. Faktor tolerance nemusí být tak vysoký, aby se vracelo 6 výsledků:
Pokud jako kritérium vyhledávání zadáte výraz A055* a faktor tolerance nastavíte na hodnotu 3, získáte 5 výsledků. Opět platí, že rozsah úpravy je menší než v předchozím příkladu, ale výsledky budou stejné a soubor B-055401-321-A.ipt bude vyloučen:
Pokud jako kritérium vyhledávání zadáte výraz A055* a faktor tolerance nastavíte na hodnotu 1, získáte pouze 2 výsledky.
Protože však nyní chybí znak „-“, vyhledávání názvů souborů obsahujících řetězec A055* s faktorem tolerance = 0 nevrátí ŽÁDNÉ výsledky – v tomto případě neexistují žádné přesné shody.