검색 슬롭 계수로 검색 미세 조정

관리자는 보다 정확한 Vault 검색 결과를 반환하기 위해 검색 토큰과 검색 특성의 기본 사항을 이해하고 활용할 뿐만 아니라(Vault 검색 참고) web.config 파일에서 Lucene "검색 슬롭 계수"를 수정하여 사용자에게 표시되는 Vault 검색 결과의 "범위"를 조작할 수도 있습니다.

"검색 슬롭 계수"는 검색 구 내의 임의의 두 용어 간에 발생할 수 있으며 여전히 일치하는 항목으로 간주될 수 있는 위치 수를 결정합니다. 이러한 위치의 범위는 검색 문자열과 정확히 일치하는 항목부터 이 문자열의 다양한 조합까지입니다.

"슬롭"은 편집 거리이며, 여기서 거리 단위는 조회 구의 토큰이 위치를 벗어나서 여전히 검색에 캡처될 수 있는 이동 횟수입니다. 예를 들어, 검색에서 두 단어의 순서를 바꾸려면 두 번의 이동이 필요합니다. 첫 번째 이동에서는 한 단어를 다른 단어 위에 두고, 두 번째 이동에서는 이러한 단어를 재정리합니다. 따라서 두 단어 또는 토큰이 포함된 검색 문자열의 재정리를 허용하려면 슬롭을 2 이상으로 설정해야 합니다.

단순한 용어의 경우 슬롭 계수는 정리가 안 된 검색 토큰이 검색 결과에서 제외되기 전에 어떻게 존재가 허용되는지를 결정합니다. 기본적으로 보다 정확히 일치하는 항목에 우선 순위가 주어지지만 전체 검색 결과 수는 직접적으로 이 값의 영향을 받을 수 있습니다.

슬롭 계수 구성

  1. Web.config 파일(C:\Program Files\Autodesk\Vault Server 20xx)에서 다음 두 행을 찾습니다.
```
!-- slop factor provided to lucene search -->

<add key="SearchSlopFactor" value="10" />
```
  1. ADMS 서버에 대한 "SearchSlopFactor" 값을 수정하여 지정된 검색에서 반환하는 결과를 변경합니다. 수행하는 변경 내용에 따라 보다 세분화되거나 개방적인 검색 결과 세트를 얻을 수 있습니다.
기본적으로 슬롭 값은 10으로 설정되어 있습니다. 이 값을 0으로 설정하면 정확히 일치하는 항목만 표시되고, 원하는 임의의 값으로 이 범위를 증가시킬 수 있습니다.

참고: 이러한 변경 내용이 사용자의 검색 환경에 어떤 영향을 주는지를 생각해 보아야 합니다. 값이 너무 낮으면 사용자가 올바른 데이터를 찾지 못해 불만을 가질 수 있습니다. 값이 너무 높으면 정렬할 검색 결과가 너무 많을 수 있습니다.

예 1: 여러 토큰으로 검색

A-055401-321.ipt 파일을 검색한다고 가정합니다. 이 검색은 6개의 검색 토큰으로 표시됩니다.

검색 기준으로 A-055*를 입력하고 슬롭 계수가 10으로 설정되어 있는 경우 슬롭 계수 설정을 충족하는 다음과 유사한 임의의 추가 결과가 표시됩니다.

검색 기준으로 A-055*를 입력하되 슬롭 계수 = 6이면 정확히 동일한 결과가 반환되는데 이는 토큰이 여전히 슬롭 계수에 의해 설정된 "편집 거리" 내에 있기 때문입니다.

그러나 검색 기준으로 A-055*를 입력하되 슬롭 계수 = 4이면 결과가 5개로 줄어듭니다. 결과에 B-055401-321.ipt가 더 이상 표시되지 않는 이유는 B-055401-321-A.ipt의 토큰이 슬롭 제한 사항 또는 편집 거리를 충족하기 위해 너무 멀리 떨어져서 확산되었기 때문입니다. 첫 번째 대시에서 시작하여 A-055*와 일치되도록 하려면 "A"를 다섯 위치 이동해야 합니다.

검색 기준으로 A-055*를 입력하되 슬롭 계수 = 2이면 결과가 4개뿐입니다.

참고: 설정 2는 시스템에서 정리가 안 된 검색 토큰을 반환하기 위한 최소값입니다.

B-321-055401-A.ipt는 생략되었는데 이는 검색 구 A-055*와 일치되도록 하려면 "A"를 세 위치 이동해야 하기 때문입니다.

마지막으로, 검색 기준으로 A-055*를 입력하되 슬롭 계수 = 0이면 정확히 일치하는 토큰 항목만 반환됩니다.

예 2: 적은 수의 토큰으로 검색

적은 수의 토큰으로 검색을 반복하면 어떻게 될까요? 이번에는 A055*를 검색합니다.

참고: 대시가 제거되므로 토큰 수가 줄어듭니다.

검색 기준으로 A055*를 입력하고 슬롭 계수 = 5이면 일치하는 항목에 대한 토큰을 이동하는 데 필요한 위치 수를 효과적으로 줄였기 때문에 6개의 결과가 표시됩니다. 슬롭 계수는 6개의 결과를 반환할 만큼 높지 않아도 됩니다.

검색 기준으로 A055*를 입력하고 슬롭 계수 = 3이면 5개의 결과가 표시됩니다. 다시 한 번 말하지만, 편집 거리는 이전 예에서보다 짧지만 결과는 B-055401-321-A.ipt가 제외되는 경우와 같습니다.

검색 기준으로 A055*를 입력하고 슬롭 계수 = 1이면 결과가 2개뿐입니다.

그러나 이제 "-" 문자가 제거되었으므로 A055*가 포함된 파일 이름 검색에서 슬롭 계수 = 0일 때 반환되는 결과가 없습니다. 이 경우에는 정확히 일치하는 항목이 없기 때문입니다.