Optimieren von Suchvorgängen mit dem Ungenauigkeitsfaktor

Administratoren sollten mit den Grundlagen von Suchtokens und Sucheigenschaften vertraut sein, um bei Suchvorgängen im Tresor genauere Suchergebnisse zu erhalten (siehe Durchsuchen eines Tresors). Darüber hinaus können sie den Bereich der den Benutzern angezeigten Suchergebnisse ändern, indem sie den Lucene-Ungenauigkeitsfaktor in der Datei Web.config ändern.

Der Ungenauigkeitsfaktor bestimmt, wie viele Positionen zwischen zwei Begriffen in einer Suchphrase auftreten können, sodass sie dennoch als Übereinstimmung gelten. Diese Positionen reichen von einer exakten Übereinstimmung der Suchzeichenfolge bis zu einer Reihe von Kombinationen dieser Zeichenfolge.

Die Ungenauigkeit ist eine veränderbare Distanz ("Edit-Distanz"), wobei die Distanzeinheiten die Anzahl der Verschiebungen bezeichnen, um die Tokens in der Abfragephrase sich von ihrer Position entfernen und dennoch in der Suche erfasst werden können. Um zum Beispiel die Reihenfolge von zwei Wörtern in einer Suche umzukehren, werden zwei Verschiebungen benötigt. Die erste Verschiebung platziert die Wörter übereinander, und die zweite Verschiebung sortiert sie neu. Um also die Neusortierung von Suchzeichenfolgen mit zwei Wörtern oder Tokens zu erlauben, muss der Ungenauigkeitsfaktor mindestens auf 2 gesetzt werden.

Einfach ausgedrückt bestimmt der Ungenauigkeitsfaktor, wie weit Suchtokens außerhalb der Reihenfolge liegen dürfen, bevor sie aus den Suchergebnissen ausgeschlossen werden. Vorgabemäßig werden exaktere Übereinstimmungen höher bewertet, aber die Gesamtzahl der Suchergebnisse kann durch diesen Wert direkt beeinflusst werden.

Konfigurieren des Ungenauigkeitsfaktors

  1. Suchen Sie in der Datei Web.config (C:\Program Files\Autodesk\Vault Server 20xx) die folgenden beiden Zeilen:

    !-- slop factor provided to lucene search -->
    
    <add key="SearchSlopFactor" value="10" />
  2. Ändern Sie den Wert "SearchSlopFactor" auf dem ADMS-Server, um die von einem bestimmten Suchvorgang zurückgegebenen Ergebnisse zu verändern. Je nachdem, welche Änderungen Sie vornehmen, erhalten Sie einen spezielleren oder allgemeineren Satz von Suchergebnissen.

    Vorgabemäßig ist der Ungenauigkeitswert auf 10 festgelegt. Sie können diesen Wert auf 0 setzen, um nur exakte Übereinstimmungen zu erhalten, oder einen beliebigen höheren Wert angeben.

    Anmerkung: Denken Sie daran, wie diese Änderungen sich auf die Sucherfahrung der Benutzer auswirken können. Wenn der Wert zu niedrig ist, sind sie möglicherweise frustriert, weil sie nicht die korrekten Daten finden. Ist der Wert zu hoch eingestellt, erhalten die Benutzer möglicherweise zu viele Suchergebnisse, um sie übersichtlich sortieren zu können.

Beispiel 1: Suche mit mehreren Tokens

Angenommen, Sie möchten nach der Datei A-055401-321.ipt suchen. Diese Suche wird durch sechs (6) Suchtokens dargestellt:

Wenn Sie A-055* als Suchkriterium eingeben und der Ungenauigkeitsfaktor 10 beträgt, erhalten Sie eine beliebige Anzahl zusätzlicher Ergebnisse, die den Einstellungen des Ungenauigkeitsfaktors entsprechen:

Wenn Sie A-055* als Suchkriterium eingeben, aber der Ungenauigkeitsfaktor 6 beträgt, werden genau dieselben Ergebnisse zurückgegeben, da die Tokens nach wie vor innerhalb der durch den Ungenauigkeitsfaktor festgelegten Edit-Distanz liegen.

Wenn Sie jedoch A-055* als Suchkriterium eingeben und der Ungenauigkeitsfaktor 4 beträgt, werden nur noch 5 Ergebnisse zurückgegeben. So ist B-055401-321-A.ipt nicht mehr in den Ergebnissen enthalten, weil die Tokens in B-055401-321-A.ipt zu weit auseinander liegen, um die Ungenauigkeitseinschränkung oder Edit-Distanz zu erfüllen. Ausgehend vom ersten Bindestrich müsste "A" um 5 Positionen verschoben werden, um mit A-055* übereinzustimmen.

Wenn Sie A-055* als Suchkriterium eingeben und der Ungenauigkeitsfaktor 2 beträgt, werden nur 4 Ergebnisse zurückgegeben.

Anmerkung: Die Einstellung 2 ist der Mindestwert, bei dem das System außerhalb der Reihenfolge liegende Suchtokens zurückgibt.

B-321-055401-A.ipt wird weggelassen, da das A um 3 Positionen verschoben werden müsste, um mit dem Suchausdruck A-055* übereinzustimmen.

Wenn Sie schließlich A-055* als Suchkriterium eingeben und der Ungenauigkeitsfaktor 0 beträgt, werden nur exakte Token-Übereinstimmungen zurückgegeben.

Beispiel 2: Suche mit weniger Tokens

Was geschieht, wenn Sie die Suche mit weniger Tokens wiederholen? Diesmal führen Sie eine Suche nach A055* durch.

Anmerkung: Durch das Entfernen des Bindestrichs wird die Anzahl der Tokens verringert.

Wenn Sie A055* als Suchkriterium eingeben und der Ungenauigkeitsfaktor 5 beträgt, werden 6 Ergebnisse zurückgegeben, da die Anzahl der Positionen, um die die Tokens für eine Übereinstimmung verschoben werden müssten, reduziert wurde. Der Ungenauigkeitsfaktor braucht nicht so hoch zu sein, um 6 Ergebnisse zurückzugeben:

Wenn Sie A055* als Suchkriterium eingeben und der Ungenauigkeitsfaktor 3 beträgt, werden 5 Ergebnisse zurückgegeben. Die Edit-Distanz ist wiederum kürzer als im vorangegangenen Beispiel, aber die Ergebnisse sind identisch, wobei B-055401-321-A.ipt ausgeschlossen wird:

Wenn Sie A055* als Suchkriterium eingeben und der Ungenauigkeitsfaktor 1 beträgt, werden nur 2 Ergebnisse zurückgegeben.

Da jedoch der Bindestrich (-) entfernt wurde, ergibt die Suche nach Dateinamen mit A055* und dem Ungenauigkeitsfaktor 0 KEINE Ergebnisse, da es in diesem Fall keine exakten Übereinstimmungen gibt.