Suchen mit Tokens

Das Suchsystem indiziert Tokens anstelle der vollständigen Eigenschaftenwerte.

Tokens sind einzelne Teile eines Eigenschaftenwerts, mit denen das System Dateien auf der Grundlage der Informationsteile suchen kann. Dieses Suchverfahren ermöglicht die schnellere Ermittlung von Suchergebnissen und verringert die Auswirkungen auf das System bei der Suche in Tresoren mit mehreren tausend Eigenschaftenwerten.

Auf der Grundlage von Kenntnissen bezüglich der Unterteilung von Eigenschaftenwerten in Tokens können Benutzer nur nach Tokens suchen. Hierdurch verringern sich die Auswirkungen auf das System, wenn mehrere Ergebnisse zurückgegeben werden, da Benutzer ihre Suche genauer spezifizieren können. Führt nun ein Benutzer dieselbe Suche nach DES durch, werden nur Dateien zurückgegeben, deren Autor die Initialen DES hat. Die Datei Design00.idw wird nicht zurückgegeben, da das erste Token Design ist, währen die Initialen DES des Autors bereits ein vollständiges Token bilden.

Aufteilung von Eigenschaftenwerten in Tokens

Alle aufeinanderfolgenden Zeichen eines Typs werden in einem Token zusammengefasst. Zeichen desselben Typs sind alphabetische Zeichen (A, B, C, ...Z), numerische Zeichen (0,1,2,..9) oder Sonderzeichen (-,_,@...$).

Es kann nur nach sechs Sonderzeichen gesucht werden:

Nach allen anderen Sonderzeichen kann nicht gesucht werden und sie sind nicht in Tokens enthalten.

In dieser Tabelle ist die Aufteilung von drei verschiedenen Dateinamen in Token dargestellt.

Dateiname Token

A-055401-321.ipt

  • A
  • -
  • 055401
  • -
  • 321
  • ipt

Great White Shark.doc

  • Großer
  • Weißer
  • Hai
  • doc

Gr8work.xls

  • Gr
  • 8
  • work
  • xls

Suchen mit Tokens

Auf dieser Grundlage können Suchwerte basierend auf Tokens angegeben werden, sodass bei der Erstellung von Suchanfragen eine größere Flexibilität möglich ist. Ein Benutzer kann ein Platzhalterzeichen für breiter angelegte Suchvorgänge anhängen oder ein Token für spezifischere Rückgaben angeben.