Spezial: Suchindex eines Wissensgebiets erneuern

Inhaltsübersicht

Suchindex erneuern

Dateien in der Volltextsuche

Die in lexiCan verwirklichte Volltextsuche durchsucht sämtliche textbasierten Inhalte eines Wissensgebiets. Um den Suchvorgang zu beschleunigen, werden diese Inhalte vom Serverdienst beim jeweiligen Abspeichern indiziert und ein Suchindex erstellt, der die Datenbasis für Suchvorgänge darstellt.

 

Inhaltsübersicht

Suchindex erneuern

Dateien in der Volltextsuche

 

Suchindex erneuern

In seltenen Fällen kann es vorkommen, dass die Volltextsuche existierende Inhalte eines Wissensgebiets nicht findet. Dann empfiehlt es sich, das gesamte Wissensgebiet mit allen Inhalten neu zu indizieren, d.h. den Suchindex komplett neu zu erstellen. Wählen Sie hierzu das betroffene Wissensgebiet und klicken Sie in der Toolbar auf "Suchindex neu erstellen".

 

 

Je nach Größe des Wissensgebiets kann der Vorgang einige Minuten in Anspruch nehmen. Während dieser Zeit können keine weiteren Aktionen im Administrator durchgeführt werden.

 

Dateien in der Volltextsuche

Grundsätzlich müssen Dateien für eine Indizierung textbasiert sein. Dies trifft auf alle Textdateien oder Office-Dateien zu. Bilddateien gehören nicht dazu und für durch Scannen mit Texterkennung erstellte PDF-Dateien besteht keine Garantie.

 

lexiCan bedient sich zur Indizierung von Dateien der Dienste von Windows. Das bedeutet der Dienst "Windows Search" muss installiert und gestartet sein. Bitte prüfen Sie gegebenenfalls dessen Status über die Diensteverwaltung des eingesetzten Serverbetriebssystems.

Zur Indizierung braucht "Windows Search" für jedes Dateiformat einen sogenannten IFilter. Für viele Dateiformate wird ein solchen Filter seitens Windows automatisch zur Verfügung gestellt. In anderen Fällen wird er bei der Installation der für das jeweilige Dateiformat zuständigen Software bereitgestellt. Insbesondere für Server stellt Microsoft ein spezielles Paket von IFiltern zur Verfügung. Es beinhaltet Filter für ältere Office-Versionen (97-2003; .DOC, .PPT, .XLS), Metro-Office (2007; .DOCX, .PPTX, .XLSX), ZIP-, OneNote-, Visio-, sowie Publisher-Dateien und Open Document-Dateien.

Bei lexiCan Business erfolgt die Indizierung von Dateien serverseitig. Daher müssen IFilter dort installiert werden.

Eine Übersicht aller IFilter finden Sie in den Indizierungsoptionen Ihres Betriebssystems.

 

 

Weitere umfangreiche Informationen zu IFiltern finden Sie in der (englischsprachigen) Wikipedia.

 

Bei PDF-Dateien ist die Sache bisweilen etwas komplizierter. Erst seit Windows 8 steht ein für lexiCan nutzbarer IFilter automatisch zur Verfügung. Auch die Installation des Adobe Readers beinhaltet keinen geeigneten Filter. Für ältere Betriebssysteme und Problemfälle empfehlen wir daher folgende Filter:

 

(1) Foxit PDF IFilter unter http://www.foxitsoftware.com (Trialversion)

(2) PDFlib TET PDF IFilter unter http://www.pdflib.com (für privaten Gebrauch kostenlos)

(3) Adobe PDF IFilter 6 für 32-Bit Systeme http://www.adobe.com (kostenlos)

(4) Adobe PDF IFilter 9 für 64-Bit Systeme http://wiki.lexican.de (der aktuellste Filter 11 von Adobe kann nicht genutzt werden!)

 

Der IFilter von Foxit soll gescannte Dokumente indizieren können. In dieser Hinsicht haben wir aber auch die Filter von PDFlib und Adobe erfolgreich testen können. Generell aber ist eine erfolgreiche Indizierung von der Qualität der Scans abhängig und kann nicht garantiert werden. Es ist daher in jedem Fall sinnvoll beim Scannen von Texten die sogenannte OCR-Texterkennung zu nutzen.

 

Ob eine PDF-Datei tatsächlich textbasiert ist, lässt sich recht einfach ermitteln: Wenn Sie in der Datei Text markieren und kopieren können, kann diese auch indiziert werden.

 

Es gibt vereinzelte Fälle, in denen trotz aller gegebenen Voraussetzungen keine Indizierung erfolgt. Das kann daran liegen, dass der Autor insbesondere von PDF-Dateien die Indizierung in den Sicherheitseinstellungen der Datei untersagt hat.