Suchmaschinenexperte

So kann es laufen.... Ich war bei meiner letzten Firma ja als Programmierer und Berater in dem Bereich SAP eingestellt und hab meinen Kollegen fleißig von meinem Hobby "SEO" erzählt. Nachdem ich jetzt aber ja hauptberuflich nur noch SEO mache, hat mich meine alte Firma kontaktiert, dass Sie einen Suchmaschinenexperten brauchen. Natürlich habe ich gleich zugesagt - ist ja Ehrensache....

Bei der Firma wurde eine Dokumentation Software erworben mit denen man Arbeitsschritte und Arbeitsanweisungen dokumentieren kann. Für diese Anwendung gibt es eine HTML-Exportfunktion um diese über den Browser anzuzeigen.
Diese Seiten werden dann als Doku-Portal den Mitarbeiter zur Verfügung gestellt. Für diese statischen HTML Seiten soll jetzt eine Suchmaschine implementiert werden. Und da ich ja jahrelang über Suchmaschinen Algoryhtmen gesprochen habe, wußten die Firma gleich an wen Sie sich wenden können. Nach kurzer Überzeugungsarbeit meinerseits, hab ich dazu geraten, auf eine bestehende Intranet Suchmaschine zurückzugreifen. Gesagt, tun getan :-)

Hier mal meine Erfahrungen und Voraussetzungen....

Leider gab es keine Möglichkeit auf die Datenbank direkt zu zugreifen, da sich die Anwendung die die Seiten exportiert die Daten aus mehreren Systemen (SAP usw) zusammengebaut hat, und es da einfach zuviele Zugriffsberechtigungen und sonstige Probleme gegeben hätte.
Also war eine möglichst kostenlose Suchmaschine notwenig die einen Index aus statischen Flat-Files erstellen kann.
Eine weitere Voraussetzung war, das meine Scripte auf einem Windows System laufen mussten.
Also musste ich auch erstmal suchen was da so als Intranet Suchmaschinen zur Verfügung stehen um so eine Suche zu realisieren.
Nach einigen Recherchen kann ich schnell auf htdig.org. Htdig macht auf mich einen sehr schönen Eindruck. Features wie GNU Licence also kostenlos, Fuzzy Suche, Suche in Flat Files usw hätten alle Anforderungen erfüllt. Allerdings hat mich ein bisschen gestört dass der letzte News Eintrag vom 16.6.2004 ist. Also fast genau 3 Jahre her. Aber das Knockout für htdig war dass für mich eine zu lange Einarbeitungsphase gewesen wäre, weil man die Software erst compiliert werden muss und eher auf Linux Systeme ausgelegt ist. Da ich mich mit Cygwin noch nicht wirklich auseinander gesetzt habe, b, hab ich mich weiter auf die Suche nach Alternativen gemacht.

Danach bin ich auf Webglimpse aufmerksam geworden. Ich kannte die Seite ja aus anderen, in SEO Kreisen wahrscheinlich bekannten Gründen ;-). Leider ist diese aber mit Licencen verbunden. Also war ich schnell wieder weg.

Schließlich bin ich auf Lucene gestoßen welche alle Anforderungen erfüllt hat. Da ich mich schon heimischer im Umgang mit den Requrements gefühlt habe, entschied ich mich Lucene einzusetzen.
Nachdem ich schon öfters ja Apache Server in Verbindung mit PHP eingerichtet habe, bin ich mal wieder den Weg des geringsten Wiederstandes gegangen. Der PHP Ablegen von Lucene ist ZEND Search Lucene dass im Zend Framework enthalten ist. Nach kurzer Zeit war Apache, PHP und ZEND am Laufen und ich hab mit Hilfe dieser Seite http://devzone.zend.com/node/view/id/91 recht zugüg den Suchmaschinen Index und Suche aufbauen können.

Jetzt bin ich also wirklich ein Suchmaschinen Experte und zumindest intern bei dieser Firma wird "meine" Suchmaschine mit der Anzahl der Suchanfragen mit Google mithalten können.