Open Source Enterprise Search mit Apache SOLr und elasticsearch

Das Angebot und der Markt der Enterprise Search Anbieter hat sich in den letzten 12 Monaten rapide gewandelt: mehrere große und mittelgroße kommerzielle Anbieter wurden von noch größeren globalen Firmen aufgekauft (Autonomy-HP, ISYS-Lexmark, …). Microsoft hat in Sharepoint 2013 viel an Suchtechnologie integriert. Google bietet seine Mini-Appliance nicht mehr an. Kleinere, innovative Anbieter (SearchBox, Attivio, …) versuchen, ihre Chancen mit neuem Venture-Kapital zu nutzen.

Für Unternehmen, die schon viel Geld ausgegeben haben für kommerzielle Enterprise Search Systeme, bedeutet dies viel Unsicherheit bzw. die Abhängigkeit von einzelnen Anbietern und Plattformen. Open Source Enterprise Suchtechnologien sind dagegen jetzt reif für den Einsatz, es gibt die notwendigen Funktionalität, den technischen Support und die Chance, mit professioneller Unterstützung den besten Nutzen aus einer Enterprise Suche ziehen zu können.

Open Source Enterprise Search ist reif

Während die Anzahl der kommerziellen Systeme immer noch relativ hoch ist (international ca. 60 proprietäre Softwaresysteme), ist der Markt an Open Source Systemen gut überschaubar. Als grundsätzliche Alternative zu kommerziellen Angeboten stelle ich hier zwei der bekanntesten Lösungen auf Basis von Open Source vor.
Es gibt eine relativ kleine Anzahl an open source Search Engines und darauf aufbauende Lösungen, die neben der reinen Community-Variante auch eine Enterprise- oder Professional-Version anbieten. Darüber hinaus entstehen rasch Unternehmen, die kommerziellen Support und/oder proprietäre Add-ons zu diesen Engines anbieten. In dieser Konstellation wird auch klar, dass Enterprise Search nicht eine Software ist, die man kauft und einsetzt, sondern alle Anstrengungen umfasst, durch Integration von Informationsressourcen diese in einem Unternehmen leichter auffindbar zu machen.

Apache SOLr und elasticsearch

Community und Lizenz

Ein Community-Vergleich der zwei bekanntesten open Source Search Engines (Apache Lucene/SOLr und elasticsearch) zeigt, dass Apache Lucene/SOLr über die breitere und stabilere Entwicklerbasis verfügt (Anzahl der und organisatorische Verankerung der Entwickler, Commits, Laufzeit). Apache Lucene bzw. das darauf aufbauende Apache SOLr sind derzeit die am häufigsten eingesetzten open source Suchtechnologien. Beide Systeme stehen unter derselben – wenig restriktiven – Apache 2 Lizenz.

Features

Ein technischer Vergleich gibt elasticSearch Vorteile in Bezug auf die Verteilung der Daten und somit auf seine Fähigkeit im Bereich Big-Data, hinsichtlich der verfügbaren Integrationen und Erweiterungen (open-source oder kommerziell) ist Apache Lucene/SOLr im Vorteil. Beide Suchlösungen basieren auf Apache Lucene und sind in Java implementiert. Man kann davon ausgehen, dass wesentlichen die Funktionalitäten beider Systeme in etwa gleichwertig sind.

Support

Ein weiteres entscheidendes Kriterium für die Auswahl ist daher der verfügbare Support durch Consultants und Integratoren. Mit LucidWorks  und ihren Produkten LucidWorks Search sowie LucidWorks BigData hat Apache SOLr hier den stärksten Lösungsanbieter, und viele kleinere Unternehmen wie etwa flax bieten auch in Europa kommerziellen Support für SOLr. Für elasticsearch ist das niederländische Unternehmen elasticsearch.com der erste Ansprechpartner.

Fazit

Diese zwei Enterprise Suchmaschinen müssen keinerlei technischen Vergleich mit anderen kommerziellen Anbietern scheuen – sie sind per se und als Basis für darauf aufbauende Systeme, unverzichtbare “building blocks” einer offenen Enterprise Search. Apache Lucene/SOLr und ElasticSearch sind aber nicht die einzigen Systeme, Xapian und Sphinx oder Constellio wären unter anderem auch noch zu nennen, diese haben aber nicht die Verbreitung der beiden erstgenannten Systeme. Und: Es gibt eine sehr breite Palette von Produkten, die auf erstgenannte Systeme aufbauen und spezifischere Problemlösungen ermöglichen, darunter aus Deutschland etwa der iFinder von intrafind, aus Österreich z.B. Poolparty  der Semantic Web Company oder aus der Schweiz die Searchbox.

Disclaimer: Die genannten open source Enterprise Search Systeme und noch in viel größerem Ausmaß die erwähnten Anbieter sind eine persönliche Auswahl des Autors und erheben keinerlei Anspruch auf Vollständigkeit. Ich bin  Committer und PMC-Mitglied von Apache Stanbol.

Veröffentlicht unter Blog, Enterprise, Open Source, Suche
3 Kommentar auf “Open Source Enterprise Search mit Apache SOLr und elasticsearch
  1. Spannender Beitrag.
    Welche Unternehmen kennen Sie, die Enterprise Search Lösungen über einen längeren Zeitraum eingesetzt haben, damit respektive viel Erfahrungen gesammelt haben – und eine hohe Nutzerzufriedenheit aufweisen. Damit meine ich Unternehmen, die sowohl Daten auf Filesystemen als auch Daten in bestehenden DB-Systemen indizieren und einen einheitlichen Zugriff ermöglichen. Interessanterweise gibt es dazu keine (wissenschafltiche) Studien – und auch keine praxisnahen.
    Viele Grüße aus Graz
    Alexander Stocker

    • Andreas Gruber sagt:

      Hallo Alexander,

      ja, da gibt es wenige Studien dazu, es scheint eher viel Unzufriedenheit bei den Unternehmen mit Enterprise Search zu geben – siehe etwa diese Umfrage zu Enterprise Search und Findability.

  2. Danke für das Feedback – ich habe Ähnliches auf der Tonspur gehört. Wissenschaftliche Studien zur Anwenderzufriedenheit kenne ich keine.

    Grundsätzlich habe ich den Eindruck, dass die Anwender hohe Erwartungen (Google im Unternehmen) haben, aber Unternehmen eben nicht gleich Web ist – und Suche daher anders funktionieren muss.

Hinterlasse eine Antwort

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind markiert *

*

Du kannst folgende HTML-Tags benutzen: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>