Information Retrieval

Information Retrieval

Apache SolrApache Solr erfreut sich einer immer größeren Beliebtheit, wenn es um den Aufbau von Suche-Indizes geht. Ein Vorteil von Solr ist, dass es sehr gut skaliert und sich auf verschiedene Weisen konfigurieren lässt. Um die optimale Konfiguration für Apache Solr zu finden, ist jedoch die Messung der Systemperformance unerlässlich. Dazu gibt es ein einfach zu bedienendes Tool, das sowohl die Query- als auch die Indexierungsleistung messen und darstellen kann.

Zwei Dinge sind bei jedem Sucheprodukt entscheidend, wenn es um die Performance geht: Die benötigte Zeit für Abfragen (Queries) und für die Aufnahme neuer Dokumente (Indexierung). Je nachdem, wie groß die Zahl des Indexes ist, wie viele Dokumente neu hinzukommen und nach welcher Zeit diese Dokumente verfügbar und abrufbar sein sollen, muss eine entsprechende Konfiguration der Komponenten gewählt werden.

Eines der am weitesten verbreiteten Produkte für den Aufbau von Sucheportalen und Suchmaschinen ist Apache Solr, das auf den Bibliotheken von Apache Lucene basiert. Der Vorteil von Solr, der zugleich auch Nachteil ist: Es gibt unzählige Möglichkeiten, das System zu kongfigurieren. Das beginnt bei der Konfiguration des Speichers für die Virtual Machine (JVM) und der Wahl der richtigen Garbage-Collection-Strategie, führt über das Setzen der richtigen Cache-Größe und der passenden Cache-Erneuerungs-Stratgie über Filter etc.

 

Solrmeter einfach einrichten

Gut, wenn man in der Lage ist, die Auswirkungen verschiedener Konfigurationen schnell zu testen und die Ergebnisse vergleichen zu können. Viele Tools gibt es dazu noch nicht, doch eines ist sehr empfehlenswert: solrmeter. Dabei handelt es sich um eine Java-Anwendung, die Requests gegen eine definierte Solr-Instanz schickt und die Ergebnisse in Form von verschiedenen Reports, Grafiken und Diagrammen ausliefert. Getestet werden können sowohl Queries (Suchanfragen), Updates (Indexierung) als auch Optimizes. Letztere werden dann ausgeführt, wenn die Zahl der Index-Segmente zu groß geworden ist, so dass eine Zusammenführung zu größeren Blöcken notwendig wird.

Das Einrichten von solrmeter ist sehr einfach: Entweder verwendet man das .jar-File oder man kompiliert sich selbst eine lauffähige Datei. Sowohl das .jar als auch der Quellcode sind hier verfügbar. Das .jar kann dann einfach durch den Aufruf java -jar solrmeter-0.3.0.jar gestartet werden. Parameter sind keine nötig. Solrmeter lässt sich übrigens sowohl mit Solr-Cloud-Installationen als auch mit Master-Slave-Systemen nutzen. Im Test wurde solrmeter mit einer Solr 4.10-Installation angewandt.

Nach dem Aufruf von solrmeter wird der Startbildschirm angezeigt. Im oberen Bereich sieht man die vier Hauptbereiche "Query Console" "Update Console", "Commit Console" und "Optimize Console", die für die einzelnen Requests an Solr stehen. Noch allerdings sind die Tests nicht ausführbar, denn vorher muss noch die zu testende Solr-Instanz eingetragen werden. Das kann im Menü unter "Edit/Settings" getan werden. Dort kann man auch die für die Queries zu verwendenden Dateien festlegen. In diesen Dateien stehen die Abfragen, die von solrmeter an Solr geschickt werden sollen. Der Nutzer hat die Wahl, ob er den Query-Mode "Standard" oder "Ecternal" wählen möchte.Solrmeter: Einstellungen

Je nach verwendetem Query-Request-Handler können die Queries in einem unterschiedlichen Format angegeben werden. Für den LuceneQueryParser würde das zum Beispiel so aussehen:
text:(ipod OR ipad) AND cat:technology
text:(lucene) AND cat:books AND title:(action)
text:display AND cat:technology

Für den DismaxQueryParser würde dieses Format passen:
ipod ipad
lucene in action
display
technology

Sobald die nötigen Daten eingetragen sind, kann der Test gestartet werden. Hierbei kann noch gewählt werden, wieviele Requests solrmeter pro Minute an die Solr-Instanz schicken soll. Sobald der Test läuft, werden auch schon die ersten Ergebnisse angezeigt. Dabei hat man die Wahl zwischen verschiedenen Diagrammarten und Listendarstellungen. Auch eine Logausgabe ist möglich, um mögliche Fehler erkennen und beurteilen zu können.Solrmeter: Testergebnisse

In den verschiedenen Ansichten erkennt man vor allem, welche Requests wie lange gedauert haben und wie die Verteilung der Dauer auf die Zahl der Requests aussieht.

In ähnlicher Weise lässt sich auch die Performance beim Update des Indexes messen. Auch hier muss eine Quelldatei mit den entsprechenden Requests definiert werden. Zudem kann man bestimmen, nach wie vielen Updates ein Commit stattfinden soll. Da bei einem Hard Commit die Daten auf die Platte geschrieben werden, führen häufigere Commits zu einer insgesamt längeren Verarbeitungszeit.


Fazit

Insgesamt ist solrmeter ein einfach zu bedienendes Tool, mit dem man schnell die Leistungsfähigkeit einer Solr-Installation messen kann. Das ist vor allem dann hilfreich, wenn es darum geht, Optimierungspotentiale aufzudecken und mit verschiedenen Konfigurationen zu experimentieren.

 

Verwandte Beiträge

Die Open Source-Sucheplattform Apache Solr wurde gerade in der Version 5.3.2 veröffentlicht. Neben elf Bugfixes enthält die Version auch eine neue Funktion.

Das Lucene Project Management Committee (PMC) hat die Veröffentlichung von Apache Lucene 5.4.1 bekannt gegeben. Die aktuelle Version der komplett in Java geschriebenen Suchmaschinenbibliothek...

 Das Job-Netzwerk LinkedIn hat seine neue Suche vorgestellt. Diese ermöglicht ein besseres Ranking, schnellere Updates und bessere Möglichkeiten der Interpretation von Suchanfragen.

Anzeige

rnkeffect

Premium-Partner (Anzeige)


Anzeigen InternetX

SEO Agentur aus Darmstadt

Better sell online

Online Solutions Group

Onsite-Optimierung

Onsite-Optimierung

 

Sprecher auf

SEO- und Suchmaschinenblogs

SEO-FAQ

Bild © FM2 - Fotolia.com

SEO selber machen

SEO selber machen

Bekannt aus

Website Boosting


Internet World Business

SEO United


The SEM Post


Webselling

Jetzt vernetzen

SEO-Glossar

SEO-Glossar

 

SEO im Ohr, der Podcast von SEO Südwest: aktuell Folge

SEO-Beratung

Wir bringen gemeinsam Ihre Webseite in Google nach vorne. Profitieren Sie von jahrelanger SEO-Erfahrung.

Social Networks und RSS-Feed

Auszeichnungen

seo19 sieger sichtbarkeit 2020 200x200px