Digitale Ausgaben ihrer Veröffentlichungen sind bei Verlagen fast schon Standard. Diese Einschätzung bestätigt die Gesamtauswertung der im August und September gelaufenen buchreport-Umfrage zum Thema „Suche in Fachportalen“ unter etwa 100 Entscheidern und Mitarbeitern aus deutschsprachigen Fachverlagen. Was die Umfrage aber zeigt: Ob Kunden bei einer Online-Suche auf das für sie „wirklich Interessante“ treffen, ist keineswegs gesichert.
Am mangelnden Angebot liegt es nicht: Mehr als drei Viertel der Verlage bieten einen großen bzw. wesentlichen Teil ihrer Veröffentlichungen auch digital an – zum Teil sogar über eigene Portale. Nur noch 6 % der Fachverlage verfolgen keine Online-Pläne. Doch kommt dieses Angebot auch beim Kunden an? Findet der Kunde genau das, die Information, das Buch, die Zeitschrift, den Artikel wonach er sucht? Hier offenbart die Umfrage noch großen Handlungsbedarf. Denn der schnelle und effektive Zugriff auf die Inhalte ist die Voraussetzung dafür, dass der Kunde bereit ist, für den Online-Content auch zu bezahlen.
Systematische Titelauswahl reicht nicht
Ausgangpunkt der Umfrage war zunächst die Frage, welche Auswahlmöglichkeiten vor dem Kauf digitaler Inhalte zur Verfügung stehen. Hier bieten 16 % der Verlage eine Suche oder Schnellsuche auf Basis der bibliographischen Angaben an. Bei 42 % der Verlage erfasst der Suchalgorithmus auch die Inhalte, also Artikel, Buchbeiträge und Abbildungs-Titel. Das kann natürlich die Zahl der Treffer explodieren lassen.
Wichtig ist deshalb, wichtige Schlüsselwörter herauszuheben und nicht nur formale Auszeichnungen zu berücksichtigen – denn nicht jede Überschrift in einem Fachbuch ist wirklich relevant. Immerhin 25 % der Verlage wissen das und reichern ihre Titel zusätzlich mit repräsentativen Schlagwörtern aus einer festgelegten Terminologie an.
Auf dem Weg zur perfekten Suche
Was die Technik angeht, bieten zwei Drittel der teilnehmenden Verlage ihren Kunden eine sogenannte Volltextsuche an, mit der sich die Suche eben über die kompletten Dokumenten-Texte erstreckt. Fast die Hälfte der teilnehmenden Verlage verwendet dafür klassische Such-Engines wie SolR und Lucene, die aber häufig individuell erweitert werden.
Diese Zahl relativiert sich allerdings, wenn man bedenkt, dass die Volltextsuche im Endeffekt keinen ausreichenden Kundennutzen bietet. Eine Volltextsuche differenziert zum Beispiel nicht zwischen Textstellen, an denen der gesuchte Begriff wirklich erklärt wird – und Textstellen, an denen der Begriff lediglich erwähnt wird. Da letzteres viel häufiger vorkommt, aber diese Textstellen vom Kunden nur selten verlangt werden, muss sich der Kunde durch lange unsortierte Trefferlisten quälen, bis er zu den für ihn relevanten Textstellen gelangt. Dazu ist der Kunde in der Praxis nicht bereit. Damit wird für den Erfolg einer Suchanfrage auch entscheidend, wie das Suchsystem die Treffer gewichtet und in der Trefferliste darstellt. In diesem Zusammenhang spricht man vom Ranking der Ergebnisse.
Lösungsansätze für das Ranking-Problem
Folgt man den Aussagen der Umfrage, so gibt es keinen schnellen und einfachen Weg, das Ranking-Problem in den Griff zu bekommen: Unter den Umfrageteilnehmern, die diese Frage beantwortet haben, favorisieren 33 % die intensivere Anreicherung der Inhalte mit Metadaten und Schlagwörtern, 31 % wollen ihren Such-Algorithmus verbessern und 12 % in den Aufbau eines besseren Thesaurus bzw. Fachwortschatzes investieren.
Den meisten Nutzen versprechen sich die Verlage also von der Schlagwort-Anreicherung der Inhalte. Dahinter stehen ganz unterschiedliche Wege, die Inhalte mit relevanten Schlagwörtern anzureichern: Aus der Umfrage ergibt sich, dass 34 % der Verlage die Schlagwortauswahl individuell festlegen und der Redaktion überlassen. 25 % legen Wert auf den Bezug auf eine festgelegte Fachterminologie und 17 % greifen auf die Schlagwörter aus dem Buch- oder Zeitschriftenregister zurück.
Aber wie soll die Schlagwort-Anreicherung praktisch erfolgen? Bei den Antworten zeigt sich, dass 22 % hier einer Software-Vollautomatik vertrauen, 24 % lassen eine Software Vorschläge erarbeiten, die aber durch die Redaktion überprüft werden und 43 % setzen auf reine Handarbeit in der Reaktion.
Was muss in Zukunft geschehen?
Das Ergebnis lässt sich weiter interpretieren: Verlage denken derzeit nach wie vor werkbezogen, und sie managen eher übersichtliche Content-Angebote. In diesem Kontext ist die individuelle Schlagwortzuweisung ausreichend, um Suche und Ranking zu optimieren, – und der Aufwand für deren „händische“ Durchführung vertretbar. Geht man aber davon aus, dass die Content-Angebote rasch wachsen werden, und der Kunde immer öfter aus tausenden Dokumenten das Richtige finden muss, kann eine manuelle Verschlagwortung nicht der einzige Weg sein: Zum einen wegen der auf lange Sicht zu hohen Kosten, zum anderen, weil das Ranking dann, folgt man den Experten, immer schlechter wird. Genau das bestätigt auch die Umfrage: 54 % der antwortenden Verlage sehen die größte Schwachstelle ihrer Suche in zu langen Trefferlisten, „bei denen der Kunde das wirklich Interessante übersieht, weil es erst unten in der Liste auftaucht“.
Natürlich erkennen die Verlage auch andere Schwachstellen in ihrer Suche, wenn selbst minimale Rechtschreibfehler nicht toleriert (45 %) und Synonyme (33 %) oder Abkürzungen nicht erkannt werden (18 %). Zumindest die zwei letzteren Probleme sind, folgt man den Fachleuten, ebenfalls auf der Basis einer strukturierten Terminologie des publizierten Wissensgebietes zu lösen. Dort lassen sich zu jedem Fachbegriff die Synonyme und Abkürzungen hinterlegen, so dass der Suchalgorithmus hierauf zugreifen kann. Das Thema Fehlertoleranz ist dagegen nur mit einigem anderen Aufwand in den Griff zu bekommen: Hier müssen häufige Rechtschreibfehler erkannt werden, zum Beispiel phonetische Fehler wie „Psychatrie“ statt „Psychiatrie“ oder „Standart“ statt „Standard“. Ebenso müssen Wortbeugungen (Traum, Träume, Geträumtes, träumen, geträumt) ausgeglichen werden.
Hilfreich und machbar: die Facettierung
Eine sehr wertvolle Funktion allerdings kann dem Kunden mit vergleichsweise wenig Mehr-Aufwand ebenfalls über einen Thesaurus zur Verfügung gestellt werden: die Filterung auch von größeren Trefferlisten anhand von systematischen Kriterien. Dazu gehören der Medientyp, das Publikationsjahr, Name des Autors oder die Zugehörigkeit des Dokuments zu einer bestimmten Zeitschrift, aber auch beliebig andere inhaltliche Kriterien. Vom Nutzen der Facettierung, wie die Filterfunktion auch genannt wird, sind 45 % der antwortenden Verlage überzeugt und bieten sie bereits an, 12 % planen dies, 33 % dagegen nicht. Egal, nach welchen Kriterien man dem Kunden Filtermöglichkeiten anbieten will: Die entsprechenden Kategorien müssen zuverlässig in den Metadaten der Dokumente hinterlegt werden.
Es gibt viel zu tun
Angesichts der Fülle von Möglichkeiten, aber auch Herausforderungen für die Verlage wundert es nicht, dass die Wunschliste der Umfrageteilnehmer für eine bessere Suche in ihren Verlagsportalen lang ist: Die bessere Anreichung der Dokumente mit Metadaten und Schlagwörtern sehen 33 % als vordringlich an, einen besseren Suchalgorithmus halten 30 % für notwendig, und den Aufbau eines Thesaurus wünschen sich 12 %.
Grafik: Dennis Skley / flickr Lizenz: CC BY-ND 2.0
Kommentar hinterlassen zu "Suchen und Finden bleiben die Schwachstellen"