Home Die Digitalisierung der Pressedokumentation beim Deutschen Bundestag – Ein problemorientierter Rückblick (Teil 2)
Article Publicly Available

Die Digitalisierung der Pressedokumentation beim Deutschen Bundestag – Ein problemorientierter Rückblick (Teil 2)

  • Klaus Sator

    Dr. Klaus Sator, Politologe, Historiker und Wissenschaftlicher Dokumentar, war zwischen 1996 bis zum altersbedingten Renteneintritt Ende 2021 in unterschiedlichen Bereichen der Verwaltung beim Deutschen Bundestag beschäftigt. Neben seiner Tätigkeit als Lektor in der Pressedokumentation auch im Referat Datenbanken, Programmentwicklung, im Sach- und Sprechregister, in der Parlamentsdokumentation und im Wissenschaftlichen Dienst.

Published/Copyright: May 9, 2023

Zusammenfassung

In der Pressedokumentation beim Deutschen Bundestag wurde im Zusammenhang mit dem Umzug des deutschen Parlaments von Bonn nach Berlin im Jahr 1999 ein elektronisches Produktions-, Recherche- und Archivsystem eingeführt. In einem problemorientierten Rückblick werden die damit verbundenen Veränderungen in Beziehung gesetzt zu den an seine Einführung geknüpften Zielen und Erwartungen. In diesem zweiten Teil geht es um die Auswirkungen auf die Praxis der inhaltlichen Erschließung von Zeitungsartikeln und die damit verbundenen Recherchemöglichkeiten. Dabei werden Probleme bei der Verwendung des Pressethesaurus erörtert.

Abstract

In connection with the relocation of the German Parliament from Bonn to Berlin in 1999, an electronic production, research and archiving system was introduced in the press documentation at the German Bundestag. In a problem-oriented retrospective, the changes associated with this are set in relation to the goals and expectations attached to its introduction. This second part deals with the effects on the practice of indexing newspaper articles and the resulting search options. Problems with the use of the press thesaurus are discussed.

Résumé

Dans le cadre du déménagement du Parlement (Bundestag) allemand de Bonn à Berlin en 1999, un système électronique de production, de recherche et d’archivage a été introduit dans la documentation de presse du Bundestag allemand. Dans une rétrospective orientée vers les problèmes, les changements liés à ce système sont mis en relation avec les objectifs et les attentes liés à son introduction. Cette deuxième partie traite des effets sur la pratique de l’indexation du contenu des articles de journaux et des options de recherche associées. Les problèmes liés à l’utilisation du thésaurus de la presse sont discutés.

Nachdem im ersten Teil dieses Rückblicks die organisatorisch-technischen Veränderungen und Folgen der Einführung eines elektronischen Pressearchivs in der Pressedokumentation beim Deutschen Bundestag im Mittelpunkt standen, geht es im zweiten Teil um ihre Auswirkungen auf die inhaltliche Erschließung von Zeitungsartikeln und die damit verbundenen Recherchemöglichkeiten.

Mit der Beibehaltung einer intellektuellen inhaltlichen Erschließung zusätzlich zur bestehenden Möglichkeit der Volltextrecherche wurde eine Qualitätsverbesserung der Rechercheergebnisse angestrebt. Pressetexte sind durch eine ausgesprochen vielgestaltige Sprache gekennzeichnet. Sie sind stark vom Zeitgeist geprägt, weisen zahlreiche Wortneuschöpfungen auf und sind durch sprachliche Unschärfen und Ungenauigkeiten charakterisiert. Für identische Sachverhalte finden sich unterschiedliche Bezeichnungen. Reine Volltextrecherchen führen nicht selten zu einer großen, gleichzeitig jedoch unvollständigen Treffermenge. Gemessen am Informationsbedürfnis liefern sie häufig Artikel von geringer Relevanz, während sie Artikel von größerer Relevanz vorenthalten.

Angesichts einer ständig wachsenden Menge von Informationen zu einem Thema in einer Vielfalt von Medien wird es immer wichtiger, sich mit möglichst geringem Aufwand möglichst schnell mit nur wenigen Texten möglichst umfassend über ein Thema, seine unterschiedlichen Aspekte sowie die hierzu bestehenden kontroversen Positionen informieren zu können.

Durch die zusätzliche inhaltliche Erschließung der im elektronischen Pressearchiv vorhandenen Presseartikel mit dem kontrollierten Vokabular einer nutzerorientierten Dokumentationssprache wird sichergestellt, dass ein inhaltlich relevanter Artikel auch dann gefunden wird, wenn er den als Suchbegriff eingegebenen Wortlaut nicht enthält.

Der zur Minimierung seines Vokabulars im Bereich der Sachbegriffe ursprünglich an dem Prinzip der Postkoordination ausgerichtete Thesaurus ermöglicht bei der Suche sowohl einen allgemeinen Einstieg ins Thema als auch das Auffinden von Treffern zu einzelnen Aspekten. Sein Wortgut sollte eine Eingrenzung der Trefferquote unter formalen und inhaltlichen Gesichtspunkten ermöglichen. Daraus folgten bestimmte Anforderungen an die Art des aufzunehmenden Wortguts wie auch seiner Verwendung bei der inhaltlichen Erschließung.

Der Aufbau des Pressethesaurus fand vor dem Hintergrund der beim Deutschen Bundestag bestehenden Bestrebungen zur Schaffung eines einheitlichen Bundestagsinformationssystems statt, das eine bestandsübergreifende Recherche in der Bundestagsbibliothek, Parlamentsdokumentation und Pressedokumentation ermöglichen sollte. Die bis dahin in der Bibliothek und in der Parlamentsdokumentation verwendeten Thesauri wurden überarbeitet mit dem Ziel, eine stärker an den Interessen ihrer mit dem Aufkommen des Internets zunehmend eigenständig recherchierenden Nutzerschaft ausgerichteten Dokumentationssprache zu schaffen.

Diese angestrebte Nutzerorientierung hat den Aufbau des Pressethesaurus maßgeblich geprägt. Denn wie der damals für die Pflege des Parlamentsthesaurus PARTHES zuständige Mitarbeiter beim Deutschen Bundestag, Heinz Alkämper, in seiner kritischen Auseinandersetzung mit dem PARTHES Wortgut auf dem Deutschen Dokumentartag 1998 ausgeführt hatte[1], muss bei einer Volltextdatenbank eine zusätzliche inhaltliche Texterschließung durch Indexierung mittels des kontrollierten Wortguts eines Thesaurus ihre Existenzberechtigung dadurch beweisen, dass sie eine sinnvolle Alternative bietet, um qualitativ bessere Rechercheergebnisse zu erzielen. Hierzu zählen insbesondere die Relevanz und die Menge der zu erzielenden Treffer im Hinblick auf den Informationsbedarf. Das für die Indexierung zu verwendende Wortgut sollte allgemeinverständlich und selbsterklärend sein und sich vorrangig am allgemeinen Sprachgebrauch und dem Verständnis einer durchschnittlich gebildeten Person orientieren. Es sollte, wie der Informationswissenschaftler Rolf G. Henzler in seinem nach wie vor grundlegenden Lehrbuch zur inhaltlichen Erschließung von in Datenbanken abgelegten Dokumenten fordert, leicht zu erraten sein.[2]

Das Wortgut des vor diesem Hintergrund entstandenen Pressethesaurus PRESTHES gliedert sich in Sachbegriffe, Personen, Körperschaften und Geographika. Die Sachbegriffe umfassten ursprünglich rund 1500 Deskriptoren, darunter auch Allgemeinbegriffe. Der Pressethesaurus wird – in den entsprechenden Bildschirmmasken – für die Indexierung von und zur Recherche nach Presseartikeln auf verschiedene Weise präsentiert: als alphabetische Liste der einzelnen Teilthesauri sowie als Klassifikation seines Wortguts zu unterschiedlichen Sachgebieten. Außerdem kann in einem gesonderten Datenfeld gezielt nach Artikelkategorien wie z. B. „Interview“, „Kommentar“ oder „Überblicksdarstellung“ selektiert werden. Zwischenzeitlich hat der Pressethesaurus eine grundlegende Revision erfahren und über die Jahre hinweg eine Ergänzung seines Wortguts.

Organisatorisch sind die Indexierung von Presseartikeln und deren Bereitstellung in der Pressedokumentation getrennt. Zuständig für ihre inhaltliche Erschließung ist das Lektorat und für ihre Bereitstellung die Auskunft. Eine Kommunikation zwischen beiden Bereichen wäre sinnvoll und hilfreich, ähnlich wie sie etwa in der Parlamentsdokumentation besteht, wo die mit der inhaltlichen Erschließung von Parlamentsmaterialien betrauten Mitarbeiterinnen und Mitarbeiter auch Auskunftsdienste verrichten.

Die Indexierung[3] der im Pressearchiv vorgehaltenen Presseartikel erfolgt durch den für das Sachgebiet zuständigen Lektor. Gegenüber der mehr klassifikatorische Züge aufweisenden Signierung von Pressematerialien zur Ablage im konventionellen Pressearchiv stellt die Indexierung mit dem kontrollierten Vokabular des Pressethesaurus erhöhte Anforderungen an die Erschließungstätigkeit. Sie ist wesentlich arbeits- und zeitintensiver.

Das Artikelaufkommen zu den einzelnen Sachgebieten ist großen Schwankungen unterworfen und die Indexierung einzelner Zeitungsartikel kann unterschiedlich viel Zeit beanspruchen. Sie findet in einem Spannungsverhältnis zwischen der Qualität der inhaltlichen Erschließung und der Quantität der zu bearbeitenden Presseartikel statt. Unabhängig von ihrer inhaltlichen Relevanz und Halbwertszeit werden alle in das elektronische Pressearchiv einlaufenden Artikel indexiert. Die bereits im konventionellen Pressearchiv praktizierte geringere Erschließungstiefe der das Ausland betreffenden Artikel wurde auch für das elektronische Pressearchiv beibehalten. Zu diesem Zweck ist die Teilmenge der hier für die Indexierung zu verwendenden Deskriptoren mit einem in Klammern gesetzten (A) versehen. Vor dem Hintergrund der zeitweise auch im Lektorat eingetretenen Rückstände hat sich eine mehr mechanische Form der Indexierung durchgesetzt. Dabei werden die unterschiedlichen inhaltlichen Aspekte eines Themas in verschiedenen Zeitungsbeiträgen nicht immer in der Form berücksichtigt, wie dies bei der Einführung des elektronischen Pressearchivs angestrebt war.

Indexierungspraxis

Bei der Indexierung der Pressematerialien haben sich im Hinblick auf die angestrebte Endnutzerorientierung des elektronischen Pressearchivs einige Probleme ergeben. Prinzipiell entscheidet der Lektor über die Indexierung der in seinem Sachgebiet anfallenden Presseartikel selbst. Dadurch haben sich in manchen von der Sache her ähnlich gelagerten Fällen unter den Lektoren unterschiedliche Indexierungspraktiken herausgebildet. So werden z. B. Beiträge zum Lehrermangel durch die Kombination der Deskriptoren „Lehrer“ und „Arbeitsmarkt“ erschlossen, solche zum Ärztemangel aber mehrheitlich durch die Kombination von „Arzt“ und „Gesundheitswesen“. Gleiches gilt z. B. für Artikel zur Bedeutung von Masken, die je nach Lektor und Kontext mal durch die Kombination der Deskriptoren „Infektionskrankheit“ mit „Hygiene“ oder „Arbeitsschutz“ oder auch mit beiden Deskriptoren erschlossen werden. Im Hinblick auf die damit verbundenen unterschiedlichen Rechercheergebnisse wirkt diese Indexierungspraxis teilweise willkürlich. Für den Nutzer ist sie in vielen Fällen nicht nachvollziehbar.

Klassierende Indexierung

Kennzeichnend für das konventionelle Pressearchiv war eine klassierende Ablage der Pressematerialien nach einer alphanumerischen Ordnungssystematik, die nur eine sehr grobe inhaltliche Erschließung ermöglicht hat. Der Pressethesaurus enthält sowohl weitere wie auch engere Begriffe zu einem Sachgebiet. Das erlaubt eine differenziertere und genauere Vergabe von Deskriptoren. Die bisherige Indexierungspraxis zeigt, dass bei manchen Artikeln neben dem spezifischeren Deskriptor zusätzlich noch allgemeinere Deskriptoren vergeben werden. Damit wird jedoch die Praxis aus dem Altarchiv im elektronischen Pressearchiv fortführt. Besonders häufig findet sich diese Art der Indexierung bei Rechtsthemen. Insbesondere wenn es um Gerichtsverfahren und Gerichtsentscheidungen geht, werden die Rechtsgebiete mit indexiert, z. B. bei konkreten arbeitsrechtlichen oder strafrechtlichen Verfahren zusätzlich die Deskriptoren „Arbeitsrecht“ oder „Strafrecht“ zugeteilt. Für die Recherche nach Artikeln, die sich ganz allgemein mit einem bestimmten Rechtsgebiet beschäftigen, wird so eine große Menge an Informationsballast produziert. Für eine einzelne Gerichtsentscheidung ist eine solche Indexierung nur in Ausnahmefällen sinnvoll, z. B. wenn diese einen Paradigmenwechsel in dem entsprechenden Rechtsgebiet darstellen. Die Zuteilung von innerhalb der Hierarchie des Pressethesaurus hoch angesiedelten Deskriptoren sollte sparsam und möglichst nur da erfolgen, wo dieser weite Begriff selbst zentraler Gegenstand eines Artikels ist, es also z. B. um „Wirtschaftsrecht“ oder „Bildung“ an sich geht.

Verwendung eingrenzender Deskriptoren

Neben der Indexierung mit zu allgemeinen Deskriptoren finden auch Eingrenzungen von Begriffsinhalten bzw. die Vermeidung der Verwendung einzelner Deskriptoren statt. Ein Beispiel hierfür ist der ursprünglich als Allgemeinbegriff in den Pressethesaurus aufgenommene Deskriptor „Pressekonferenz“. Als Mittel der Öffentlichkeitsarbeit von Politikern und Parteien sowie staatlichen und nichtstaatlichen Institutionen dienen Pressekonferenzen der Information der Medien und der Öffentlichkeit. Dem Deskriptor kommt ein ähnlicher Stellenwert zu, wie den im Pressethesaurus vorhandenen Allgemeinbegriffen „Regierungserklärung“, „Rede“, „Aufsatz“, „Interview“ „Gerichtsentscheidung“, „Forschungsergebnis“ oder „Überblicksdarstellung“. In den Medien wird meist ausführlich über die Inhalte von Pressekonferenzen berichtet, ohne allerdings immer explizit zu erwähnen, dass die entsprechenden Informationen aus einer Pressekonferenz stammen. Da der Begriff häufig nicht in den Zeitungsartikeln auftaucht, wird er bei der Indexierung kaum vergeben. Für den Leser sind die auf Pressekonferenzen verkündeten Informationen jedoch häufig von herausragender Bedeutung. Aus Nutzersicht wäre eine entsprechende Verschlagwortung besonders wünschenswert und hilfreich. An diesem Beispiel lässt sich auch sehr gut die eingangs aufgeworfene Frage nach den Vorteilen einer intellektuellen Texterschließung gegenüber der reinen Volltextrecherche belegen. Ähnliches gilt auch für die ausgesprochen zurückhaltende Verwendung des Deskriptors „Krieg“. Dieses Beispiel zeigt, wie mit dem Wechsel des Stelleninhabers für ein Sachgebiet ein Rückgang der Indexierung mit einem Deskriptor verbunden sein kann. In beiden Fällen liefert eine Volltextrecherche mit diesen Suchwörtern trotz des damit einhergehenden Informationsballasts bessere Suchergebnisse als die Recherche mittels entsprechender Deskriptoren.

Dies kann zur Folge haben, dass der mit den ihm angebotenen Deskriptoren recherchierende Endnutzer nur wenige Artikel findet und er dann von dem mittels eines Thesaurus erzielten Rechercheergebnis enttäuscht ist. Woher soll er wissen, dass Deskriptoren wie „Pressekonferenz“ oder „Krieg“ zur Indexierung einschlägiger Artikel kaum verwendet werden? Verwendet ein Nutzer einen im Thesaurus vorhandenen Deskriptor als Suchwort muss er erwarten können, die dazu im elektronischen Pressearchivs vorhandenen Artikel auch als Treffer präsentiert zu bekommen.

Indexierungsinkonsistenzen

Ein Ergebnis der im Vorfeld der Einführung des elektronischen Pressearchivs durchgeführten Bestandsaufnahme zur Signierpraxis im konventionellen Pressearchiv war die stark ausgeprägte Abhängigkeit des Indexierungsergebnisses von der indexierenden Person und die damit einhergehenden Inkonsistenzen bei der Ablage von Presseartikeln.[4] Dieses Problem besteht im elektronischen Pressearchiv fort.

Ein Beispiel für den Bruch in der Indexierungspraxis ist die Zuteilung von Deskriptoren für die Beiträge zur Vertreibung und Ermordung der Armenier aus dem Osmanischen Reich bzw. der Türkei im Ersten Weltkrieg. Während Presseartikel hierzu im Jahr 2001 mit den Geographika „Türkei“, „Armenien“ und „Völkermord“ deskribiert worden sind, verschwindet der Begriff „Armenien“ und damit der Armenienbezug bei der Indexierung entsprechender Artikel aus den Jahren 2005 und 2015/16. Auch wenn der Pressethesaurus im Gegensatz zum Parlamentsthesaurus und zur Bundestagsbibliothek den Deskriptor „Armenier“ nicht enthält, wäre zumindest eine Zuteilung des auf den Deskriptor „Minderheit“ verweisenden Synonyms „Nationale Minderheit“ sinnvoll, sowohl im Hinblick auf die Berücksichtigung des Subjekts eines Völkermords als auch auf das Selbstverständnis der Pressedokumentation, Vorgangsdokumentation zu betreiben. Hat doch der Völkermord an den Armeniern den Deutschen Bundestag seit dem Bestehen des elektronischen Pressearchivs bereits in drei Legislaturperioden beschäftigt.

Schnittmengen von Deskriptoren

Zwischen manchen der im Pressethesaurus vorhandenen Deskriptoren bestehen inhaltliche Überschneidungen. Das gilt z. B. für die Begriffe „Fremdenfeindlichkeit“ und „Rassismus“ oder „Hilfsorganisation“ und „Nichtregierungsorganisation“. Um möglichst wenige Deskriptoren bei der Indexierung zu vergeben, wurde deshalb festgelegt, wann welche Deskriptoren zu verwenden sind. In Zusammenhang mit der Flüchtlingsbewegung Mitte der 2010er Jahre wurde mehrheitlich die Auffassung vertreten, dass es sich bei der in der Presse thematisierten ablehnenden Haltung gegenüber Flüchtlingen in Teilen der Bevölkerung nicht um Rassismus handele, sondern um Fremdenfeindlichkeit. Denjenigen Zeitungen bzw. Journalisten, die in diesem Kontext über Rassismus schrieben, wurde ein falscher bzw. nur in bestimmten politischen Milieus üblicher Sprachgebrauch unterstellt. Das änderte sich jedoch im Zusammenhang mit den strafrechtlichen Ermittlungen zu Morden an Flüchtlingen und Migranten, wo bei der Indexierung der Deskriptor „Rassismus“ favorisiert wurde. In Abhängigkeit von den konkreten Ausführungen der jeweiligen Artikel und im Hinblick auf das nicht vorhersehbare Informationsbedürfnis bei der Recherche finden sich zahlreiche Artikel, bei denen von der Sache her eine Zuteilung beider Deskriptoren sinnvoll wäre. Ein ähnlich gelagertes Problem besteht auch bei der Indexierung von Artikeln, in denen es um die Rettung von Flüchtlingen aus dem Mittelmeer geht. Hierfür sollte nur der Deskriptor „Hilfsorganisation“ verwendet werden und nicht der Deskriptor „Nichtregierungsorganisation“, selbst bei denjenigen Artikeln, in denen es gerade um deren Rolle dabei geht.

Meinungsbildende Indexierung

Trotz des Anspruchs, bei der Indexierung von Pressematerialien möglichst neutral und objektiv zu sein, kommt man nicht immer umhin, bestimmte Begriffe für die Deskribierung etwas weiter zu fassen. Das gilt zum Beispiel für Deskriptoren wie „Linksextremismus“, „Rechtsextremismus“, „Islamismus“ oder „Korruption“. Dabei handelt es sich ohnehin um Begriffe, die nicht eindeutig definiert sind, deren Begriffsinhalte Wandlungen erfahren haben und die schon immer auch politisch instrumentalisiert werden. Maßgeblich für die Vergabe solcher Deskriptoren sollte sein, ob sie für die Befriedigung des Informationsbedürfnisses des Nutzers in dem entsprechenden Kontext sinnvoll und nützlich sind bzw. sein könnten.

Problematisch wird dies allerdings, wenn die meinungsbildende Zielsetzung eines einzelnen Verlagshauses zur prinzipiellen Indexierung eines Themas benutzt wird. Ein Beispiel hierfür ist die Verwendung des Begriffs „Antisemitismus“ für Zeitungsartikel, die über die Entscheidung des Europäischen Gerichtshofes zur Lebensmittelkennzeichnung der aus den von Israel besetzten Palästinensergebieten stammenden Agrarerzeugnisse vom November 2019 berichteten, und zwar auch für solche, in denen dieser Aspekt gar nicht thematisiert wird. Im Hinblick auf die Maßnahmen der EU zum Verbraucherschutz fehlt hier dagegen eine im Sinne der Vorgangsdokumentation sinnvolle und zu anderen Zeiten benutzte Indexierung mit den Deskriptoren „Verbraucherschutz“ und „Lebensmittelkennzeichnung“.

Indexierung von Artikeln zum Ausland im Kontext deutscher Politik

In den letzten Jahren haben zahlreiche Zeitungen bei kontrovers diskutierten innenpolitischen Themen zunehmend auch Beiträge veröffentlicht, die darüber informieren, wie hierzu die Regierungspolitik anderer Länder aussieht. Beispiele dafür sind die Berichte zu den unterschiedlichen Möglichkeiten der Einführung und Ausgestaltung eines Grundeinkommens oder dem Umgang mit Covid-19. Hier stellt sich die Frage, ob man solche Artikel nach den für Deutschland oder für das Ausland geltenden Regeln deskribieren soll. Aufgrund der Rückbindung dieser Beiträge an die innerdeutsche Diskussion sowie im Hinblick auf die Indexierungskonsistenz und einer Orientierung am möglichen Informationsbedarf des Nutzers wäre in solchen Fällen beides sinnvoll.

Thesauruspflege

Die Fortschreibung und Pflege des Pressethesaurus sowie die Vereinbarung von Indexierungsregeln zur Verwendung seines Wortguts obliegt den Mitarbeiterinnen und Mitarbeitern im Lektorat. Die Auskunft ist daran nicht beteiligt. Vorschläge zur Neuaufnahme, Änderung und Verwendung von Deskriptoren werden in die tägliche Lektorenrunde eingebracht, dort erörtert und entschieden. Änderungswünsche erfolgen vor allem bei personellen Veränderungen im Ergebnis von Wahlen, bei der Neubesetzung zentraler politischer oder staatlicher Ämter sowie bei der Neueinrichtung oder Umorganisation staatlicher, zwischenstaatlicher und nichtstaatlicher Körperschaften. Während es bei Ergänzungen und Änderungen im Personenthesaurus oder im Körperschaftenthesaurus kaum zu Meinungsverschiedenheiten kommt, bestanden bei der Neuaufnahme und der Verwendung von Sachbegriffen gelegentlich größere Differenzen, die nicht immer zur Zufriedenheit aller gelöst werden konnten.

Obwohl es sich bei der Gruppe der Sachbegriffe innerhalb des Pressethesaurus um eine eher langlebige, relativ statische Zusammenstellung von für die inhaltliche Erschließung von Pressematerialien sinnvollem und nützlichem Wortgut handelt, sind auch hier gelegentlich Ergänzungen und Überarbeitungen erforderlich. Sie können sich aus dem Aufkommen eines völlig neuen Gegenstands ergeben oder aber einem Thema, das zwar schon über viele Jahre Gegenstand politischer Diskussionen ist, aber nicht so direkt und offensichtlich die Berichterstattung in den Medien dominiert.

Ein aktuelleres Beispiel für eine sinnvolle Aufnahme als eigenständiger Deskriptor wäre z. B. die Infektionskrankheit Covid-19. Die Presseartikel hierzu werden mit dem Deskriptor „Infektionskrankheit“ verschlagwortet, was sachlich nicht falsch ist. Bei dem riesigen Artikelaufkommen stellt sich jedoch die Frage, ob es hier zu einem bestimmten Zeitpunkt nicht sinnvoll gewesen wäre, für diese Infektionskrankheit einen spezifischen Deskriptor einzuführen wie es in der Parlamentsdokumentation und in der Bundestagsbibliothek mit der Aufnahme des Deskriptors „Covid-19“ geschehen ist, zumal es im Pressethesaurus bereits Deskriptoren für die Infektionskrankheit „AIDS“ oder für „Krebs“ gibt. Beides sind Krankheiten, die bereits viel länger existieren, zu denen bisher aber weit weniger Presseartikel angefallen sind. Weiterhin würde damit der Überfrachtung des allgemeinen Deskriptors „Infektionskrankheit“ mit einer spezifischen Infektionskrankheit und deren Abgrenzung zu anderen Infektionskrankheiten entgegengesteuert.

Beispiele für Begriffe, die zwar schon viele Jahre die politische Diskussion sowie die entsprechende Presseberichterstattung mitbestimmen und in den Thesauri von Parlamentsdokumentation und Bundestagsbibliothek schon lange als Deskriptoren enthalten sind, bisher aber nicht in den Pressethesaurus aufgenommen wurden, sind z. B. „Nachhaltigkeit“, „Nationalstaat“ oder „Europarecht“. Sie alle waren bereits Gegenstand von Erörterungen im Lektorat. Die Ablehnung der Aufnahme wurde z. B. im Falle von „Nachhaltigkeit“ damit begründet, dass dieser Begriff bisher nicht eindeutig definiert ist. Das ist sicherlich nicht falsch. Doch das gilt auch für viele andere Begriffe, die von Anfang an im Pressethesaurus enthalten sind, wie etwa die bereits erwähnten Deskriptoren „Linksextremismus“ oder „Rechtsextremismus“ oder die in den letzten Jahren neu aufgenommenen Deskriptoren „Islamismus“ oder „Künstliche Intelligenz“.

Eingrenzung der Verwendung von Thesaurusbegriffen

Beschäftigt man sich mit den Definitionen zu Sachbegriffen, wird man feststellen, dass die Ausführungen zum Begriffsinhalt in den verschiedenen Lexika nicht immer deckungsgleich sind, sie mal weiter oder enger gefasst sein können. Im Hinblick auf die wissenschaftliche Exaktheit mag dies problematisch erscheinen. Aus dokumentarischer Sicht kann das jedoch auch positiv gesehen werden. Denn auch das, was Nutzer bei der Suche nach Informationen zu einem Thema mit einem bestimmten Begriff verbinden, muss ja keineswegs deckungsgleich sein und kann variieren und von der Verwendung der Pressedokumentation abweichen.

Deshalb ist die bei manchen Deskriptoren anzutreffende Entwicklung und Praxis, ihre Verwendung bei der Indexierung einzugrenzen, problematisch. Dies gilt insbesondere für solche Deskriptoren, die ursprünglich mehr im Sinne von aspektorientierten Allgemeinbegriffen in den Thesaurus aufgenommen wurden.

In diesem Zusammenhang sind zwei unterschiedliche Arten von Begriffseingrenzungen zu erwähnen. Zum einen waren davon Deskriptoren betroffen, die eigentlich dazu geeignet wären, in einem auf dem Prinzip der Postkoordination aufgebauten Thesaurus, bei der inhaltlichen Erschließung eines Zeitungsartikels diese um bestimmte, dort thematisierte Aspekte zu ergänzen und damit eine allgemeine Treffermenge darauf eingrenzen zu können. Ein Beispiel hierfür ist der Begriff „Programmgestaltung“, der ursprünglich im Sinn eines aspektorientierten Allgemeinbegriffs Eingang in den Thesaurus gefunden hatte, dessen Verwendung dann aber auf den Bereich Rundfunk beschränkt und er hierzu mit einer in Klammer gesetzten Verwendungsbegrenzung „Programmgestaltung (Rundfunk)“ versehen wurde. Damit kann er nicht mehr für die Indexierung von Artikeln benutzt werden, bei denen die Programmgestaltung in anderen Zusammenhängen ein zentraler Gegenstand sein kann, z. B. zum Tag der Deutschen Einheit, Buchmessen oder Filmfestivals.

Weitere die Verwendung von Deskriptoren einschränkenden Zusammenhänge sind z. B. „Sanktion (Völkerrecht)“ oder „Immunität (Politiker)“. Damit können Sanktionen in anderen Rechtsgebieten wie z. B. dem Sozialrecht oder die Staatenimmunität bei der Verfolgung von Kriegsverbrechen oder im Kontext von Covid-19 die Frage der Erlangung von Immunität im Rahmen der Gesundheitsvorsorge bei Infektionskrankheiten nicht mit diesem Deskriptor verschlagwortet werden. Hierzu wäre die Aufnahme zusätzlicher Deskriptoren, etwa „Immunität (Medizin)“ und „Immunität (Völkerrecht)“ notwendig, was aber eine unerwünschte Aufblähung des Thesaurus zur Folge hätte.

Neben der mit der Anfügung von Verwendungsbegrenzungen für den Nutzer sichtbaren Einschränkung der Deskriptorenzuteilung gibt es auch solche, die sich aus den im Lektorat vereinbarten Konventionen zur Indexierungspraxis ergeben und für Nutzer nicht transparent sind. Ein Beispiel hierfür ist der Deskriptor „Qualitätskontrolle“, der ursprünglich ebenfalls als aspektorientierter Allgemeinbegriff in den Pressethesaurus aufgenommen wurde. Im Zusammenhang mit den in den Medien immer wieder thematisierten, ungenügenden wissenschaftlichen Standards bei Promotionen von Politikern und Politikerinnen entstand unter den Lektoren eine Kontroverse über die Vergabe dieses Deskriptors. Eine Mehrheit war der Auffassung, dass es Qualitätskontrollen nur im Bereich der Wirtschaft gibt, dieser Deskriptor deshalb auch nur dort zur Indexierung benutzt werden dürfe. Zur Indexierung von Artikeln zu den umstrittenen Promotionen wurde deshalb der Deskriptor „Urheberrecht“ verwendet.

Auch wenn der Begriff „Qualitätskontrolle“ ursprünglich aus den Bereichen Handwerk und Industrie stammt, hat er sich im Laufe der Zeit auch in anderen Bereichen durchgesetzt, so etwa dem Dienstleistungssektor, der Öffentlichen Verwaltung und selbst in der Wissenschaft.[5] Ein Ergebnis der Verständigung auf diese Indexierungspraxis ist, dass die Suche mit dem Deskriptor „Urheberrecht“ eine beträchtliche Anzahl von Artikeln liefert, die sich mit den Promotionen von Politikern beschäftigen, in denen aber nur bei einem sehr geringen Teil die Frage von dabei begangenen Urheberrechtsverletzungen Gegenstand der Ausführungen ist. Nur in diesen Fällen wäre die Verwendung dieses Deskriptors von der Sache her gerechtfertigt.

Eine ähnliche Eingrenzung gibt es bei der Verwendung des Deskriptors „Manager“, der auf Führungskräfte in der Wirtschaft beschränkt ist, nicht aber für die Besetzung von Führungspositionen in Behörden sowie staatlich kontrollierten Einrichtungen verwendet werden darf. Hierfür gibt es bisher im Pressethesaurus keinen adäquaten Deskriptor. Und dies, obwohl es sich hierbei häufig auch um politisch besetzte Führungspositionen handelt, die in den Medien nicht selten äußerst kontrovers diskutiert werden, woraus sich eigentlich eine besondere Relevanz ergibt, dies auch entsprechend zu indexieren und sich dabei nicht wie bisher auf die Verwendung der für Stellenbesetzungen im Allgemeinen verwendeten Deskriptoren „Personal“ und „Stellenbesetzung“ zu beschränken. Zumal der Begriff Management im allgemeinen Sprachgebrauch in den letzten Jahren zunehmend auch im Kontext der öffentlichen Verwaltung verwendet wird. Insofern wäre es durchaus möglich und aus dokumentarischer Sicht sinnvoll, für das dortige Führungspersonal den Begriff „Manager“ zu verwenden und „Behördenleiter“, „Amtsleiter“, „Schulleiter“ usw. als Synonyme dazu einzuführen. Bei der bisherigen Praxis drängt sich die Frage auf, warum bei einer bundestagsspezifischen Verschlagwortung von Presseartikeln die Stellenbesetzung von Führungspositionen in der Wirtschaft ein höherer Stellenwert beigemessen wird als bei Führungspositionen in der öffentlichen Verwaltung und von politisch besetzten Stellen.

Problematische Synonymisierungen

Im Rahmen der Überarbeitung des Pressethesaurus haben auch Synonymisierungen stattgefunden, die unter semantischen sowie geopolitischen Gesichtspunkten äußerst problematisch sind. Es handelt sich hierbei um Bestandsbeziehungen, in denen der sprachlich engere Begriff zum Deskriptor gemachte wurde und der sprachlich weitere Begriff zum Synonym. So verweist z. B. das Synonym „Kunst“ auf den Deskriptor „Bildende Kunst“, das Synonym „Beratungsstelle“ auf den Deskriptor „Psychosoziale Beratung“. Der Begriff Kunst erfasst jedoch mehr und noch andere Kunstgattungen als die bildende Kunst und Beratungsstellen sind nicht nur im Bereich der Lebenshilfe tätig. Solche Synonymisierungen begünstigen fehlerhafte Indexierungen. Hier wäre eine Umkehrung der Relationen erforderlich. Problematisch sind auch die im Gefolge geopolitischer Veränderungen vorgenommenen Synonymisierungen der Geographika „Tschechoslowakei“ auf „Tschechische Republik“ oder „Jugoslawien“ auf „Serbien“, weil auch untergegangene Staaten nach wie vor Gegenstand aktueller Zeitungsartikel sind und sein werden.

Fazit

Mit der Einführung eines elektronischen Pressearchivs mit integriertem Thesaurus in der Pressedokumentation beim Deutschen Bundestag hat sich der zielgerichtete Zugriff auf Pressematerialien wesentlich verbessert. Dem Nutzer wird durch den Übergang von einer klassierenden Ablage von Zeitungsausschnitten zu einer diese mittels Thesaurus basierter Indexierung genauer erschließenden Verfahren weniger Informationsballast präsentiert. Das bedeutet jedoch keineswegs, dass ihm damit auch weniger Artikel präsentiert werden. Durch die Möglichkeit der Verschlagwortung mit mehreren Deskriptoren dürfte nicht selten das Gegenteil der Fall sein.

Indexierung wie auch Überarbeitung und Pflege des Pressethesaurus werden in erster Linie von dem Bedürfnis nach einer systematischen Ablage von Pressematerialien im elektronischen Pressearchiv getragen und weniger von einer möglichst optimalen Befriedigung der Informationsbedürfnisse unterschiedlicher Nutzergruppen. Die Praxis der Deskriptorenvergabe ist noch immer stark von der Verfahrensweise im konventionellen Pressearchiv geprägt. Waren es dort räumliche Gründe, die einer Mehrfachablage von Zeitungsausschnitten entgegenstanden, sind es jetzt arbeitsökonomische Gründe. Damit steht die Indexierung in einem gewissen Gegensatz zum Wortgut des ursprünglich an dem Prinzip der Postkoordination ausgerichteten Thesaurus und dem damit angestrebten Ziel, mittels einer ergänzenden, aspektorientierten Deskribierung gezielter im Sinne des individuellen Informationsbedürfnisses zu suchen bzw. bei großen Treffermengen diese mittels zusätzlicher Deskriptoren eingrenzen zu können.

Während die professionellen Informationsvermittler in der Auskunft der Pressedokumentation im Falle von auftretenden Schwierigkeiten bei der Recherche mittels des Wortguts des Thesaurus sich zu helfen wissen, indem sie z. B. über eine vorgeschaltete Volltextrecherche herauszufinden versuchen, wie die entsprechenden Artikel indexiert werden, weichen eigenständig recherchierende Endnutzer – soweit sie bei ihrer Suche nach Informationen aus der Presse auf den in das elektronische Pressearchiv integrierten Pressethesaurus zurückgreifen – auf die Volltextrecherche aus, wie sie es vom Recherchieren im Internet gewohnt sind.

Für die Informationsdienstleistungen der Pressedokumentation beim Deutschen Bundestag gilt noch immer, was bereits vor mehr als einem Jahrzehnt von dem früheren Referatsleiter Gerhard Deter im Ergebnis seiner damaligen Bestandsaufnahme festgehalten wurde: „Die Nutzerorientierung muss künftig noch stärker in den Mittelpunkt der Arbeit treten.“[6] Gegenüber der Situation zum Zeitpunkt der Einführung des elektronischen Pressearchivs haben sich das Internet und die Suchmaschinen weiterentwickelt. Sie bestimmen immer mehr auch das Suchverhalten und die Erwartungshaltung bei der Suche unterschiedlicher Nutzergruppen im elektronischen Pressearchiv.

Das haben inzwischen auch die Zeitungsverlage erkannt. Um unter der ständig zunehmenden Menge an Informationen die Relevanz eines Beitrags im Hinblick auf ein zugrundeliegendes Informationsbedürfnis zu vermitteln, sind einige auf ihrer Online-Präsenz dazu übergangen, die dort abrufbaren Artikel inhaltlich zu erschließen. Für Beiträge auf Zeit-Online werden hierzu meist sechs Schlagwörter vergeben. Damit ist ihre inhaltliche Erschließung teilweise tiefer als diejenige der gleichen Beiträge im elektronischen Pressearchiv beim Deutschen Bundestag.

Nutzerfreundlichkeit

Für die angestrebte Erhöhung der Nutzerorientierung gibt es zahlreiche Anknüpfungspunkte. Teilweise sind sie bereits in Angriff genommen worden. So wurde zwischenzeitlich damit begonnen, die im allgemeinen Sprachgebrauch und in der Presse gebräuchlichen Kurzformen und Abkürzungen zu den im Pressethesaurus enthaltenen nationalen und internationalen Körperschaften wie z. B. Ministerien oder die ihnen untergeordneten Behörden als Synonyme aufzunehmen. Sie waren dort über lange Zeit nur nach den Vorgaben der gemeinsamen Normdatei (GND) bzw. ihrer offiziellen Benennung enthalten, was in der Vergangenheit sowohl bei der Indexierung von als auch der Recherche nach entsprechenden Pressematerialien immer wieder zu Problemen beim Auffinden des entsprechenden Deskriptors geführt hat.

Zur Erhöhung der Nutzerfreundlichkeit wäre es z. B. auch hilfreich, bei der Indexierung von Beiträgen über Staats- oder Regierungsoberhäupter ausländischer Staaten nicht nur deren Namen zu verwenden, sondern zusätzlich den entsprechenden Sachdeskriptor zum Amt. Kein Nutzer und auch kein Abgeordneter kennen die Namen aller aktuellen und der früheren Staats- oder Regierungsoberhäupter. Für die Vorbereitung etwa der Reisen von Parlamentsdelegationen wäre es hilfreich, gewünschte Presseartikel direkt erhalten zu können, ohne vorab erst nach den Namen recherchieren zu müssen.

Eine mehr den individuellen Nutzerbedürfnissen entgegenkommende Aufbereitung der im elektronischen Pressearchiv abgelegten Zeitungsartikel wird perspektivisch nicht umhinkommen, bei der Indexierung mehr als bisher auch der Qualität eines Artikels Rechnung zu tragen. Beiträge, die über die reinen Fakten hinausgehende Hintergründe und unterschiedliche Aspekte zum Thema präsentieren und damit für politische Entscheidungsprozesse wichtige Zusatzinformationen liefern, sollten tiefer erschlossen werden. Eine Bewertung der Pressematerialien findet bei ihrer Verschlagwortung noch zu wenig statt.

Mit dem derzeitigen Personalbestand im Lektorat lassen sich solche Maßnahmen allerdings kaum umsetzen. Die Bemühungen zur Schaffung eines zusätzlichen Dienstpostens sind bisher erfolglos geblieben. Es stellt sich die Frage, inwieweit angesichts des mittlerweile innerhalb des Produktionsablaufs für das elektronische Pressearchiv im technischen Bereich verringerten Arbeitsaufkommens perspektivisch das dortige Personal reduziert und damit eine zusätzliche Stelle im Lektorat geschaffen werden kann.

Die schon lange vorgesehene Einbindung einer Software zur halbautomatischen Indexierung von Texten in das elektronische Pressearchiv könnte die inhaltliche Erschließung von Zeitungsartikeln durch die Lektoren unterstützen. Die Indexierungskonsistenz ließe sich damit sicherlich verbessern. Ob sie allerdings dazu beitragen könnte, die Nutzerorientierung der Indexierung zu erhöhen, ist fraglich.

Eine Alternative wäre, nicht mehr alle in das elektronische Pressearchiv einlaufenden Zeitungsartikel inhaltlich zu erschließen, sondern nur noch die als Leitmedium geltende Frankfurter Allgemeinen Zeitung und noch ein oder zwei andere, für die öffentliche Meinungsbildung besonders relevante überregionale Presseerzeugnisse. Aus den anderen Zeitungen könnte eine zusätzliche Indexierung auf Artikel von besonderer Wichtigkeit oder ausgezeichneter Qualität beschränkt werden. In der Anfangszeit des elektronischen Pressearchivs gab es bereits die Diskussion, ob bei einem Volltextarchiv sämtliche dort abgelegten Zeitungsartikel zusätzlich noch inhaltlich erschlossen werden müssen. Damals wurde gegen eine selektive Verschlagwortung entschieden.

In Zusammenhang mit der Erhöhung der Nutzerorientierung stellt sich auch die Frage einer neuerlichen Überarbeitung des Pressethesaurus, spätestens dann, wenn es um die Einführung einer Software zur teilautomatisierten inhaltlichen Erschließung geht. Hierbei werden sich wahrscheinlich einige Deskriptoren, Synonyme und ihre Relationen als problematisch erweisen und neuerliche Anpassungen erforderlich machen. Ein Beispiel hierfür wäre z. B. die Verwendung des Begriffs „Mobbing“ als Synonym für „Arbeitsklima“. Für den Kontext Schule mag das noch bedingt zutreffend sein, im Zusammenhang von Internet und Social Media aber nicht mehr. Und die Anzahl von Presseartikeln, in denen (Cyber)Mobbing im Zusammenhang mit Schule oder Social Media thematisiert wird, ist inzwischen viel größer als die für den Bereich der Arbeitswelt.

Im Hinblick auf die beim Deutschen Bundestag noch immer angestrebte Schaffung eines einheitlichen Bundestagsinformationssystems sowie einer stärkeren Ausrichtung der Deskriptorenvergabe an den Informationsbedürfnissen und dem Sprachgebrauch seiner Nutzerschaft wäre es wünschenswert, sich bei einer neuerlichen Revision des Pressethesaurus mehr am Wortgut des Thesaurus der Parlamentsdokumentation zu orientieren, wo im Gegensatz zur Pressedokumentation ein eigener Dienstposten existiert, dessen Stelleninhaber zuständig für dessen Pflege und Betreuung ist.

About the author

Dr. Klaus Sator

Dr. Klaus Sator, Politologe, Historiker und Wissenschaftlicher Dokumentar, war zwischen 1996 bis zum altersbedingten Renteneintritt Ende 2021 in unterschiedlichen Bereichen der Verwaltung beim Deutschen Bundestag beschäftigt. Neben seiner Tätigkeit als Lektor in der Pressedokumentation auch im Referat Datenbanken, Programmentwicklung, im Sach- und Sprechregister, in der Parlamentsdokumentation und im Wissenschaftlichen Dienst.

Published Online: 2023-05-09
Published in Print: 2023-05-31

© 2023 Walter de Gruyter GmbH, Berlin/Boston

Downloaded on 26.9.2025 from https://www.degruyterbrill.com/document/doi/10.1515/iwp-2022-2258/html
Scroll to top button