Stubenrauchstr. 35, 12161 Berlin
kupfer@das-kupfer.de    |    030-26544825    |    0176-24370378

Automatische Indexierung/Verschlagwortung für Aktenmanagement und Dokumentenmanagement

Was ist unter "automatischer Indexierung" zu verstehen?


Die automatische Indexierung (automatische Verschlagwortung) ist eine Methode zur Erzeugung von inhaltsbezogenen Metadaten in digitalen Dokumenten-Verwaltungs-Systemen. Bei der "normalen" manuellen Indexierung werden für eine Dokumentations-Einheit (Dokument, Akte, audiovisuelle Aufzeichnung etc.) nach deren intellektueller Verarbeitung Schlagwörter vergeben und diese in der Regel Metadatensätzen in einer Datenbank o. ä. zugefügt. Im Falle der automatischen Indexierung hingegen wird die intellektuelle Verarbeitung des Inhalts in eine Software-Lösung ausgelagert. Dort wird durch verschiedene voreingestellte Analyse-Verfahren versucht, ein Ergebnis zu erzielen, das einer manuellen Indexierung möglichst nahe kommt. Je nach betriebenem Aufwand gestaltet sich der Abstand zu den Ergebnissen einer manuellen Indexierung sehr unterschiedlich.

Vorteile der automatischen Indexierung gegenüber der manuellen Indexierung


  • Geringer Personalaufwand: Die Bearbeitungszeit pro Dokumentations-Einheit kann sehr gering gehalten werden.
  • Sofort verfügbar: Unmittelbar nach dem Einpflegen der Dokumentations-Einheiten/Objekte in das System können die Indexierungs-Ergebnisse zur Recherche genutzt werden.
  • Verlässlich: Eine automatische Indexierung erzeugt Ergebnisse von gleichbleibender Qualität.
  • Kostengünstig bei steigendem Dokumentations-Volumen: Der minimierte Personal-Aufwand erlaubt eine Steigerung der Zahl der zu erfassenden Dokumentations-Einheiten ohne in gleichem Maße steigende Kosten zu verursachen.
  • Sehr gut geeignet für vorstrukturierte oder relativ gleichförmig strukturierte Dokumente in geringer sprachlicher Varianz.

Nachteile der automatischen Indexierung


  • Ungenau: Im Ergebnis eines Recherche-Vorganges ausgeworfene Trefferlisten sind nicht zwangsläufig vollständig (gemessen am Recherche-Ziel); die Treffer selbst sind in ihrer Gesamtheit nur weitestgehend relevant.
  • Unflexibel: Die Software-Lösung ist aus sich selbst heraus nicht in der Lage, auf aktuelle Entwicklungen reagieren zu können.
  • Begrenzte Variabilität: Verbale Umschreibungen von Sachverhalten ohne deren explizite begriffliche Benennung werden nicht erkannt. Die Erkennung von Begriffs-Varianten und Falsch-Schreibungen erfordert u. U. den Einsatz spezieller Software, mindestens aber einen hohen Trainingsaufwand für die Erkennung.
  • Unter Umständen verfälschend: Die alleinige Ausrichtung der Recherche auf die Ergebnisse der automatischen Indexierung ist dann kontraproduktiv, wenn die relevanten Dokumentations-Einheiten nicht vollständig und nicht in gleichmäßiger Indexierungs-Qualität davon erfasst werden.
    Des Weiteren kann sich eine mangelnde Trennschärfe bei der falschen Benutzung oder bei Mehrfachbedeutungen von Begriffen in automatisch indexierten Texten ergeben.
Zur Minimierung/Eliminierung erkannter Nachteile bietet sich eine Kombination von herkömmlich ermittelten Metadaten mit Ergebnissen der automatischen Indexierung an.

Beratungsleistungen


  • Inhaltserschließung: Projekt-Planung und -Leitung
  • Auswahl von Metadaten-Standards, Entwurf von Metadaten-Schemata und Klassifikationen
  • Bewertung von Indexierungs-Methoden

Verwandte Themen zum Komplex Automatische Indexierung/Verschlagwortung