# Glossar

Begriff	Erklärung
Escapen	Das Maskierungszeichen (Escape-Zeichen) ist ein bestimmtes Zeichen, das verhindert, dass das nachfolgende Zeichen vom ausführenden Programm als Funktionszeichen erkannt wird. Das Escapen ist also dann notwendig, wenn ein Sonderzeichen wie ein normaler Buchstabe interpretiert werden soll und nicht in seiner besonderen Bedeutung.
Garbage Collection (GC)	Die Garbage Collection , kurz GC (auch automatische Speicherbereinigung oder Freispeichersammlung genannt) bezeichnet in der Software- und Informationstechnik eine automatische Speicherverwaltung, die den Speicherbedarf eines Computerprogramms minimiert. Dabei wird zur Laufzeit versucht, nicht länger benötigte Speicherbereiche automatisch zu identifizieren, um diese dann freizugeben.(Quelle: https://de.wikipedia.org/wiki/Garbage_Collection (opens new window), Stand, 29.03.2022)
Lucene	Apache Lucene ist eine hochperformante, frei verfügbare Programmbibliothek, die sich besonders gut zur Volltextsuche eignet. Lucene kann jede Art von Dokumenten indizieren. Dies können Texte sein, aber auch Zahlen, Datumswerte oder GPS-Positionen. Lucene ist die unter der Such- und Analytik-Engine Elasticsearch liegende Struktur zur Datenspeicherung.
NODE / NODES	NODE – engl. node bedeutet Knoten – NODES – Plural. Ein Elasticsearch-Server entspricht einem Node.
OCR	Optische Zeichenerkennung (englische Abkürzung OCR von optical character recognition) bezeichnet die automatische Texterkennung innerhalb von Bildern. Gescannte Dokumente werden durch die OCR in eine Textform umgewandelt.
OSGi (OSGi-Plugins)	Die OSGi Alliance (früher Open Services Gateway initiative) spezifiziert eine hardwareunabhängige (opens new window) dynamische Softwareplattform (opens new window), die es erleichtert, Anwendungen und ihre Dienste per Komponentenmodell (opens new window) (Bundle/Service) zu modularisieren und zu verwalten (Service Registry). Die OSGi-Plattform (opens new window) setzt eine Java Virtual Machine (opens new window) (JVM) voraus und bietet darauf aufbauend das OSGi-Framework.(Quelle: https://de.wikipedia.org/wiki/OSGi (opens new window), Stand, 29.03.2022)
REST	Representational State Transfer (abgekürzt REST , seltener auch ReST) bezeichnet ein Programmierparadigma für verteilte Systeme, insbesondere für Webservices. REST ist eine Abstraktion der Struktur und des Verhaltens des World Wide Web. REST hat das Ziel, einen Architekturstil zu schaffen, der die Anforderungen des modernen Web besser darstellt. Dabei unterscheidet sich REST vor allem in der Forderung nach einer einheitlichen Schnittstelle. Der Zweck von REST liegt schwerpunktmäßig auf der Maschine-zu-Maschine-Kommunikation.(Quelle: https://de.wikipedia.org/wiki/Representational_State_Transfer (opens new window), Stand, 29.03.2022)
Replikation	Replikation bezeichnet die mehrfache Speicherung derselben Daten. In der Elasticsearch können Sie mit dieser Backup-Funktion einstellen, wie viele Replikate Sie von einem Shard haben möchten. Diese werden dann intelligent auf die Cluster-Nodes aufgeteilt. Somit wird die Suche auf mehrere Nodes verteilt und beim Ausfall eines Nodes sind Replikationen der Daten vorhanden, sodass die Suche ohne Datenverlust weiterhin verfügbar ist.
Shard	Die Daten eines Elasticsearch-Suchindex werden in Shards aufgesplittet (wörtlich übersetzt Scherbe).
Sprach-Analyzer	Die Elasticsearch wird mit Analyzern der gängigsten Sprachen ausgeliefert. Diese Sprach-Analyzer führen im Wesentlichen vier Funktionen aus: Sie teilen den Text in einzelne Wörter auf, setzen die Token in Kleinbuchstaben um, entfernen gängige Stoppwörter und leiten Token zu ihrer Stammform ab.
Suchindex	Elasticsearch speichert alle Daten in einem Suchindex. Dieser Index wiederum ist aufgesplittet in Typen und Dokumente mit Eigenschaften.
SWAP-Modus / Swapping	In der Informatik beschreibt Swapping (engl. für Umlagerung; von englisch to swap, ‚austauschen') innerhalb der Speicherhierarchie das Auslagern von Daten einer höheren in eine tiefere Ebene (opens new window) oder das entgegengesetzte Laden. Durch Swapping sollen die Vorteile höherer Ebenen, also höhere Geschwindigkeit, und tieferer Ebenen, nämlich höhere Kapazität und kostengünstigerer Speicher, quasi gleichzeitig nutzbar gemacht werden.(Quelle:https://de.wikipedia.org/wiki/Swapping (opens new window), Stand, 29.03.2022)
Token	Beim Erstellen oder Aktualisieren eines Datensatzes zerlegt die Elasticsearch den durchsuchbaren Text des Datensatzes in einzelne Begriffe, die sogenannten Token. Anschließend werden die Token im Suchindex gespeichert. Eine Suchanfrage wird wiederum in Token zerlegt. Nach diesen wird dann im Suchindex gesucht. Ein Token entspricht nicht immer einem grammatikalisch korrekten Wort, sondern ist eine Zerlegung und Vereinfachung von Worten, sodass auch eine Suche nach Auto ein Dokument findet, das nur das Wort Autos enthält.
Tomcat	Apache Tomcat ist ein Open-Source-Webserver und Webcontainer, der die Spezifikation für Java Servlets und Jakarta Server Pages (JSP) implementiert und es damit erlaubt, in Java geschriebene Web-Anwendungen auf Servlet- beziehungsweise JSP-Basis auszuführen.
YML	YML ist die Dateierweiterung der vereinfachten Auszeichnungssprache YAML. YAML wird zur Datenserialisierung verwendet und lehnt sich an XML und die Datenstrukturen in den Sprachen Perl, Python und C an.

← Technische Beschreibung Indexaufbau →