Das Maskierungszeichen (Escape-Zeichen) ist ein bestimmtes Zeichen, das verhindert, dass das nachfolgende Zeichen vom ausführenden Programm als Funktionszeichen erkannt wird. Das Escapen ist also dann notwendig, wenn ein Sonderzeichen wie ein normaler Buchstabe interpretiert werden soll und nicht in seiner besonderen Bedeutung.
Garbage Collection (GC)
Die Garbage Collection , kurz GC (auch automatische Speicherbereinigung oder Freispeichersammlung genannt) bezeichnet in der Software- und Informationstechnik eine automatische Speicherverwaltung, die den Speicherbedarf eines Computerprogramms minimiert. Dabei wird zur Laufzeit versucht, nicht länger benötigte Speicherbereiche automatisch zu identifizieren, um diese dann freizugeben.(Quelle: https://de.wikipedia.org/wiki/Garbage_Collection(opens new window), Stand, 29.03.2022)
Lucene
Apache Lucene ist eine hochperformante, frei verfügbare Programmbibliothek, die sich besonders gut zur Volltextsuche eignet. Lucene kann jede Art von Dokumenten indizieren. Dies können Texte sein, aber auch Zahlen, Datumswerte oder GPS-Positionen. Lucene ist die unter der Such- und Analytik-Engine Elasticsearch liegende Struktur zur Datenspeicherung.
NODE / NODES
NODE – engl. node bedeutet Knoten – NODES – Plural. Ein Elasticsearch-Server entspricht einem Node.
OCR
Optische Zeichenerkennung (englische Abkürzung OCR von optical character recognition) bezeichnet die automatische Texterkennung innerhalb von Bildern. Gescannte Dokumente werden durch die OCR in eine Textform umgewandelt.
Representational State Transfer (abgekürzt REST , seltener auch ReST) bezeichnet ein Programmierparadigma für verteilte Systeme, insbesondere für Webservices. REST ist eine Abstraktion der Struktur und des Verhaltens des World Wide Web. REST hat das Ziel, einen Architekturstil zu schaffen, der die Anforderungen des modernen Web besser darstellt. Dabei unterscheidet sich REST vor allem in der Forderung nach einer einheitlichen Schnittstelle. Der Zweck von REST liegt schwerpunktmäßig auf der Maschine-zu-Maschine-Kommunikation.(Quelle: https://de.wikipedia.org/wiki/Representational_State_Transfer(opens new window), Stand, 29.03.2022)
Replikation
Replikation bezeichnet die mehrfache Speicherung derselben Daten. In der Elasticsearch können Sie mit dieser Backup-Funktion einstellen, wie viele Replikate Sie von einem Shard haben möchten. Diese werden dann intelligent auf die Cluster-Nodes aufgeteilt. Somit wird die Suche auf mehrere Nodes verteilt und beim Ausfall eines Nodes sind Replikationen der Daten vorhanden, sodass die Suche ohne Datenverlust weiterhin verfügbar ist.
Shard
Die Daten eines Elasticsearch-Suchindex werden in Shards aufgesplittet (wörtlich übersetzt Scherbe).
Sprach-Analyzer
Die Elasticsearch wird mit Analyzern der gängigsten Sprachen ausgeliefert. Diese Sprach-Analyzer führen im Wesentlichen vier Funktionen aus: Sie teilen den Text in einzelne Wörter auf, setzen die Token in Kleinbuchstaben um, entfernen gängige Stoppwörter und leiten Token zu ihrer Stammform ab.
Suchindex
Elasticsearch speichert alle Daten in einem Suchindex. Dieser Index wiederum ist aufgesplittet in Typen und Dokumente mit Eigenschaften.
SWAP-Modus / Swapping
In der Informatik beschreibt Swapping (engl. für Umlagerung; von englisch to swap, ‚austauschen') innerhalb der Speicherhierarchie das Auslagern von Daten einer höheren in eine tiefere Ebene(opens new window) oder das entgegengesetzte Laden. Durch Swapping sollen die Vorteile höherer Ebenen, also höhere Geschwindigkeit, und tieferer Ebenen, nämlich höhere Kapazität und kostengünstigerer Speicher, quasi gleichzeitig nutzbar gemacht werden.(Quelle:https://de.wikipedia.org/wiki/Swapping(opens new window), Stand, 29.03.2022)
Token
Beim Erstellen oder Aktualisieren eines Datensatzes zerlegt die Elasticsearch den durchsuchbaren Text des Datensatzes in einzelne Begriffe, die sogenannten Tokens. Anschließend werden die Tokens im Suchindex gespeichert. Eine Suchanfrage wird wiederum in Tokens zerlegt. Nach diesen wird dann im Suchindex gesucht. Ein Token entspricht nicht immer einem grammatikalisch korrekten Wort, sondern ist eine Zerlegung und Vereinfachung von Worten, sodass auch eine Suche nach Auto ein Dokument findet, das nur das Wort Autos enthält.
Tomcat
Apache Tomcat ist ein Open-Source-Webserver und Webcontainer, der die Spezifikation für Java Servlets und Jakarta Server Pages (JSP) implementiert und es damit erlaubt, in Java geschriebene Web-Anwendungen auf Servlet- beziehungsweise JSP-Basis auszuführen.
YML
YML ist die Dateierweiterung der vereinfachten Auszeichnungssprache YAML. YAML wird zur Datenserialisierung verwendet und lehnt sich an XML und die Datenstrukturen in den Sprachen Perl, Python und C an.