Cassandra – Übersicht
Beliebte Anwendungen auf unseren Hochleistungs-Cloud-Servern mit einem Klick bereitstellen.
Apache Cassandra ist ein verteiltes Datenbankmanagementsystem der NoSQL-Klasse, das für die Erstellung hochskalierbarer und zuverlässiger Speicher für riesige Datenmengen konzipiert wurde, die in Form von Hashes repräsentiert werden.

In Java geschrieben, implementiert es ein verteiltes Hash-System ähnlich wie DynamoDB, das eine nahezu lineare Skalierbarkeit bei wachsendem Datenvolumen ermöglicht. Es verwendet das ColumnFamily-Speichermodell, das sich von Systemen wie MemcacheDB – die Daten ausschließlich im „Schlüssel-Wert"-Verbund ablegen – durch die Möglichkeit unterscheidet, Hashes mit mehreren Verschachtelungsebenen zu speichern.
Es gehört zur Kategorie der fehlertoleranten DBMS: Die in der Datenbank abgelegten Daten werden automatisch auf mehrere Knoten eines verteilten Netzwerks repliziert oder sogar gleichmäßig über mehrere Rechenzentren verteilt. Bei einem Knotenausfall übernehmen andere Knoten dessen Funktionen im laufenden Betrieb. Das Hinzufügen neuer Knoten zum Cluster sowie Cassandra-Versions-Updates erfolgen ebenfalls im laufenden Betrieb – ohne zusätzliche manuelle Eingriffe oder Neukonfiguration anderer Knoten.
Vorteile von Cassandra:
- hohe Skalierbarkeit und Zuverlässigkeit ohne Single Points of Failure;
- Implementierung der NoSQL-Column-Family;
- sehr hoher Durchsatz für Schreiboperationen und guter Durchsatz für Leseoperationen;
- SQL-ähnliche Abfragesprache (ab Version 0.8) und Unterstützung von Sekundärindex-Suchen;
- konfigurierbare Konsistenz und Replikationsunterstützung;
- flexibles Schema.