Cluster (Datenanalyse)
Als Cluster (gelegentlich auch Ballungen) bezeichnet man in der Informatik und Statistik eine Gruppe von Datenobjekten mit ähnlichen Eigenschaften. Die Zuordnung von Daten zu den in einem Datensatz gefundenen Clustern bezeichnet man als Clustering. Verfahren zum Auffinden von solchen Gruppen bezeichnet man als Clusteranalyse. Nicht zu einem Cluster gehörende Datenobjekte bezeichnet man als Ausreißer (englisch outlier) oder Rauschen (englisch noise).
Die Kernidee eines Clusters ist, dass Objekte im selben Cluster über „ähnliche“ Eigenschaften verfügen und sich dadurch von Objekten, die nicht in diesem Cluster sind, unterscheiden.