In Geografischen Informationssystemen versteht man unter Datenqualität die Güte von Daten. Dabei kann man unterscheiden zwischen:

  • Vollständigkeit
  • Positionsgenauigkeit
  • Attributsgenauigkeit
  • zeitliche Genauigkeit
  • Auflösung/Maßstab
  • logische Konsistenz
  • Nutzungsziel bei der Datenerfassung (Herkunft der Daten)

Je nach Art der Daten können Informationen zur Datenqualität entweder den dazugehörigen Metadaten oder einem Standard entnommen werden.

Vollständigkeit

Die Vollständigkeit (oder Zuverlässigkeit) gibt an, wie groß die Wahrscheinlichkeit ist, dass für einen konkreten Anlassfall und zu einem konkreten Ort Daten vorhanden sind. Dieser Wert kann entweder aufgrund der Erfassung der Daten geschätzt oder aus Stichproben berechnet werden.

Beispiel für die Zuverlässigkeit:

  • Die Zuverlässigkeit von Hausnummern, die in einem GIS verwaltet werden, kann abgeschätzt werden, indem man Stichproben nimmt und daraus mit statistischen Methoden die Wahrscheinlichkeit und den Vertrauensbereich berechnet.
  • Die Zuverlässigkeit von Bodenschätzungsdaten kann bewertet werden, indem man den Erfassungsvorgang (wie wurde erfasst, welcher Aufwand wurde betrieben, um eine flächendeckende Erfassung zu erhalten, wie alt sind die Daten etc.) beurteilt.

Positionsgenauigkeit

Die Genauigkeit gibt die Abweichung der Daten vom wahren Wert an (oder wenn dieser nicht bekannt ist, vom Erwartungswert). Die Abweichung wird normalerweise in einer messbaren Einheit angegeben und aus einer statistischen Beurteilung ermittelt, in der die Art der Datenermittlung berücksichtigt wird.

Bei der Positionsgenauigkeit kann man zwischen absoluter und relativer Genauigkeit unterscheiden. Die absolute Genauigkeit beschreibt die Abweichung von den tatsächlichen Koordinaten des Objektes während die relative Genauigkeit angibt wie exakt die Richtungen und Distanzen zwischen zwei Punkten abgebildet wurden.

Beispiel für die Genauigkeit:

Attributsgenauigkeit

Dieses Merkmal bezieht sich auf Ungenauigkeiten der zugewiesenen Eigenschaften. Diese Fehler entstehen durch:

  • fehlerhafte Quelldateien
  • Fehlinterpretation (menschliche Fehler)
  • Datenbankfehler
This article is issued from Wikipedia. The text is licensed under Creative Commons - Attribution - Sharealike. Additional terms may apply for the media files.