In Geografischen Informationssystemen versteht man unter Datenqualität die Güte von Daten. Dabei kann man unterscheiden zwischen:
- Vollständigkeit
- Positionsgenauigkeit
- Attributsgenauigkeit
- zeitliche Genauigkeit
- Auflösung/Maßstab
- logische Konsistenz
- Nutzungsziel bei der Datenerfassung (Herkunft der Daten)
Je nach Art der Daten können Informationen zur Datenqualität entweder den dazugehörigen Metadaten oder einem Standard entnommen werden.
Vollständigkeit
Die Vollständigkeit (oder Zuverlässigkeit) gibt an, wie groß die Wahrscheinlichkeit ist, dass für einen konkreten Anlassfall und zu einem konkreten Ort Daten vorhanden sind. Dieser Wert kann entweder aufgrund der Erfassung der Daten geschätzt oder aus Stichproben berechnet werden.
Beispiel für die Zuverlässigkeit:
- Die Zuverlässigkeit von Hausnummern, die in einem GIS verwaltet werden, kann abgeschätzt werden, indem man Stichproben nimmt und daraus mit statistischen Methoden die Wahrscheinlichkeit und den Vertrauensbereich berechnet.
- Die Zuverlässigkeit von Bodenschätzungsdaten kann bewertet werden, indem man den Erfassungsvorgang (wie wurde erfasst, welcher Aufwand wurde betrieben, um eine flächendeckende Erfassung zu erhalten, wie alt sind die Daten etc.) beurteilt.
Positionsgenauigkeit
Die Genauigkeit gibt die Abweichung der Daten vom wahren Wert an (oder wenn dieser nicht bekannt ist, vom Erwartungswert). Die Abweichung wird normalerweise in einer messbaren Einheit angegeben und aus einer statistischen Beurteilung ermittelt, in der die Art der Datenermittlung berücksichtigt wird.
Bei der Positionsgenauigkeit kann man zwischen absoluter und relativer Genauigkeit unterscheiden. Die absolute Genauigkeit beschreibt die Abweichung von den tatsächlichen Koordinaten des Objektes während die relative Genauigkeit angibt wie exakt die Richtungen und Distanzen zwischen zwei Punkten abgebildet wurden.
Beispiel für die Genauigkeit:
- Die Genauigkeit der Punktkoordinaten in einem GIS kann als mittlerer Lagefehler angegeben werden. Dieser wird mit mathematischen Methoden aus der Ermittlung dieses Punktes, etwa durch Vermessung, Photogrammetrie oder Digitalisierung, abgeleitet.
Attributsgenauigkeit
Dieses Merkmal bezieht sich auf Ungenauigkeiten der zugewiesenen Eigenschaften. Diese Fehler entstehen durch:
- fehlerhafte Quelldateien
- Fehlinterpretation (menschliche Fehler)
- Datenbankfehler