Was ist schmutzige Daten?

Schmutzige Daten sind ein Ausdruck, der verwendet, um irgendeine Art elektronische Daten zu beschreiben, die überholt nicht genau ist, unvollständig, oder anders. Daten dieser Art können an den Störungen in der Dateneingabe, in einer Störung, die Daten regelmässig zu aktualisieren oder sogar in der Eintragung der gleichen Daten verursachtes liegen mehrmals. Manchmal sind die falschen Daten nichts mehr als Störungen in der Interpunktion im Text der elektronischen Dokumente. In anderen Fällen können schmutzige Daten Informationen, die irreführt, absichtlich, wie Versuche sein, Abrechnungssätze zu ändern, um ein spezifisches Bild Investoren und anderen darzustellen.

In den meisten Fällen ist die Ansammlung der schmutzigen Daten in irgendeiner Art Datenbank unbeabsichtigt. Einzelpersonen, die neue Informationen in die Datenbank einbringen, können Wörter fehlbuchstabieren, auslassen Interpunktion, die zum Verständnis der Absicht des Textes wichtig ist, oder Ausfallen, um einer spezifischen Formatierungsstrategie zu folgen. Mit Situationen dieser Art, die falschen Informationen ist zu beheben ein verhältnismäßig einfach Prozess, das nichts mehr als erfordert, den falschen Text ändernd und die Änderungen sparend. Geschäfte handhaben manchmal diesen Prozess, indem sie der Daten lesen, nachdem er eingeführt bildend ist und die notwendigen Updates.

Schmutzige Daten können auch auftreten wegen einer Störung, vorhandene Aufzeichnungen zu aktualisieren, wenn Informationen ändern. Z.B. wenn Verkäufer Kundenakten aktualisieren nicht können, wenn Personaländerungen mit einem gegebenen Kunden eintreten, sind jene Akten nicht mehr genau und gelten als schmutzig. Wie bei der Korrektur von Rechtschreibung und von Interpunktionsfehlern, hilft das Nehmen der Zeit, überholte Informationen zu entfernen und sie durch gegenwärtige Daten zu ersetzen, die Gesamtbrauchbarkeit der Datenbank zu erhöhen.

Es gibt Situationen, in denen die Kreation der schmutzigen Daten absichtlich ist. Firmen können beschließen, spezifische Informationen von einer Datenbank auszulassen, um eine spezifische Vorstellung betreffend Finanzen, wie Hervorhebung der Menge des erzeugten Einkommens während eines gegebenen Zeitraums, aber Beschließen zu verursachen, Daten nicht einzubringen, die auf der Menge des gesammelten Einkommens während des gleichen Zeitraums bezieht. In dieser Art der schmutzigen Daten, sind die Informationen, die vorgelegt, genau, insoweit sie geht, aber gelten als unvollständig.

Mit einen Arten schmutzige Daten, kann die Entscheidung, die Zeit und die Bemühung nicht zu nehmen sein, Korrekturen zu bilden. Dieses ist allgemein, wenn die falschen Daten keine Auswirkung auf die Fähigkeit des Geschäfts, richtig zu arbeiten haben, oder darstellt kein Potenzial für das Verursachen jeder großen Bedrängnisses en. Dies heißt, dass gerade über jedes mögliches Wesen, das beibehält, eine Art Datenbank vermutlich mindestens wenig schmutzigen Daten hat, die mit anderen Informationen vermischt, die gegenwärtig und genau ist.