Was ist Daten-Bergbau?

Datenbergbau verwendet eine verhältnismäßig große Menge Betrieb der rechnenenergie auf einem großen Satz Daten, um Gleichmässigkeiten und Anschlüsse zwischen Datenpunkten festzustellen. Algorithmen, die Techniken von den Statistiken, Lernfähigkeit einer Maschine einsetzen und Mustererkennung verwendet, um große Datenbanken automatisch zu suchen. Datenbergbau ist alias Wissen-Entdeckung in den Datenbanken (KDD).

Wie die künstliche Intelligenz des Ausdruckes ist Datenbergbau ein Regenschirmausdruck, der an einigen unterschiedlichen Tätigkeiten angewendet werden kann. In der Unternehmenswelt verwendet Datenbergbau sehr häufig, um die Richtung von Tendenzen festzustellen und die Zukunft vorauszusagen. Er eingesetzt er, um Modelle und Decision-Support-Systeme zu errichten, die Leuteinformationen geben, die, sie verwenden können. Datenbergbau übernimmt eine Front- Rolle im Kampf gegen Terrorismus. Er verwendet angenommen, um den Führer der 9/11 Angriffe festzustellen.

Datenbergmänner sind Statistiker, die Techniken mit Namen wie Nahnachbar Modellen verwenden, k-bedeutet das Sammeln, Verweigerermethode, k-falten die Quergültigkeitserklärung, lassen-ein-heraus Methode, und so weiter. Rückbildungtechniken verwendet, um die irrelevanten Muster zu subtrahieren und verlassen nur nützliche Informationen. Der Ausdruck, der bayesisch ist, gesehen häufig in das Feld und bezieht eine auf Kategorie Folgerungstechniken, die die Wahrscheinlichkeit der zukünftigen Ereignisse voraussagen, indem sie vorherige Wahrscheinlichkeiten und die Wahrscheinlichkeiten kombinieren, die auf bedingten Ereignissen basieren. Die Spamentstörung ist diskutierbar eine Form des Datenbergbaus, der automatisch relevante Mitteilungen zur Oberfläche von einem chaotischen Meer von phishing Versuchen und von Viagra-Taktabständen holt.

Entscheidungsbäume benutzt, um Berge von Daten zu filtern. In einem Entscheidungsbaum überschreiten alle Daten durch einen Eingangsnullpunkt, in dem sie einen Filter gegenüberstellt, der die Daten in Ströme abhängig von seinen Eigenschaften trennt. Z.B. sind Daten über Verbraucherverhalten wahrscheinlich gefiltert zu werden gründeten auf demographischen Faktoren. Datenbergbau ist nicht hauptsächlich über fantastische Diagramme und Sichtbarmachungtechniken, aber er einsetzt sie zt, um zu zeigen, was er gefunden. Es gewusst, dass wir statistischere Informationen sichtlich aufsaugen können, als mündlich und dieses Format für Darstellung sehr überzeugend und leistungsfähig sein kann, wenn es im rechten Zusammenhang verwendet.

Während unsere Zivilisation in zunehmendem Maße Daten-gesättigt wird und Sensoren in Massen in unsere lokalen Umgebungen verteilt, entdecken wir unbeabsichtigt Sachen, die auf dem ersten Durchlauf vorbei verfehlt werden konnten. Datenbergbau lässt uns diese Fehler beheben und die neue Einblicke gegründeten an letzten Daten entdecken und gibt uns mehr Knall für unseren Datenspeicherdollar.