Was sind der wichtigste Daten-Bergbau Konzepte?

Die wichtigsten Datenbergbaukonzepte werden für die Analyse der gesammelten Informationen, höchst bemerkenswert in der Bemühung, ein Verhalten zu beobachten verwendet. Unbekannte Interaktionen zwischen Daten werden in einer Vielzahl von Weisen, kritische Verhältnisse zwischen Themen und angehäuften Informationen zu ermitteln erforscht. Eine Herausforderung im Datenbergbau ist, dass die tatsächlichen Informationen, die gesammelt werden, möglicherweise nicht vom vollständigen Gebiet erinnernd sein können. In einer Bemühung, diese Tatsache zu adressieren, können Wechselbeziehungen zwischen den Daten durch die verschiedenen Datenbergbaukonzepte methodisch gesteuert werden.

Standards für Datenbergbaukonzepte werden durch die Verbindung für Interessengruppe der Rechneranlage auf Wissens-Entdeckung und Daten-Bergbau (SIGKDD) erzwungen. Diese Organisation veröffentlicht das “International Journal der Informationstechnologie und des Entscheidung Making† sowie die Journal SIGKDD Erforschungen. Die Durchsetzung von Ethik und von Grundprinzipien des Datenbergbaus hält die Industrie, begrenzten rechtlichen Problemen leistungsfähig und mit zu arbeiten.

Aufbereitung der Informationen ist einer der wichtigsten Aspekte des Datenbergbaus. Die rohen Daten müssen gewonnen werden und gedeutet werden. Um diese Tätigkeit durchzuführen, muss ein Prozess entschlossen sein, sollten die Zieldaten zusammengebaut werden und Muster werden gefunden. Der Prozess bekannt als Wissens-Entdeckung in den Datenbanken und wurde von Gregory Piatetsky-Shapiro 1989 entwickelt.

Vier verschiedene Kategorien Datenbergbaukonzepte lassen den Prozess stattfinden. Das Sammeln verwendet den Algorithmus, der vom Datenbergbauprozeß verursacht wird, um Einzelteile in ähnliche Gruppen zusammenzubauen. Anders als das Sammeln ist Klassifikation der Informationen, wenn die Daten in vorbestimmte Gruppen zusammengebaut werden und analysiert. Verbindung versucht, Verhältnisse zwischen den Variablen zu finden und feststellt, welche Gruppen Daten allgemein verbunden sind. Die abschließende Art des Datenbergbaus ist die Rückbildung, basiert auf der Methode der Bestimmung einer Funktion innerhalb der Datenerfassung.

Die Informationen zu validieren ist der letzte Schritt, wenn sie entdeckt, was die Datenbergbauanwendung darstellt. Wenn nicht alle Algorithmen eine gültige Datei darstellen, können die Muster, die auftreten, eine benannte Situation ergeben Overfitting. Um dieses Problem zu überwinden, werden die Daten mit einem Testsatz verglichen. Dieses ist ein Konzept, in dem die Maße mit einer Reihe Algorithmen ausgerichtet sind, die einen plausiblen Satz Dateien liefern würden. Wenn die erworbenen Informationen nicht mit dem Testsatz ausrichten, dann müssen die angenommenen Muster in den Daten ungenau sein.

Einige der wichtigsten Datenbergbaukonzepte treten in einer Vielzahl von Industrien auf. Alle Spiel, Geschäft, Marketing, Wissenschaft, Technik und Überwachung verwenden Datenbergbautechniken. Indem es diese Techniken leitet, kann jedes Feld optimale Verfahren oder bessere Weisen feststellen, Resultate zu finden.