Was sind der unterschiedliche Daten-Bergbau Methoden?

Es gibt eine Vielzahl der verschiedenen Datenbergbaumethoden, die in den Softwarezusätzen angewendet und theoretische Konzepte. Diese erlauben Benutzern, Informationen von den Daten zu extrahieren, die von den Einzelpersonen und von Firmen verwenden eine Vielzahl der Werkzeuge gesammelt. Große Mengen Daten können verwendet werden, um verschiedene Faktoren in einem einzelnen Thema oder in einer Vielzahl der Themen festzustellen. Diese Datenbergbaumethoden verwendet am allgemeinsten auf den Gebieten des Betrugsschutzes, -marketings und -überwachung.

Für Hunderte Jahre, angewendet worden Datenbergbaumethoden, um Informationen von den Themen zu extrahieren. Moderne Techniken jedoch Gebrauch automatisierten Konzepte, um erhebliche Daten über computergesteuerte Betriebsmittel zur Verfügung zu stellen. Während Informatiken während des 20. Jahrhunderts auftauchten, entwickelte das Konzept der Datenbergbaumethoden in einer Bemühung, versteckte Muster in den großen Schwaden der gesammelten Daten zu überwinden. Ein gutes Beispiel von diesem ist wenn eine Werbung, die die Einkaufenmuster eines on-line-Kunden analysierend fest ist. Diese Firma kann bestimmte Produkte dann vermarkten, die die Einzelperson interessiert sein kann, an zu kaufen.

Eine Datenbergbautechnik, die allgemein in der Industrie verwendet, genannt Knowledge Discovery in den Datenbanken (KDD). Entwickelt 1989 durch Gregory Piatetsky-Shapiro, erlaubt KDD Benutzern, rohe Daten zu verarbeiten, die Informationen für notwendige Daten zu analysieren und die Resultate zu deuten. Diese Methode erlaubt Benutzern, Muster in den Algorithmen zu finden, jedoch sind die allgemeinen Daten nicht immer genau und können auf kompromittierende Arten zusammengefügt werden. Dieses bekannt, wie overfitting.

Bergbaumethoden der grundlegenden Daten mit.einbeziehen vier bestimmte Arten Aufgaben timmte: Klassifikation, Sammeln, Rückbildung und Verbindung. Klassifikation nimmt das Informationsgeschenk und vermischt es in definierte Gruppierungen. Das Sammeln entfernt die definierten Gruppierungen und lässt die Daten durch ähnliche Einzelteile einstufen. Rückbildung konzentriert auf die Funktion der Informationen und modelliert die Daten bezüglich des Konzeptes. Die abschließende Datenbergbaumethode, Verbindung, versucht, Verhältnisse zwischen den verschiedenen Datenzufuhren zu finden.

Wenn man die verschiedenen Datenbergbaumethoden anwendet, verwendet bestimmte Standards, um festzustellen, welche Parameter im Prozess verwendet werden können. Die Verbindung für Interessengruppe der Rechneranlage auf Wissens-Entdeckung und Daten-Bergbau (SIGKDD) hält eine Jahresversammlungbestimmung, welche Prozesse angebracht sind. Ethische Faktoren gewogen zusammen mit praktischen Anwendungen, um die besten Informationen über Einzelpersonen und Firmen zu finden. Diese Informationen veröffentlicht in einem Industriejournal, das SIGKDD Erforschungen genannt.