Dolování dat

Co je dolování dat:

Dolování dat je anglický termín spojený s informatikou, jejíž překlad je dolování dat . Skládá se z funkce, která agreguje a organizuje data, v nich nalézá relevantní vzory, asociace, změny a anomálie .

Termín dolování dat se poprvé objevil v roce 1990 v databázových komunitách. Dolování dat je krok analýzy procesu známý jako KDD ( znalostní objev v databázích ), jeho doslovný překlad je “objev znalostí v databázích”.

Dolování dat lze rozdělit do několika základních kroků: průzkum, tvorba modelu, definice vzoru a validace a ověřování.

Dolování dat je relativně nedávnou praxí ve světě výpočetní techniky a využívá vyhledávání informací, umělou inteligenci, rozpoznávání vzorů a statistické techniky pro vyhledávání korelací mezi různými údaji, které vám umožní získat prospěšné znalosti pro společnost nebo jednotlivce. Pro společnost může být dolování dat důležitým nástrojem, který zvyšuje inovaci a ziskovost.

Využití dolování dat je poměrně rozsáhlé ve velkých databázích a konečný výsledek jejich použití lze zobrazit pomocí pravidel, hypotéz, rozhodovacích stromů, dendrogramů atd.

Dobře provedená dolování dat by měla splnit takové úkoly, jako jsou: detekce anomálií, učení asociačních pravidel (modelování závislostí), shlukování, klasifikace, regrese a sumarizace. Proces dolování dat obvykle dochází pomocí dat obsažených v datovém skladu .

Existuje několik společností a softwaru, které se věnují dolování dat, protože identifikace vzorů v databázích je stále důležitější. Identifikace příslušných norem však není pro počítačový svět jedinečná. Lidský mozek používá podobný proces k identifikaci vzorů a získání znalostí.

V uplynulých letech, dolování dat bylo široce používané v oblastech vědy a inženýrství takový jako bioinformatika, genetika, medicína, vzdělání a elektrotechnika.

Koncept dolování dat je často spojován s získáváním informací o chování lidí. Z tohoto důvodu vyvolává dolování dat v některých situacích právní otázky a otázky týkající se soukromí a etiky. Navzdory tomu mnoho lidí tvrdí, že dolování dat je eticky neutrální, protože nemá žádné etické důsledky.

Příklady reálných dat dolování

Dolování dat je často používáno společnostmi a organizacemi k získání znalostí o uživatelích / zaměstnancích / zákaznících. Například ve veřejném sektoru je možné provést křížovou kontrolu mezi rodinným stavem zaměstnance a platem, který si vydělá, aby zjistil, zda to má vliv na jeho manželský život.

Společnosti, jako jsou řetězce supermarketů, mohou tyto křížové údaje použít k určení produktů, které jsou nakupovány společně. Pokud zákazník, který si koupí produkt X, také koupí produkt Y, může být vhodné umístit tyto dva produkty do blízkosti, aby bylo pro zákazníka snazší je koupit.