Certifikace BIG DATA

Data Science a Big Data

„Big Data“ je obecný termín používaný k popisu jakékoliv velké nebo složité datové sady, která ztěžuje řešení tradičních technik, jako jsou relační databáze.

Data Science aplikovaná v oblasti Big Data zahrnuje činnosti spočívající v identifikaci, shromažďování, strukturování a analýze dat, která dnes generují samotné společnosti (servery elektronického obchodování, průmysl 4.0 apod.). Cílem procesu je zlepšovat stávající procesy nebo objevovat nové užití datových zdrojů. Dnes jsou data považována za strategickou položku. Termín „Data mining“ neboli „dolování dat“ ji prakticky přirovnává k energii/palivu.

Řešení Big Data jsou často potřeba, když konvenční technologie a know-how dosáhly svých hranic.

Provádění činností souvisejících s Big Daty vyžaduje specifické dovednosti. Tyto činnosti, které byly předmětem podrobných studií francouzského OPIIEC a CIGREF jsou také seskupeny do různých profesí, které jsou prováděny ve společnostech.

Certifikační úrovně 1: Big Data Foundation

Program vychází z práce expertů v letech 2016/2017, která vyústila v založení „společného jádra“ Big Data Foundation certifikace dovedností charakterizovaného vizí „360 °“ se třemi souvisejícími úhly pohledu znalost základů Big Data:

  • Znalost definic a terminologie
  • Znalost aktivit Big Data
  • Znalost nástrojů Big Data

Experti

  • 8 po sobě jdoucích seminářů spojilo projektovou skupinu složenou z odborníků delegovanou dvěma organizacemi:

THALES-Services, přináší zkušenosti s využíváním Big Data (správa dat / ukládání dat), Big Analytics (zpracování dat, obohacování a vylepšení) a Visual analytics (využití a interaktivní vizualizace dat) pro své trhy jako je letectví, vesmír, pozemní doprava, bezpečnost a obrana.

ACTIVUS-Services, jeden z nejlepších ESN hodnocení Syntec ohledně práce týkající se restituce dat shromážděných „Internet of Things“ neboli internetem věcí prostřednictvím dvou hlavních typů analýz: prediktivní pro předvídání interakcí mezi „věcmi“ a agregovaná pro hodnocení a klasifikaci chování „věcí“ v komunitní síti.

Práce odborníků také umožnila definovat certifikační systém Big Data, který umisťuje 5 hlavních profesí na 3 úrovně kvalifikace:

  • V odvětví Delivery jsou profese v oblasti architektury souvisejíci s technickými řešeními podporujícími Big Data na jedné straně, výrobní profese Data Scientist a Data Analyst na druhé straně
  • V oblasti poradenství a podpory jsou profese jako Data Ingineer a konzultant Big Data

Data Scientist Practitioner a Data Scientist Expert

Úlohou takzvaného Data Scientist je prozkoumat (opakovaně), využívat, analyzovat a vyhodnocovat bohatství dat a vytvářet scénáře pro pochopení a předvídání budoucího podnikatelského nebo operačního vlivu pro společnost. V rámci profesí existuje statistik, který analyzuje data pro překládání podnikové problematiky do matematického / statistického problému a naopak. Porovnává a hodnotí různé modely nebo metody výpočtu a ví, jak předvídat své výhody a nevýhody v podnikovém prostředí. Jeho znalosti o relevantních zdrojích dat mu také umožňují předkládat doporučení týkající se datových skladů za účelem konsolidace, úpravy, repatriace, outsourcingu a internalizace.

Certifikace Data Scientist Practitioner (úroveň 2 ve schématu certifikace Big Data) vám zaručuje optimální dovednosti pro:

  • Aplikování technik (statistika, text mining, behaviorální či geolokační techniky, …), extrakce a analýza informací získaných z datových zdrojů (Big Data)
  • Získání adekvátních dat, hledání příslušných zdrojů dat, vytváření doporučení ohledě konsolidace, úpravy, repatriace, externalizace, internalizace dat, vytváření datamartů a datových skladů (data warehouses)
  • Vyhodnocení kvality a bohatosti dat, jejich analýza a integrace výsledků do cílového informačního systému podniku
  • Analýzu dat pro překládání podnikové problematiky do matematického / statistického problému a naopak
  • Srovnání a hodnocení různých modelů a metod výpočtu a předvídání výhody a nevýhody v podnikovém prostředí.

Certifikace Data Scientist Expert (úroveň 3 ve schématu certifikace Big Data) svědčí o vysokých technických dovednostech oboru a také o specifických dovednostech typu know-how, které legitimují jeho držitele k zásahu do strategických úrovní organizace.

Data Analyst Practitioner

Jeho úkolem je implementovat počítačové nástroje, techniky a statistické metody, které umožní syntézu a překlad firemních dat. Je umístěn na ISD, kde poskytuje analytickou podporu průzkumu a komplexní analýzy dat, industrializuje analytické procesy a řídí operace modelování a architektury datových zdrojů, přičemž zajišťuje jejich soudržnost. Jak naznačuje jeho název, funkce Data Analyst Practitioner je jasně orientována na implementační typ práce.

Certifikace Data Analyst Practitioner poskytuje záruku optimálních dovedností pro:

  • Poskytování analytické podpory průzkumu a komplexní analýzy dat
  • Vytváření algoritmů pro vyhledávání dat, které umožňuje prozkoumat užitečná data
  • Industrializování procesu a získávání nejzajímavějších dat
  • Uspořádání, syntetizaci a překládání informace, s cílem usnadnit rozhodování
  • Správu operací a administrace, modelování a archivaci datových zdrojů
  • Ujištění se, aby existující datové organizace fungovaly dobře a důsledně
  • Schopnosti pomoci Data Scientistovi a Data Architectovi při vytváření prediktivních modelů a odpovídajících technických řešení