About the Client
Našim klientom je popredná spoločnosť, ktorá sa zameriava predovšetkým na vývoj SW na mieru a svojim klientom poskytuje komplexné služby od návrhu a optimalizácie procesov, business a IT architektúry až po finálne dodávky ICT riešení.
Za viac ako 23 rokov získali dôveru viac ako 50 zákazníkov v oblasti financií, telekomunikácií a štátnej správy v SR a posledných 6 rokov sa úspešne rozrastáme aj do zahraničia. Pre klientov pracujú na projektoch v oblasti softvér development, informačného managementu, big data a data science v 6 európskych krajinách. Zákazníci o nich hovoria ako o spoľahlivom dodávateľovi, ktorý drží slovo a kde sa softvér robí poriadne.
About the Role
Máš rád prácu s dátami a láka ťa práca na rozmanitých projektoch? Zaujímajú ťa moderné technológie a chceš odborne rásť? Ak áno, teší nás, že čítaš ďalej, hľadáme totiž Data/ML Engineera na projekt v oblasti bankingového priemyslu.
Po úspešnom pohovore ti priradíme projekt podľa tvojich zručností a preferencií a pracovať budeš v tíme skúsených dátových inžinierov, analytikov a vývojárov.
Responsibilities
- Akvizícia a spracovanie vstupných dát pre modely
- Konštrukcia PoC alebo produkčných riešení
- Produktizácia riešení/modelu, refactoring modelu, DevOps, automatizácia
- Analýza požiadaviek, konzultácie s DS užívateľmi, príprava metodík
- Analýza dátových zdrojov, modelovanie, konfigurácia, spúšťanie a testovanie dátových pipelines
Technológie: Databricks SQL, PySpark, Spark SQL a orchestrácii pracovných postupov pomocou Airflow
Requirements
- roky praktických skúseností s Databricks vrátane odborných znalostí v Databricks SQL, PySpark a Spark SQL
- preukázané skúsenosti s technikami načítania údajov do Databricks s využitím funkcií Delta Lake
- dobrá znalosť koncepcií dátových skladov vrátane delenia údajov a indexovania na efektívne vyhľadávanie
- znalosť jazyka T-SQL a skúsenosti s migráciou ukladaných procedúr SQL Server do Databricks
- znalosť cloudových služieb Azure, najmä Azure Databricks a Azure Data Lake Storage
- odborné znalosti v oblasti integrácie Airflow na orchestráciu pracovných postupov vrátane navrhovania a správy DAG
- znalosť systémov riadenia verzií (napr. Git) a CI/CD pipeline pre pracovné postupy dátového inžinierstva
Ideálny kandidát má aj:
- skúsenosti s odvodzovaním modelov v reálnom čase a streamovacími technológiami, ako sú Kafka alebo Event Hubs
- znalosť pokročilých konceptov ML, ako je ladenie hyperparametrov, metódy ensemble a transfer learning
Nice to Have Skills
n/a