on
Data engineer, Python & PostgreSQL, Praha
TL;DR
Potřebujeme pomoct s vývojem našich datových procesů, interních nástrojů a péčí o strukturu našich primárních dat. Nabídneme ti volnost v rozhodování, příležitosti k růstu a podporu našeho týmu. Chceme, abys byl/a zkušený/á v dané oblasti.
Go to english version.
Máme už celkem rozumný data tým. Stavíme ETL pipeline v Airflow, scrapujeme weby, používáme AI/ML ve všech oblastech naší činnosti. Ale je toho moc a potřebujeme pomoct to všechno propojit.
Přidej se k našemu super týmu! Máme za sebou tři roky startup hackování a teď už rozumně víme, co potřebujeme dál dělat.
Můžeš to brát jako příležitost dělat věci po svém a hodně se toho naučit. Být součástí (pořád ještě) malého týmu, kde jde hlavně o to vymyslet, jak věci udělat efektivně. Pomož nám se dostat dál na naší cestě!
Co děláme
Outfindo pomáhá lidem vybrat zboží v online prostředí - skrz produkty, které jako SaaS prodáváme našim partnerům a skrz naši platformu outfindo.cz. Umíme spojit potřeby zákazníků a prodjeců a produktová data.
- budujeme produktový katalog z mnoha zdrojů, automatizovaně
- obohacujeme data za příspění expertů v oboru tak, aby koncový zákazník nemusel studovat technické parametry
- získáváme data o dostupnosti zboží v eshopech a položky matchujeme s naším katalogem
- budujeme průvodce, který zákazníka provede výběrem produktů
- budujeme nástroje, které embedujeme do webů našich partnerů
Víc o nás třeba i tady:
- Hospodářské noviny
- EU-Startups (v angličtině)
Co budeš dělat
- starat se o strukturu našich primárních dat
- starat se o ETL pipelines, které zpracovávají produktová data a data a dostupnost produktů na trhu
- integrovat různé datové zdroje - přes 200 zdrojů (web scrapy, feedy)
- optimalizovat procesy, automatizovat, vymýšlet, jak jdou věci udělat lépe a víc efektivně
- vymýšlet procesy pro deduplikaci dat a obecně zlepšování kvality dat
- starat se o infrastrukturu
Co používáme za technologie a jak to děláme
- PostgreSQL databáze, relační i nerelační přístupy (json data)
- Python 3.11, Scrapy, Numpy, Pytorch, Tensorflow, Polars, Seaborn, Jupyter notebook
- Airflow
- Linux-based servery, Docker, automatizované CI/CD
- píšeme unit testy v Pytestu
- máme codereview
- děláme experimenty, potvrzujeme hypotézy
Čemu se chceme více věnovat
Tohle může být jeden z tvých prvních úkolů, protože my na to teď nemáme kapacitu
- automatizace částí procesů, kde je stále vyžadován manuální zásah
- vytvoření uživatelských nástrojů (admin) pro hromadné úpravy nad produktovým katalogem
- zobecnění datového modelu tak, aby lépe pojmul produkty různých typů
- proces na stahování obrázků do naší CDN, včetně transformace/normalizace
Co od tebe očekáme
Budeš se k nám na tuhle roli hodit jestli
- máš zkušenosti s podobnou činností, kterou popisujeme výše
- jsi vývojář/ka, píšeš v Pythonu, umíš analyzovat problémy, rozdělit je na menší části a přetavit je do kódu/procesu
- rozumíš si s (PostgreSQL) databází, umíš navrhovat datové struktury, plynně píšeš SQL
- máš analytické myšlení, vidíš kolem sebe příležitosti, jak zlepšit procesy/systémy/obecně fungování věcí
- chceš psát čistý, udržovatelný kód a navrhovat systémy tak, aby ti nepadaly za měsíc na hlavu
- chceš věci proaktivně zlepšovat
- nebojíš se zeptat o pomoc, chceš řešit věci společně v týmu
- zvládneš základy linuxu
Očekáváme relativně zkušeného člověka. Je v pohodě nemít jistotu ohledně některé z těchto oblastí, všichni se nějak učíme za pochodu.
Budeme si rozumět, když vyznáváš podobné hodnoty, jako my:
- otevřenost v komunikaci a k nápadům ostatních
- respekt k ostatním
- nadšení k práci, která dává smysl
Co nabízíme
- peníze - ne jako garážový startup, ale taky ne jako korporát - chceme tvoji spokojenost (100k+)
- volnost - je v pohodě se domluvit na kratším než plném úvazku, na setkávání se v kanclu třeba jen 2-3 x týdně
- pomoc - do začátku i s čímkoliv mimo práce
- mentoring od lidí, kteří už toho mají hodně za sebou (ex-Dáme jídlo dev tým)
- práce bez stresu, nemáme žádné deadlines, všichni to tu máme stejně - nechceme vyhořet :)
- pravidelné společné aktivity - v létě kolo, v zimě lezení, deskovky, dvakrát do roka dvoudenní off-site
Jsme v Praze, máme svoji kancelář na Žižkově, kde je pro tebe volný stůl. Kafe a super výhled. Remote je fajn, ale chceme tě mít aspoň půlku času tady u sebe, přijde nám to v téhle fázi firmy efektivní.
Jestli to s tebou nějak pohnulo, ozvi se!
Pošli email se CV na [email protected] nebo zavolej Ondřejovi rovnou: +420724532118.