on
Data/ETL engineer, Python & SQL, Praha
TL;DR
Potřebujeme pomoct se zpracováváním dat, s naším ETL procesem. Poskytneme ti velkou výzvu, volnost, příležitost a pomoc týmu. Chceme, abys už měl/a něco za sebou a věděl/a zhruba co a jak.
Máme dva lidi, kteří u nás řeší data. Staví ETL pipeline, scrapujou weby, transformujou feedy, obohacují data. Je toho moc a potřebujeme s tím pomoct.
Přidej se k našemu super týmu! Máme za sebou tři roky startup hackování a teď už rozumně víme, co potřebujeme dál dělat.
Můžeš to brát jako příležitost dělat věci po svém a hodně se toho naučit. Být součástí (pořád ještě) malého týmu, kde jde hlavně o to vymyslet, jak věci udělat efektivně. Pomož nám se dostat dál na naší cestě!
Co děláme
Outfindo pomáhá lidem vybrat zboží v online prostředí - třeba kola skrz náš web outfindo.cz a jeho mezinárodní varianty, nebo skrz produkty, které jako SaaS prodáváme našim partnerům. Umíme spojit potřeby zákazníků a prodjeců a produktová data.
- budujeme produktový katalog z mnoha zdrojů, automatizovaně
- obohacujeme data za příspění expertů v oboru tak, aby koncový zákazník nemusel studovat technické parametry
- získáváme data o dostupnosti zboží v eshopech a položky matchujeme s naším katalogem
- budujeme průvodce, který zákazníka provede výběrem produktu
- budujeme náš marketplace a zároveň nástroje, které embedujeme do webů našich partnerů
Víc o nás třeba i tady:
- CzechCrunch.cz - Online průvodce koupí kola má další investici. Peníze opět posílá i nejvýše postavený Čech v showbyznysu
- Forbes.cz - Topmanažery lákají kola. Kyncl a další investoři pouští do Outfindo desítky milionů
Co budeš dělat
- starat se o ETL pipelines, které zpracovávají produktová data a data a dostupnost produktů na trhu
- integrovat různé datové zdroje - přes 200 zdrojů (web scrapy, feedy)
- optimalizovat procesy, automatizovat, vymýšlet, jak jdou věci udělat lépe a víc efektivně
- starat se o kvalitu dat, hledat chyby, opravovat
- deduplikovat data
- opravovat spidery a procesy transformující data
- starat se o infrastrukturu, potenciálně
Co používáme za technologie a jak to děláme
- Python 3.10, Scrapy, Numpy, Pytorch, Jupyter notebook
- PostgreSQL databáze, relační i nerelační přístupy (json data)
- Airflow
- Linux-based servery, Docker, automatizované CI/CD
- píšeme testy
Čemu se chceme víc věnovat
Tohle může být jede z tvých prvních úkolů, protože my na to teď nemáme kapacitu
- automatizace částí procesů, kde je stále vyžadován manuální zásah
- vytvoření uživatelského nástroje (admin) pro hromadné úpravy nad produktovým katalogem
- zobecnění datového modelu tak, aby pojmul produkty různých typů
- proces na stahování obrázků do naší CDN, včetně transformace/normalizace
- klasifikace nových parametrů produktu - ať už z textových dat nebo z obrázků
Co od tebe čekáme
Budeš se k nám hodit jestli
- máš zkušenosti s podobnou činností, kterou popisujeme výše
- píšeš v Pythonu a dobře umíš SQL
- máš analytické myšlení, vidíš koleme sebe příležitosti jak zlepšit procesy/systémy/obecně fungování věcí
- chceš psát čistý, udržovatelný kód a navrhovat systémy tak, aby ti nepadaly za měsíc na hlavu
- chceš věci proaktivně opravovat
- se nebojíš zeptat o pomoc, chceš řešit věci společně v týmu
- zvládneš nějaké základy linuxu - připojit se na server, kouknout co jak funguje
Je v pohodě nemít jistotu ohledně některé z těchhle oblastí, všichni se nějak učíme za pochodu.
Budeme si rozumět, když vyznáváš podobné hodnoty, jako my:
- otevřenost v komunikaci a k nápadům ostatních
- respekt k ostatním
- nadšení k práci, která dává smysl
Co nabízíme
- peníze - ne jako garážový startup, ale taky ne jako korporát - chceme tvoji spokojenost (60-70k)
- volnost - je v pohodě se domluvit na kratším než plném úvazku, na setkávání se v kanclu třeba jen 2 x týdně
- pomoc - do začátku i s čímkoliv mimo
- mentoring od lidí, kteří už toho mají hodně za sebou (ex-Dáme jídlo dev tým)
- práce bez stresu, nemáme žádné deadlines, všichni to tu máme stejně - nechceme vyhořet :)
- pravidelné společné aktivity - v létě kolo, v zimě lezení, deskovky, dvakrát do roka dvoudenní off-site
Jsme v Praze, máme svoje kancly na Žižkově, kde je pro tebe volný stůl. Kafe a super výhled. Remote je fajn, ale chceme tě mít aspoň půlku času tady u sebe, přijde nám to v téhle fázi firmy efektivní.
Jestli to s tebou nějak pohnulo, ozvi se!
Pošli email na [email protected] nebo zavolej Ondrovi napřímo: +420724532118.