Junior Python Engineer (Data Engineering / Web Scraping) Компанія: Xanmark Формат: повна зайнятість (40 год/тиж), віддалено з України Рівень: Junior (1+ рік досвіду) Зарплата: $500 — $1000
Про нас
Xanmark — це продуктовий AI-стартап, заснований у Канаді, з повністю українською інженерною командою. Ми будуємо B2B-платформу, яка обробляє великі масиви публічних даних за допомогою сучасних LLM та видає клієнтам аналітику, яка раніше потребувала тижнів ручної роботи професіоналів.
Ми шукаємо інженера, який буде відповідальним за інфраструктуру збору, скрейпінгу, організації та підтримки даних.
Що ти будеш робити
Ти володітимеш повним циклом збору даних з зовнішніх джерел: * Підтримувати пайплайни збору публічних trademark даних з офіційних джерел * Працювати з ZIP/XML/JSONL/CSV файлами та перетворювати їх у нормалізовані записи * Писати або допрацьовувати скрипти для download → parse → filter → load * Завантажувати дані в PostgreSQL/Supabase через batch upsert * Допомагати з incremental updates: daily/weekly sync, watermarks, manifest state * Розбирати помилки у data pipeline: failed downloads, broken XML, missing fields, duplicate records * Підтримувати простий моніторинг ingestion runs: статуси, кількість рядків, failed/success runs * Додавати нові джерела даних за існуючим патерном * Для джерел без нормального API іноді писати scraping/discovery logic * Документувати важливі рішення, щоб інші могли підтримувати pipeline після тебе
Наш поточний стек
Не потрібно знати все з першого дня, але корисно розуміти, з чим доведеться працювати: * Python або Node.js для data scripts * PostgreSQL / Supabase * JSONL, XML, CSV, ZIP files * HTTP APIs, public datasets, web scraping * GitHub Actions / cron-like sync jobs * Docker basics * Playwright для сайтів, де потрібен browser automation * AI tools у щоденній розробці
Існуюча кодова база зараз має багато Node.js/TypeScript, але для цієї ролі важливіше мислення data engineer: як стабільно забрати дані, очистити, завантажити, перевірити і не зламати наступний sync.
Що ми очікуємо
Must-have: * 1+ рік практичного досвіду з Python або Node.js * Розуміння HTTP: requests, status codes, pagination, retries * Базовий SQL: select, insert, update, upsert, indexes на базовому рівні * Досвід роботи з JSON / CSV / XML * Уміння читати документацію англійською * Git на рівні нормальної щоденної роботи * Акуратність: уважність до форматів даних, edge cases, логів і помилок
Буде плюсом: * PostgreSQL JSONB, indexes, query plans * asyncio, httpx, aiohttp або схожі інструменти * BeautifulSoup / lxml / parsel * Playwright або Selenium * Досвід з PDF/OCR * Docker Compose * GitHub Actions, cron, VPS deploy * Досвід з великими файлами або batch processing * Розуміння idempotent jobs: щоб повторний запуск не дублював і не ламав дані
Окремий блок — AI-інструменти Ми активно використовуємо AI в розробці, тому очікуємо, що ти теж будеш користуватись такими інструментами щодня: Codex, Claude Code, Cursor, GitHub Copilot або аналогами.
Не потрібно «магічно знати все». Важливо вміти використовувати AI як робочий інструмент: швидше розібратися в коді, написати чернетку рішення, перевірити edge cases, підготувати тести або документацію.
Ми оплачуємо потрібні AI-підписки.
Яким буде хороший кандидат
Нам підійде людина, яка: * Любить розбиратися, звідки беруться дані і чому вони ламаються * Не боїться неідеальних публічних джерел, дивних XML і нестабільних API * Пише простий, зрозумілий код * Вміє питати, коли контексту не вистачає * Хоче вирости в data/backend engineer на реальному продукті
Що ми пропонуємо * Конкурентна зарплата у USD, виплата на ФОП щомісячно * Гнучкий графік, повністю віддалена робота * Робота безпосередньо із засновником та senior-інженером — нульова дистанція до прийняття рішень * Повна оплата підписок на AI-інструменти, які тобі потрібні * 15 днів відпустки на рік + державні свята України * Жодного мікроменеджменту
Як подати заявку Надсилай: * CV (PDF або посилання на LinkedIn) * GitHub або приклад коду, який ти писав сам (pet projects підійдуть) * Коротке повідомлення (3–5 речень): які AI-інструменти ти використовуєш щодня, та один конкретний приклад, як вони змінили твій підхід до роботи