Ми шукаємо TTS / STT Engineer для побудови та оптимізації голосової взаємодії AI-аватара в режимі реального часу. Завдання * Побудова та оптимізація ланцюжка STT → LLM → TTS з мінімальною затримкою та аудіостримінгом. * Навчання та донавчання TTS-моделей (Coqui TTS / XTTS, VITS, Tacotron2, Glow-TTS або аналогічні). * Реалізація voice cloning (few-shot / zero-shot, reference audio). * Налаштування повного TTS-пайплайну (text normalization, phonemization, prosody, vocoder). * Робота з мультимовними моделями, українська — пріоритет. * Реалізація емоційного та стилістичного мовлення (керування тоном, темпом, емоціями).
Вимоги * Досвід роботи з TTS / STT у продакшені. * Розуміння real-time audio processing. * Досвід з neural TTS моделями та voice cloning. * Системне мислення та фокус на якість і latency.
Буде плюсом * Досвід з emotional / multilingual TTS. * Досвід роботи з AI-аватарами або live-інтеракцією.