WaveAccess ищет Data Scientist для работы над проектам в области обработки текста. Вам предстоит решать реальные бизнес-задачи с использованием различных методов data science, современных технологических стеков и передовых методик.
Обязанности:
- Интеграция LLM: разработка, тонкая настройка и внедрение крупных языковых моделей (Large Language Models) для анализа и обработки разнообразных текстовых данных
- Анализ данных: проведение углубленного анализа реальных фармацевтических датасетов для получения значимых инсайтов и поддержки принятия решений
- Text Mining и NLP: использование методов обработки естественного языка для извлечения релевантной информации из больших объёмов текста и таблиц
- Разработка моделей: создание и валидация предиктивных моделей для решения ключевых задач в разных сферах применения
- Инновации: отслеживание новейших достижений в области LLM и NLP, применение инновационных подходов для решения сложных проблем
- Тесное взаимодействие с кросс-функциональными командами для понимания требований клиентов и достижения заметных результатов
- Развёртывание и поддержка локальных LLM в vllm, ollama
Требования:
- Опыт работы в должности Data Scientist не менее 3 лет
- Английский язык на уровне B2
- Глубокие знания нейронных сетей и архитектур для работы с последовательностями, в частности (RNN, LSTM, Transformers, CNN, attention)
- Опыт работы с Large Language Models (LLMs) и их применением. Знакомство с современными техниками LLM, такими как Retrieval-Augmented Generation (RAG) и LLM-агенты
- Уверенное владение Python и связанными с ним библиотеками и фреймворками для анализа данных
- Навыки презентации полученных результатов
- Опыт работы с графовыми агентами и библиотекой gpaphrag
- Опыт работы с vllm или ollama
Технологии:
- Python
- LLM
- Transformers
- Стандартный NLP-стек
- Стандартный ML-стек
- Базовый SQL
- Git
- Векторные базы данных (Postgres+pgvector / Milvus / Qdrant / Faiss)
Желательно:
- Знание общих подходов машинного обучения
- Знание математической статистики
- Опыт работы с S3
- Linux + bash, ssh
- Опыт письменной и устной коммуникации с бизнес-стейкхолдерами
- Опыт полного цикла разработки
Будет плюсом:
- Опыт разработки RestAPI
- Snowflake
- Docker
- Понимание CI/CD
- Java/C++/другие языки
Мы предлагаем:
- Работу в динамичной международной команде
- Официальное трудоустройство, 100% оплата больничного и отпуска
- Возможность сотрудничества через ИП/самозанятость
- Участие в зарубежных и российских проектах
- Добровольное медицинское страхование с стоматологическим покрытием
- Необходимое оборудование для работы
- Корпоративные программы обучения
- Широкие возможности для самореализации, профессионального и карьерного роста
- Демократичный подход к процессам и гибкое начало рабочего дня
Ключевые навыки
- Python
- SQL
- LLM
- Standard NLP stack
- Standard ML stack
- Английский — B2 — Средне-продвинутый
Задайте вопрос работодателю
Он получит его с откликом на вакансию
Вакансия опубликована 17 февраля 2025 в Тбилиси