Middle/Senior Data Scientist (LLM)

Уровень дохода не указан

Опыт работы: 3–6 лет

Полная занятость

График: 5/2

Рабочие часы: 8

Формат работы: удалённо

IT-компания
У работодателя есть аккредитация

Напишите телефон, чтобы работодатель мог связаться с вами

Чтобы подтвердить, что вы не робот, введите текст с картинки:
captcha

WaveAccess ищет Data Scientist для работы над проектам в области обработки текста. Вам предстоит решать реальные бизнес-задачи с использованием различных методов data science, современных технологических стеков и передовых методик.

Обязанности:

  • Интеграция LLM: разработка, тонкая настройка и внедрение крупных языковых моделей (Large Language Models) для анализа и обработки разнообразных текстовых данных
  • Анализ данных: проведение углубленного анализа реальных фармацевтических датасетов для получения значимых инсайтов и поддержки принятия решений
  • Text Mining и NLP: использование методов обработки естественного языка для извлечения релевантной информации из больших объёмов текста и таблиц
  • Разработка моделей: создание и валидация предиктивных моделей для решения ключевых задач в разных сферах применения
  • Инновации: отслеживание новейших достижений в области LLM и NLP, применение инновационных подходов для решения сложных проблем
  • Тесное взаимодействие с кросс-функциональными командами для понимания требований клиентов и достижения заметных результатов
  • Развёртывание и поддержка локальных LLM в vllm, ollama

Требования:

  • Опыт работы в должности Data Scientist не менее 3 лет
  • Английский язык на уровне B2
  • Глубокие знания нейронных сетей и архитектур для работы с последовательностями, в частности (RNN, LSTM, Transformers, CNN, attention)
  • Опыт работы с Large Language Models (LLMs) и их применением. Знакомство с современными техниками LLM, такими как Retrieval-Augmented Generation (RAG) и LLM-агенты
  • Уверенное владение Python и связанными с ним библиотеками и фреймворками для анализа данных
  • Навыки презентации полученных результатов
  • Опыт работы с графовыми агентами и библиотекой gpaphrag
  • Опыт работы с vllm или ollama

Технологии:

  • Python
  • LLM
  • Transformers
  • Стандартный NLP-стек
  • Стандартный ML-стек
  • Базовый SQL
  • Git
  • Векторные базы данных (Postgres+pgvector / Milvus / Qdrant / Faiss)

Желательно:

  • Знание общих подходов машинного обучения
  • Знание математической статистики
  • Опыт работы с S3
  • Linux + bash, ssh
  • Опыт письменной и устной коммуникации с бизнес-стейкхолдерами
  • Опыт полного цикла разработки

Будет плюсом:

  • Опыт разработки RestAPI
  • Snowflake
  • Docker
  • Понимание CI/CD
  • Java/C++/другие языки

Мы предлагаем:

  • Работу в динамичной международной команде
  • Официальное трудоустройство, 100% оплата больничного и отпуска
  • Возможность сотрудничества через ИП/самозанятость
  • Участие в зарубежных и российских проектах
  • Добровольное медицинское страхование с стоматологическим покрытием
  • Необходимое оборудование для работы
  • Корпоративные программы обучения
  • Широкие возможности для самореализации, профессионального и карьерного роста
  • Демократичный подход к процессам и гибкое начало рабочего дня

Ключевые навыки

  • Python
  • SQL
  • LLM
  • Standard NLP stack
  • Standard ML stack
  • Английский — B2 — Средне-продвинутый

Задайте вопрос работодателю

Он получит его с откликом на вакансию

Вакансия опубликована 17 февраля 2025 в Тбилиси

Похожие вакансии

IT-компания
У работодателя есть аккредитация