О проекте Мы разрабатываем сервис для автоматического улучшения тексты расшифровки аудио и видео через LLM. То есть, после того, как Speech-to-text модель выдает текст расшифровки, данный текст должен также проходить через LLM для улучшения факторов, как грамматика, форматирование и т.д.
Задача Основная проблема, с которой мы сталкиваемся - модель теряет контекст и снижает качество обработки на аудиофайлах (3-4 тысячи слов). Ваша задача - помочь нам решить эту проблему путем оптимизации существующих промтов, настройки параметров модели (Уточним, что модель это API решение от провайдеров OpenAI, GroqCloud или Cerebras, то есть не self-hosted).
Мы предоставим вам наши текущие промты на английском языке, для русских и английских текстов, которые детально описывают требования к обработке текста.
Что нужно будет сделать:
1. Проанализировать текущие промты: Изучить наши инструкции для AI-модели и выявить слабые места. 2. Оптимизировать промты: Предложить и внести правки в промты для повышения стабильности и качества транскрибации, особенно на длинных текстах.
Ключевые требования к результату обработки текста
Главный принцип, которым мы руководствуемся: точность и верность оригиналу превыше всего. Модель не должна быть "креативной", модель должна улучшать грамматику, орфографию, текста. Она не выступает профессиональным редактором
Что должна делать модель:
• Улучшать читаемость: Расставлять знаки препинания (точки, запятые, вопросительные знаки), исправлять пунктуационные ошибки и делить слитный текст на предложения. • Исправлять грамматику и орфографию: Корректировать очевидные ошибки и опечатки (например, "ихний" -> "их", "в течении" -> "в течение"). • Форматировать текст: Приводить в порядок капитализацию (большие буквы в начале предложений, в именах собственных), убирать лишние пробелы. • Обрабатывать слова-паразиты: Аккуратно удалять явные слова-паразиты ("ну", "э-э", "как бы"), только если они не несут смысловой нагрузки.
Чего модель НЕ должна делать (критически важно):
• Не изменять слова: Не заменять, не добавлять и не удалять слова, если это меняет смысл сказанного. • Не перефразировать: Не переписывать предложения, сохранять оригинальную структуру и стиль речи говорящего. • Не добавлять ничего от себя: В итоговом тексте должен быть только отполированный транскрипт без каких-либо комментариев или пояснений.
Кого мы ищем • Специалиста с опытом в промт-инжиниринге и пониманием принципов работы больших языковых моделей (LLM). • Специалиста, который понимает, как параметры модели влияют на конечный результат. • Опыт работы с задачами обработки текста (NLP) и/или транскрибации будет большим плюсом.