Есть проект, весь код написан нейронкой. Ищу сильного специалиста по C++, CUDA и high-performance optimization для ускорения собственной симуляционной системы. Система уже работает и написана на C++. Это не нейросеть в классическом виде, а point-based / graph-based движок симуляции: объекты представлены наборами точек, состояние объектов хранится по точкам, переходы между состояниями зависят от локальных условий взаимодействия между объектами. Сейчас система уже умеет воспроизводить сложные многотельные сцены на сотни шагов, но работает слишком медленно.
-C++-кодовая база -собственный rollout / training pipeline. -объекты представлены фиксированными точками. -условия переходов строятся по ближайшим парам точек между объектами. -система уже воспроизводит взаимодействия нескольких объектов. -часть GPU-инфраструктуры уже есть, но архитектура пока в основном упирается в CPU и общую неэффективность.
Что нужно сделать:
-провести аудит производительности всей архитектуры -найти основные bottleneck’и в training и rollout -перенести самые тяжёлые части вычислений на GPU -максимально ускорить систему end-to-end -по возможности улучшить memory layout, структуры данных, алгоритмы поиска ближайших точек и переходов -предложить и реализовать архитектурные оптимизации, а не только “локальные микрофиксы”
Ожидаемый профиль исполнителя:
-уверенный C++ -хороший практический опыт CUDA / GPGPU -опыт оптимизации тяжёлых вычислительных систем -понимание HPC, memory bandwidth, cache locality, parallel algorithms -опыт с физическими симуляциями, particle systems, point clouds, geometry processing или real-time / offline simulation
Важно:
-нужен именно инженер, который сможет глубоко разобраться в существующей архитектуре и предложить лучший путь ускорения -интересует не просто “переписать кусок на CUDA”, а добиться реального ускорения всей системы -желательно уметь объяснять решения и работать итеративно: сначала аудит и план ускорения, потом реализация
В отклике прошу написать:
-какой у вас опыт в C++/CUDA оптимизации -был ли опыт с симуляциями / point clouds / geometry / physics systems -как вы обычно подходите к поиску bottleneck’ов -примеры похожих задач, если есть