gx eae902afb3 Phase 1 smoke test зелёный: фикс frame_busy + staging buffer
После live-теста на R9-88.23 с реальным publisher'ом cam-parking
(Dahua 1920x1080 @ 25fps) выявлены и поправлены два блокера:

1) source.c: release_current_frame ПЕРЕД cuframes_subscriber_next.
   cuframes валидирует frame_busy в начале next (consumer.c:334)
   и возвращает CUFRAMES_ERR_INVALID_ARG если предыдущий frame
   не release'нут. Прошлая реализация делала release ПОСЛЕ next —
   получалось много invalid_arg и каждые ~1с поток re-subscribe'ился,
   throughput падал до 0.87 fps. После фикса — стабильные 25.1 fps.

2) nvenc.c: добавлен staging buffer cuMemAlloc + cuMemcpy2D в encode_frame.
   NVENC nvEncRegisterResource возвращает RESOURCE_REGISTER_FAILED для
   VMM-mapped указателей cuframes v0.4 (CUdeviceptr из cuMemMap).
   Это известное ограничение NVENC SDK для VMM-памяти. Pre-copy в
   собственный cuMemAlloc-буфер решает проблему и сохраняет всё в VRAM
   (cudaMemcpyDeviceToDevice, без CPU bounce). Phase 1.1 будет research
   как получить настоящий zero-copy (cuMemExportToShareableHandle?).

Smoke test результаты (cuframes-dev image + NVIDIA_DRIVER_CAPABILITIES
video, /run/cuframes mount + cuframes-ipc-anchor IPC namespace):

  300 кадров, 12 IDR, 6.9 МБ за 11.9с (25.1 fps)
  достигнут лимит 15с
  flush encoder
  ffprobe: 377 кадров, 1920x1080 yuv420p H.264 High@4.0
  ffmpeg decode → PNG/JPG → реальное изображение с камеры
2026-06-03 04:42:41 +01:00

cuframes-composer

Стандалонный композитор-демон для multi-source видео grid через CUDA + NVENC + RTSP.

Заменяет монолитный ffmpeg-конвейер (ffmpeg + vf_cuda_grid фильтр) для случаев, когда нужно:

  • Поток продолжает работать при потере любого числа источников (graceful degradation)
  • Композитор сам управляет частотой кадров и обработкой ошибок без зависимости от семантики ffmpeg-демухера
  • Минимум перемещений данных: zero-copy CUDA от источника cuframes напрямую в NVENC

Статус

Phase 1 — MVP. В разработке. Не для боевой эксплуатации.

См. дизайн-документ для архитектурных решений и поэтапного плана.

Зависимости

  • cuframes — библиотека zero-copy передачи кадров. Подключена как git submodule.
  • nv-codec-headers — MIT-licensed заголовки NVENC API. Подключена как git submodule. Сама библиотека libnvidia-encode.so грузится через dlopen при старте (это даёт LGPL-совместимость — см. дизайн-документ часть 1.6).
  • CUDA Toolkit 12.x+ (для cuda runtime и компиляции)
  • NVIDIA драйвер 525+ (для NVENC и cuMemCreate POSIX FD)
  • Linux 64-bit (POSIX shm, SCM_RIGHTS)

Дополнительно по фазам:

  • Phase 3: libfreetype (текст), lodepng через submodule (PNG-декодирование)
  • Phase 4: libzmq (управление)

Сборка

git clone --recursive git@git.goldix.org:gx/cuframes-composer.git
cd cuframes-composer
cmake -B build -G Ninja
ninja -C build

Поэтапный план

фаза срок результат
1 1 неделя один источник → NVENC → файл .h264 (доказательство zero-copy)
2 2 недели четыре источника + композиция через libcugrid
3 2 недели оверлеи + RTSP push к mediamtx + AAC passthrough из /live-audio
4 1 неделя паритет ZMQ-управления с фильтром vf_cuda_grid
5 1 неделя боевое развёртывание + MQTT health + watchdog
6 2 недели тесты + бенчмарки + документация

Итого ~9 недель для одного разработчика.

Лицензия

LGPL-2.1-or-later. См. файл LICENSE.

NVENC SDK headers (third_party/nv-codec-headers) — MIT license, совместима с LGPL.

S
Description
cuframes-composer — стандалонный композитор-демон для multi-source видео grid через CUDA + NVENC + RTSP. Замена монолитному ffmpeg + vf_cuda_grid конвейеру. Часть OSS-проекта cuframes.
Readme LGPL-2.1 1.1 MiB
Languages
C 62.1%
C++ 29.7%
Cuda 3.5%
CMake 3.2%
Dockerfile 1.5%