gx fa6ab3069a Phase 7 audio mixing — attempt + rollback + lessons
Несколько сессий попыток реализовать audio mixing в композитор'е.
Не достигнуто sub-секундной latency со стабильным video+audio.
Откатано на parallel mode (cfc-grid video-only, live от pipeline с audio).

Полный набор выводов и pitfall'ов — docs/LESSONS-audio-mixing-attempts.md.

Главные lesson'ы для будущей попытки:
- mpegts mux libavformat авто-инсёртит h264_mp4toannexb BSF которому
  не нравится Annex-B + inline SPS/PPS — NVENC OUTPUT_SPSPPS per-frame ломает
- SPSC ring drop newest при full, не oldest (consumer's domain)
- av_new_packet (не av_malloc) для av_interleaved_write_frame ownership
- Monotonic PTS на counter (frame_idx, total_samples) — не wallclock
- mediamtx env-var path names не должны иметь '-' (parser limitation)
- Default mediamtx ReadTimeout=10s короткий для burst write'ов

Изменения в repo сохранены для будущей доработки:
- src/writer.c — mpegts backend с audio stream support
- src/audio.c — RTSP AAC consumer + lock-free SPSC ring
- include/cuframes_composer/{writer,audio}.h — public API
- examples/grid_record.c — --format=mpegts + --audio-source flags
- include/cuframes_composer/composer.h — consumer_prefix field
- docker/Dockerfile — libavformat-dev добавлен в builder/runtime

cfc-grid composer стабильно работает на видео (substantially лучше
монолитного pipeline'а с audio bag'ом). TV рекомендуется использовать
rtsp://...:554/cfc-grid + опционально rtsp://...:554/live-audio
parallel.
2026-06-03 14:29:56 +01:00

cuframes-composer

Стандалонный композитор-демон для multi-source видео grid через CUDA + NVENC + RTSP.

Заменяет монолитный ffmpeg-конвейер (ffmpeg + vf_cuda_grid фильтр) для случаев, когда нужно:

  • Поток продолжает работать при потере любого числа источников (graceful degradation)
  • Композитор сам управляет частотой кадров и обработкой ошибок без зависимости от семантики ffmpeg-демухера
  • Минимум перемещений данных: zero-copy CUDA от источника cuframes напрямую в NVENC

Статус

Phase 1 — MVP. В разработке. Не для боевой эксплуатации.

См. дизайн-документ для архитектурных решений и поэтапного плана.

Зависимости

  • cuframes — библиотека zero-copy передачи кадров. Подключена как git submodule.
  • nv-codec-headers — MIT-licensed заголовки NVENC API. Подключена как git submodule. Сама библиотека libnvidia-encode.so грузится через dlopen при старте (это даёт LGPL-совместимость — см. дизайн-документ часть 1.6).
  • CUDA Toolkit 12.x+ (для cuda runtime и компиляции)
  • NVIDIA драйвер 525+ (для NVENC и cuMemCreate POSIX FD)
  • Linux 64-bit (POSIX shm, SCM_RIGHTS)

Дополнительно по фазам:

  • Phase 3: libfreetype (текст), lodepng через submodule (PNG-декодирование)
  • Phase 4: libzmq (управление)

Сборка

git clone --recursive git@git.goldix.org:gx/cuframes-composer.git
cd cuframes-composer
cmake -B build -G Ninja
ninja -C build

Поэтапный план

фаза срок результат
1 1 неделя один источник → NVENC → файл .h264 (доказательство zero-copy)
2 2 недели четыре источника + композиция через libcugrid
3 2 недели оверлеи + RTSP push к mediamtx + AAC passthrough из /live-audio
4 1 неделя паритет ZMQ-управления с фильтром vf_cuda_grid
5 1 неделя боевое развёртывание + MQTT health + watchdog
6 2 недели тесты + бенчмарки + документация

Итого ~9 недель для одного разработчика.

Лицензия

LGPL-2.1-or-later. См. файл LICENSE.

NVENC SDK headers (third_party/nv-codec-headers) — MIT license, совместима с LGPL.

S
Description
cuframes-composer — стандалонный композитор-демон для multi-source видео grid через CUDA + NVENC + RTSP. Замена монолитному ffmpeg + vf_cuda_grid конвейеру. Часть OSS-проекта cuframes.
Readme LGPL-2.1 1.1 MiB
Languages
C 62.1%
C++ 29.7%
Cuda 3.5%
CMake 3.2%
Dockerfile 1.5%