Aduc-sdr-2_5

Paused

App Files Files Community

carlex3321 commited on Sep 29

Commit

316b67d

verified ·

1 Parent(s): 6f11d0a

Upload 6 files

Browse files

Files changed (6) hide show

Dockerfile +85 -148
app_vince.py +194 -0
builder.sh +205 -0
info.sh +113 -0
requirements.txt +36 -51
start.sh +67 -89

Dockerfile CHANGED Viewed

@@ -1,93 +1,70 @@
 # =============================================================================
-# DOCKERFILE - ADUC-SDR: AI Video Suite v4.1.0
-# Base: CUDA 12.8.0 | PyTorch 2.8.0+cu128
-# Otimizado para Hugging Face Spaces com 8x NVIDIA L40S GPUs
 # =============================================================================
-# Base CUDA 12.8.0
 FROM nvidia/cuda:12.8.0-devel-ubuntu22.04
-# =============================================================================
-# METADADOS
-# =============================================================================
 LABEL maintainer="Carlos Rodrigues dos Santos & Development Partner"
-LABEL description="ADUC-SDR: Production-Ready Multi-GPU AI Video Generation Suite with Wan2.2, SeedVR, LTX, MMAudio"
-LABEL version="4.1.0"
 LABEL cuda_version="12.8.0"
 LABEL python_version="3.10"
 LABEL pytorch_version="2.8.0+cu128"
 LABEL gpu_optimized_for="8x_NVIDIA_L40S"
-# Otimizações específicas do sistema
-ENV OMP_NUM_THREADS=8
-ENV MKL_NUM_THREADS=8
 ENV CUDA_VISIBLE_DEVICES=0,1,2,3,4,5,6,7
 ENV CUDA_DEVICE_MAX_CONNECTIONS=32
-# Cache e Memory Management
-# Unificar PYTORCH_CUDA_ALLOC_CONF em uma linha
-ENV PYTORCH_CUDA_ALLOC_CONF=max_split_size_mb:512,garbage_collection_threshold:0.8
 ENV CUDA_MODULE_LOADING=LAZY
-ENV CUDA_DEVICE_MAX_CONNECTIONS=32
-ENV CUDA_DEVICE_ORDER=PCI_BUS_ID
-# Constantes de Performance para Build
-ENV CUDA_CACHE_MAXSIZE=2147483648
-ENV CUDA_CACHE_DISABLE=0
-ENV TORCH_HOME=/app/.cache/torch
-ENV HF_HOME=/app/.cache/huggingface
-ENV HF_DATASETS_CACHE=/app/.cache/datasets
-# Constantes de Memory Management
 ENV PYTORCH_CUDA_ALLOC_CONF=max_split_size_mb:512,garbage_collection_threshold:0.8
-ENV CUDA_LAUNCH_BLOCKING=0
-ENV CUDA_DEVICE_ORDER=PCI_BUS_ID
-# Constantes de Model Loading
-ENV TRANSFORMERS_CACHE=/app/.cache/transformers
-ENV DIFFUSERS_CACHE=/app/.cache/diffusers
-ENV MODEL_CACHE_STRATEGY=aggressive
-# Melhorias de cache/download
 ENV HF_HOME=/app/.cache/huggingface
 ENV TRANSFORMERS_CACHE=/app/.cache/transformers
 ENV DIFFUSERS_CACHE=/app/.cache/diffusers
-ENV HF_DATASETS_CACHE=/app/.cache/datasets
 ENV HF_HUB_ENABLE_HF_TRANSFER=1
 ENV TOKENIZERS_PARALLELISM=false
-# =============================================================================
-# VARIÁVEIS DE AMBIENTE GLOBAIS
-# =============================================================================
-ENV DEBIAN_FRONTEND=noninteractive
-ENV TZ=UTC
-ENV LANG=C.UTF-8
-ENV LC_ALL=C.UTF-8
-ENV PYTHONUNBUFFERED=1
-ENV PYTHONDONTWRITEBYTECODE=1
-ENV PIP_NO_CACHE_DIR=1
-ENV PIP_DISABLE_PIP_VERSION_CHECK=1
-# Otimizações de CUDA e Build
-ENV NVIDIA_VISIBLE_DEVICES=all
-#ENV NVIDIA_DRIVER_CAPABILITIES=compute,utility
-ENV TORCH_CUDA_ARCH_LIST="8.9"
-ENV MAX_JOBS=90
-# Caminhos da Aplicação
-ENV APP_HOME=/app
-WORKDIR $APP_HOME
-# =============================================================================
-# PACOTES DO SISTEMA E PYTHON 3.10
-# =============================================================================
-RUN apt-get update && \
-    apt-get install -y --no-install-recommends \
     build-essential cmake git git-lfs curl wget ffmpeg ninja-build \
     python3.10 python3.10-dev python3.10-distutils python3-pip \
     && apt-get clean && rm -rf /var/lib/apt/lists/*
@@ -96,105 +73,65 @@ RUN ln -sf /usr/bin/python3.10 /usr/bin/python3 && \
     ln -sf /usr/bin/python3.10 /usr/bin/python && \
     python3 -m pip install --upgrade pip
-# =============================================================================
-# INSTALAÇÃO DE BIBLIOTECAS DE ALTA PERFORMANCE
-# =============================================================================
-# 1. Instala PyTorch 2.8.0 e ferramentas de build
-RUN pip -v install \
-    torch>=2.8.0+cu128 \
-    torchvision \
-    torchaudio \
-    --index-url https://download.pytorch.org/whl/cu128
-RUN pip install  \
-    packaging \
-    ninja \
-    cmake \
-    pybind11 \
-    scikit-build \
-    cython \
-    hf_transfer \
-    numpy==1.24.4
-# =============================================================================
-# CLONAGEM E INSTALAÇÃO DOS REPOSITÓRIOS DA APLICAÇÃO
-# =============================================================================
-#RUN git clone https://github.com/Wan-Video/Wan2.2.git && \
-#    #cd Wan2.2 && pip install -v -r requirements.txt && pip install -v -r requirements_s2v.txt && cd .. && \
-#    echo "Copiando 'wan' para /app/wan..." && \
-#    cp -r Wan2.2/wan /app/wan
-# VINCIE
 RUN git clone https://github.com/bytedance-seed/VINCIE.git && \
-    #cd VINCIE && pip install -v -r requirements.txt && cd .. && \
-    #echo "Copiando módulos do SeedVR para /app/..." && \
-    #cp /VINCIE/generate.py /app/VINCIE/ 2>/dev/null || echo "vincie_service.py não encontrado"
-    #cp -r VINCIE /app/VINCIE && \
-    #cp -r VINCIE/projects /app/projects && \
-    #cp -r VINCIE/data /app/data && \
     cp -r VINCIE/configs/. /app/configs/
-# SeedVR
 RUN git clone https://github.com/bytedance-seed/SeedVR.git && \
-    #cd SeedVR && pip install -v -r requirements.txt && cd .. && \
-    #echo "Copiando módulos do SeedVR para /app/..." && \
-    #cp -r SeedVR/common /app/common && \
-    #cp -r SeedVR/projects /app/projects && \
-    #cp -r SeedVR/data /app/data && \
-    cp -r SeedVR/configs_3b /app/configs_3b
-# MMAudio
 RUN git clone https://github.com/hkchengrex/MMAudio.git && \
-  #  cd MMAudio && pip install -v -e . && cd .. && \
-    echo "Copiando 'mmaudio' para /app/mmaudio..." && \
-    cp -r MMAudio/mmaudio /app/mmaudio
-# LTX-Video
 RUN git clone https://github.com/Lightricks/LTX-Video.git && \
-    #cd LTX-Video && pip install -v -e .[inference] && cd .. && \
-    echo "Copiando 'ltx_video' para /app/ltx_video..." && \
-    cp -r LTX-Video/ltx_video /app/ltx_video
-# opcionais
-RUN pip uninstall -y bitsandbytes triton && \
-    pip install -v  bitsandbytes --index-url https://pypi.org/simple/ && \
-    pip install -v  triton
-# =============================================================================
-# INSTALAÇÃO DO RESTANTE DAS DEPENDÊNCIAS
-# =============================================================================
-COPY requirements.txt .
-# Instala os pacotes restantes do requirements.txt
-# A linha do flash-attention no arquivo será ignorada se já estiver instalado, mas é bom limpá-la.
-RUN pip install -r requirements.txt
-# PyTorch cu128 (fixar versões consistentes do mesmo canal)
-RUN pip install --index-url https://download.pytorch.org/whl/cu128 \
-    torch==2.8.0+cu128 torchvision>=0.19.0+cu128 torchaudio>=2.8.0+cu128
-# =============================================================================
-# COPIA O CÓDIGO DA APLICAÇÃO E CONFIGURA PERMISSÕES
-# =============================================================================
 COPY . .
-RUN useradd -m -u 1000 -s /bash appuser && \
-    chown -R appuser:appuser $APP_HOME && \
-    mkdir -p /app && chown -R appuser:appuser /app
 USER appuser
-# =============================================================================
-# PONTO DE ENTRADA
-# =============================================================================
-RUN chmod +x ./start.sh
 ENTRYPOINT ["./start.sh"]
-CMD ["gradio"]

 # =============================================================================
+# ADUC-SDR Video Suite — High-Perf Diffusers for 8× L40S (SM 8.9)
+# CUDA 12.8 | PyTorch 2.8.0+cu128 | Ubuntu 22.04
 # =============================================================================
 FROM nvidia/cuda:12.8.0-devel-ubuntu22.04
 LABEL maintainer="Carlos Rodrigues dos Santos & Development Partner"
+LABEL description="High-performance Diffusers stack with FA2/SDPA, 8×L40S"
+LABEL version="4.4.0"
 LABEL cuda_version="12.8.0"
 LABEL python_version="3.10"
 LABEL pytorch_version="2.8.0+cu128"
 LABEL gpu_optimized_for="8x_NVIDIA_L40S"
+# ---------------- Core env & caches ----------------
+ENV DEBIAN_FRONTEND=noninteractive TZ=UTC LANG=C.UTF-8 LC_ALL=C.UTF-8 \
+    PYTHONUNBUFFERED=1 PYTHONDONTWRITEBYTECODE=1 \
+    PIP_NO_CACHE_DIR=1 PIP_DISABLE_PIP_VERSION_CHECK=1
+# GPU/Compute
+ENV NVIDIA_VISIBLE_DEVICES=all
 ENV CUDA_VISIBLE_DEVICES=0,1,2,3,4,5,6,7
+ENV TORCH_CUDA_ARCH_LIST="8.9"
+ENV CUDA_DEVICE_ORDER=PCI_BUS_ID
 ENV CUDA_DEVICE_MAX_CONNECTIONS=32
 ENV CUDA_MODULE_LOADING=LAZY
+# Threads
+ENV OMP_NUM_THREADS=8 MKL_NUM_THREADS=8 MAX_JOBS=48
+# Alloc/caches
 ENV PYTORCH_CUDA_ALLOC_CONF=max_split_size_mb:512,garbage_collection_threshold:0.8
+ENV CUDA_LAUNCH_BLOCKING=0 CUDA_CACHE_MAXSIZE=2147483648 CUDA_CACHE_DISABLE=0
+# NCCL single-node sane defaults (use IB=1/IFNAME em clusters com IB)
+ENV NCCL_DEBUG=INFO NCCL_ASYNC_ERROR_HANDLING=1 NCCL_P2P_DISABLE=0 NCCL_IB_DISABLE=1 \
+    NCCL_MIN_NCHANNELS=8 NCCL_NTHREADS=256 NCCL_SOCKET_IFNAME=lo
+# Hugging Face caches
+ENV APP_HOME=/app
+WORKDIR $APP_HOME
+ENV TORCH_HOME=/app/.cache/torch
 ENV HF_HOME=/app/.cache/huggingface
+ENV HF_DATASETS_CACHE=/app/.cache/datasets
 ENV TRANSFORMERS_CACHE=/app/.cache/transformers
 ENV DIFFUSERS_CACHE=/app/.cache/diffusers
 ENV HF_HUB_ENABLE_HF_TRANSFER=1
 ENV TOKENIZERS_PARALLELISM=false
+# FlashAttention / SDPA defaults
+ENV FLASH_ATTENTION_DISABLE=0 \
+    FLASH_ATTENTION_FORCE_FP16=1 \
+    ATTN_FORCE_F16=1 \
+    ENABLE_FLASH_SDP=1 \
+    ENABLE_MEMORY_EFFICIENT_SDP=1 \
+    ENABLE_MATH_SDP=0 \
+    XFORMERS_FORCE_DISABLE=1 \
+    TORCH_DTYPE=bfloat16 \
+    NVIDIA_TF32_OVERRIDE=0 \
+    FA_LOG_LEVEL=WARNING
+# Link de modelos
+ENV MODELS_DIR=/app/models
+RUN mkdir -p /home/user/.cache/models && ln -sf /home/user/.cache/models /app/models
+# ---------------- Sistema & Python ----------------
+RUN apt-get update && apt-get install -y --no-install-recommends \
     build-essential cmake git git-lfs curl wget ffmpeg ninja-build \
     python3.10 python3.10-dev python3.10-distutils python3-pip \
     && apt-get clean && rm -rf /var/lib/apt/lists/*
     ln -sf /usr/bin/python3.10 /usr/bin/python && \
     python3 -m pip install --upgrade pip
+# ---------------- PyTorch cu128 (pinado) ----------------
+RUN pip install --index-url https://download.pytorch.org/whl/cu128 \
+    torch==2.8.0+cu128 torchvision==0.23.0+cu128 torchaudio==2.8.0+cu128
+# ---------------- Toolchain, Triton, FA2 (sem bnb) ----------------
+RUN pip install packaging ninja cmake pybind11 scikit-build cython hf_transfer numpy==1.24.4
+# Triton 3.x (sem triton.ops)
+RUN pip uninstall -y triton || true && \
+    pip install -v --no-build-isolation triton==3.4.0
+# FlashAttention 2.8.x
+RUN pip install flash-attn==2.8.3 --no-build-isolation || \
+    pip install flash-attn==2.8.2 --no-build-isolation || \
+    pip install flash-attn==2.8.1 --no-build-isolation || \
+    pip install flash-attn==2.8.0.post2 --no-build-isolation
+# Diffusers/Transformers estáveis (sem dev)
+RUN pip install --no-cache-dir diffusers==0.31.0 transformers==4.44.2 accelerate==0.34.2 omegaconf==2.3.0
+# Opcional: seu fork de otimizações
+# RUN pip install -U git+https://github.com/carlex22/diffusers-aduc-sdr
+# ---------------- Repositórios auxiliares ----------------
 RUN git clone https://github.com/bytedance-seed/VINCIE.git && \
     cp -r VINCIE/configs/. /app/configs/
+# Exemplos adicionais (descomente se precisar)
 RUN git clone https://github.com/bytedance-seed/SeedVR.git && \
+    cp -r SeedVR/configs_3b /app/configs_3b
 RUN git clone https://github.com/hkchengrex/MMAudio.git && \
+    cp -r MMAudio/mmaudio /app/mmaudio
 RUN git clone https://github.com/Lightricks/LTX-Video.git && \
+    cp -r LTX-Video/ltx_video /app/ltx_video
+# ---------------- Dependências da aplicação ----------------
+COPY requirements.txt ./requirements.txt
+RUN pip install --no-cache-dir -r requirements.txt
+# Scripts e configs
+COPY info.sh ./info.sh
+COPY start.sh ./start.sh
+COPY /configs ./configs
+# ---------------- Código e permissões ----------------
 COPY . .
+RUN useradd -m -u 1000 -s /bin/bash appuser && \
+    chown -R appuser:appuser /app && \
+    chmod 0755 /app/start.sh /app/info.sh || true
 USER appuser
+# ---------------- Entry ----------------
 ENTRYPOINT ["./start.sh"]
+CMD ["gradio"]

app_vince.py ADDED Viewed

	@@ -0,0 +1,194 @@

+#!/usr/bin/env python3
+"""
+VINCIE Service UI (Gradio) - Versão Final com Suporte a Multi-GPU
+- Interface com 3 abas: Edição Multi-Turno, Texto-para-Vídeo e Composição Multi-Conceito.
+- Controles avançados na UI, incluindo seleção de número de GPUs e tamanho do lote (batch size).
+- Configuração automática no carregamento da aplicação.
+- Projetado para hardware de ponta como 8x L40S.
+- Modelo funcional de referência: ByteDance-Seed/VINCIE.
+- Interface desenvolvida por Carlex ([email protected]).
+"""
+import os
+from pathlib import Path
+from typing import List, Tuple, Optional
+import gradio as gr
+# Adapte este import para o layout do seu projeto, se necessário.
+from services.vincie import VincieService
+# --- Instanciação do Serviço e Constantes ---
+svc = VincieService()
+DEFAULT_NEGATIVE_PROMPT = "Worst quality, Normal quality, Low quality, Low res, Blurry, Jpeg artifacts, Grainy, text, logo, watermark, banner, extra digits, signature, subtitling, Bad anatomy, Bad proportions, Deformed, Disconnected limbs, Disfigured, Extra arms, Extra limbs, Extra hands, Fused fingers, Gross proportions, Long neck, Malformed limbs, Mutated, Mutated hands, Mutated limbs, Missing arms, Missing fingers, Poorly drawn hands, Poorly drawn face, Nsfw, Uncensored, Cleavage, Nude, Nipples, Overexposed, Plain background, Grainy, Underexposed, Deformed structures"
+# --- Funções Helper ---
+def setup_auto() -> str:
+    """
+    Executa uma configuração idempotente no carregamento da interface.
+    Retorna uma string de status para a UI.
+    """
+    try:
+        svc.ensure_repo()
+        svc.ensure_model()
+        return "Configuração concluída com sucesso: repositório e checkpoint estão prontos."
+    except Exception as e:
+        # Fornece um feedback de erro mais detalhado para depuração
+        import traceback
+        print(traceback.format_exc())
+        return f"A configuração encontrou um erro: {e}"
+def _list_media(out_dir: Path, max_images: int = 24) -> Tuple[List[str], Optional[str]]:
+    """
+    Enumera as imagens resultantes e o vídeo mais recente de um diretório de saída.
+    """
+    img_globs = ("*.png", "*.jpg", "*.jpeg", "*.webp")
+    # Usa rglob para encontrar imagens em subdiretórios e ordena por tempo de modificação
+    images = sorted(
+        [p for pat in img_globs for p in out_dir.rglob(pat)],
+        key=lambda p: p.stat().st_mtime
+    )
+    image_paths = [str(p) for p in images[-max_images:]]
+    videos = sorted(out_dir.rglob("*.mp4"), key=lambda p: p.stat().st_mtime)
+    video_path = str(videos[-1]) if videos else None
+    return image_paths, video_path
+# --- Funções Handler da UI (com todos os parâmetros) ---
+def ui_multi_turn(input_image, turns_text, negative_prompt, seed, steps, cfg_scale, resolution, use_vae_slicing, num_gpus, batch_size):
+    """Handler para a aba de Edição Multi-Turno."""
+    if not input_image:
+        return [], None, "Por favor, forneça uma imagem de entrada."
+    if not turns_text or not turns_text.strip():
+        return [], None, "Por favor, forneça as instruções de edição (uma por linha)."
+    turns = [ln.strip() for ln in turns_text.splitlines() if ln.strip()]
+    try:
+        out_dir = svc.multi_turn_edit(
+            input_image, turns,
+            negative_prompt=negative_prompt, seed=int(seed), steps=int(steps),
+            cfg_scale=float(cfg_scale), resolution=int(resolution), use_vae_slicing=use_vae_slicing,
+            num_gpus=int(num_gpus), batch_size=int(batch_size)
+        )
+        imgs, vid = _list_media(Path(out_dir))
+        return imgs, vid, f"Saídas salvas em: {out_dir}"
+    except Exception as e:
+        import traceback
+        print(traceback.format_exc())
+        return [], None, f"Erro na geração: {e}"
+def ui_text_to_video(input_image, prompt, negative_prompt, seed, steps, cfg_scale, resolution, fps, use_vae_slicing, num_gpus, batch_size):
+    """Handler para a aba de Texto-para-Vídeo."""
+    if not input_image:
+        return None, "Por favor, forneça uma imagem de entrada (frame inicial)."
+    if not prompt or not prompt.strip():
+        return None, "Por favor, forneça um prompt para o vídeo."
+    try:
+        out_dir = svc.text_to_video(
+            input_image, prompt,
+            negative_prompt=negative_prompt, seed=int(seed), steps=int(steps),
+            cfg_scale=float(cfg_scale), resolution=int(resolution), fps=int(fps), use_vae_slicing=use_vae_slicing,
+            num_gpus=int(num_gpus), batch_size=int(batch_size)
+        )
+        _, vid = _list_media(Path(out_dir))
+        return vid, f"Vídeo salvo em: {out_dir}"
+    except Exception as e:
+        import traceback
+        print(traceback.format_exc())
+        return None, f"Erro na geração: {e}"
+def ui_multi_concept(files, descs_text, final_prompt):
+    """Handler para a aba de Composição Multi-Conceito."""
+    if not files: return [], None, "Por favor, faça o upload das imagens de conceito."
+    if not descs_text: return [], None, "Por favor, forneça as descrições (uma por linha)."
+    if not final_prompt: return [], None, "Por favor, forneça um prompt final."
+    descs = [ln.strip() for ln in descs_text.splitlines() if ln.strip()]
+    if len(descs) != len(files): return [], None, f"O número de descrições ({len(descs)}) deve ser igual ao de imagens ({len(files)})."
+    try:
+        out_dir = svc.multi_concept_compose(files, descs, final_prompt)
+        imgs, vid = _list_media(Path(out_dir))
+        return imgs, vid, f"Saídas salvas em: {out_dir}"
+    except Exception as e:
+        import traceback
+        print(traceback.format_exc())
+        return [], None, f"Erro na geração: {e}"
+# --- Definição da Interface Gradio Completa ---
+with gr.Blocks(title="VINCIE Service", theme=gr.themes.Soft()) as demo:
+    gr.Markdown("# VINCIE Service — Geração Distribuída com Controles Avançados")
+    gr.Markdown("- **Interface por:** Carlex ([email protected] | GitHub: carlex22)")
+    with gr.Row():
+        setup_out = gr.Textbox(label="Status da Configuração", interactive=False)
+    with gr.Tab("Edição Multi-Turno"):
+        with gr.Row():
+            img_mt = gr.Image(type="filepath", label="Imagem de Entrada")
+            with gr.Column():
+                turns_mt = gr.Textbox(lines=5, label="Instruções de Edição (uma por linha)", placeholder="Ex: adicione um chapéu azul\nagora, mude o fundo para uma praia")
+                with gr.Accordion("Configurações Avançadas e de Desempenho", open=True):
+                    with gr.Row():
+                        num_gpus_mt = gr.Slider(label="Número de GPUs", minimum=1, maximum=8, step=1, value=8, info="Use >1 para acelerar a geração com torchrun.")
+                        batch_size_mt = gr.Number(label="Batch Size por GPU", value=1, precision=0, info="Para Multi-GPU, o lote total será (GPUs x Batch Size).")
+                    resolution_mt = gr.Slider(label="Resolução", minimum=256, maximum=1024, step=128, value=512, info="Maior resolução exige mais VRAM e tempo.")
+                    use_vae_slicing_mt = gr.Checkbox(label="Usar VAE Slicing (Economiza VRAM)", value=True)
+                    neg_prompt_mt = gr.Textbox(lines=3, label="Prompt Negativo", value=DEFAULT_NEGATIVE_PROMPT)
+                    seed_mt = gr.Number(label="Seed (Semente)", value=1, precision=0)
+                    steps_mt = gr.Slider(label="Passos de Inferência", minimum=10, maximum=100, step=1, value=50, info="Menos passos = mais rápido.")
+                    cfg_mt = gr.Slider(label="Escala de Orientação (CFG)", minimum=1.0, maximum=20.0, step=0.5, value=7.5, info="Quão forte o modelo segue o prompt.")
+        run_mt = gr.Button("Executar Edição Multi-Turno", variant="primary")
+        gallery_mt = gr.Gallery(label="Imagens Geradas", columns=4, height="auto")
+        video_mt = gr.Video(label="Vídeo da Sequência (se disponível)")
+        status_mt = gr.Textbox(label="Status da Saída", interactive=False)
+        run_mt.click(ui_multi_turn,
+                     inputs=[img_mt, turns_mt, neg_prompt_mt, seed_mt, steps_mt, cfg_mt, resolution_mt, use_vae_slicing_mt, num_gpus_mt, batch_size_mt],
+                     outputs=[gallery_mt, video_mt, status_mt])
+    with gr.Tab("Texto-para-Vídeo"):
+        with gr.Row():
+            img_vid = gr.Image(type="filepath", label="Frame Inicial")
+            with gr.Column():
+                prompt_vid = gr.Textbox(lines=2, label="Prompt do Vídeo", placeholder="Ex: um gato andando pela sala")
+                with gr.Accordion("Configurações Avançadas e de Desempenho", open=True):
+                    with gr.Row():
+                        num_gpus_vid = gr.Slider(label="Número de GPUs", minimum=1, maximum=8, step=1, value=8, info="Use >1 para acelerar a geração com torchrun.")
+                        batch_size_vid = gr.Number(label="Batch Size por GPU", value=1, precision=0, info="Para Multi-GPU, o lote total será (GPUs x Batch Size).")
+                    resolution_vid = gr.Slider(label="Resolução", minimum=256, maximum=1024, step=128, value=512)
+                    fps_vid = gr.Slider(label="Frames por Segundo (FPS)", minimum=1, maximum=24, step=1, value=2)
+                    use_vae_slicing_vid = gr.Checkbox(label="Usar VAE Slicing (Economiza VRAM)", value=True)
+                    neg_prompt_vid = gr.Textbox(lines=3, label="Prompt Negativo", value=DEFAULT_NEGATIVE_PROMPT)
+                    seed_vid = gr.Number(label="Seed (Semente)", value=1, precision=0)
+                    steps_vid = gr.Slider(label="Passos de Inferência", minimum=10, maximum=100, step=1, value=50)
+                    cfg_vid = gr.Slider(label="Escala de Orientação (CFG)", minimum=1.0, maximum=20.0, step=0.5, value=7.5)
+        run_vid = gr.Button("Gerar Vídeo", variant="primary")
+        video_vid = gr.Video(label="Vídeo Gerado")
+        status_vid = gr.Textbox(label="Status da Saída", interactive=False)
+        run_vid.click(ui_text_to_video,
+                      inputs=[img_vid, prompt_vid, neg_prompt_vid, seed_vid, steps_vid, cfg_vid, resolution_vid, fps_vid, use_vae_slicing_vid, num_gpus_vid, batch_size_vid],
+                      outputs=[video_vid, status_vid])
+    with gr.Tab("Composição Multi-Conceito"):
+        gr.Markdown("Nota: A composição multi-conceito está atualmente configurada para rodar em uma única GPU para garantir estabilidade.")
+        with gr.Row():
+            with gr.Column(scale=1):
+                files_mc = gr.File(file_count="multiple", type="filepath", label="1. Imagens de Conceito")
+            with gr.Column(scale=2):
+                descs_mc = gr.Textbox(lines=5, label="2. Descrições (uma por linha, na mesma ordem)", placeholder="Ex: <IMG1>: uma foto de um pai\n<IMG2>: uma foto de uma mãe...")
+                final_prompt_mc = gr.Textbox(lines=3, label="3. Prompt Final de Composição", placeholder="Ex: Baseado em <IMG0>, <IMG1>..., uma família sorrindo em um retrato...")
+        run_mc = gr.Button("Executar Composição", variant="primary")
+        gallery_mc = gr.Gallery(label="Imagens Geradas", columns=4, height="auto")
+        video_mc = gr.Video(label="Vídeo da Sequência (se disponível)")
+        status_mc = gr.Textbox(label="Status da Saída", interactive=False)
+        run_mc.click(ui_multi_concept,
+                     inputs=[files_mc, descs_mc, final_prompt_mc],
+                     outputs=[gallery_mc, video_mc, status_mc])
+    # Gatilho de configuração automática no carregamento
+    demo.load(fn=setup_auto, outputs=setup_out)
+if __name__ == "__main__":
+    demo.launch(
+        server_name="0.0.0.0",
+        server_port=int(os.getenv("PORT", "7860")),
+    )

builder.sh ADDED Viewed

	@@ -0,0 +1,205 @@

+#!/usr/bin/env bash
+set -euo pipefail
+echo "🚀 Builder (Apex + Q8) — roda em runtime com GPU visível"
+# ===== Config e diretórios =====
+export SELF_HF_REPO_ID="${SELF_HF_REPO_ID:-carlex3321/aduc-sdr}"   # Model repo no HF com wheels
+export HF_HOME="${HF_HOME:-/app/model_cache}"
+export HF_HUB_CACHE="${HF_HUB_CACHE:-$HF_HOME/hub}"
+export TORCH_HOME="${TORCH_HOME:-$HF_HOME/torch}"
+export HF_HUB_ENABLE_HF_TRANSFER="${HF_HUB_ENABLE_HF_TRANSFER:-1}"
+export PATH="$HOME/.local/bin:$PATH"
+mkdir -p /app/wheels /app/cuda_cache "$HF_HOME" "$TORCH_HOME" /app/wheels/src
+chmod -R 777 /app/wheels || true
+export CUDA_CACHE_PATH="/app/cuda_cache"
+if [ -f "/NGC-DL-CONTAINER-LICENSE" ]; then
+  cp -f /NGC-DL-CONTAINER-LICENSE /app/wheels/NGC-DL-CONTAINER-LICENSE || true
+fi
+# ===== Dependências mínimas =====
+python -m pip install -v -U pip build setuptools wheel hatchling hatch-vcs scikit-build-core cmake ninja packaging "huggingface_hub[hf_transfer]" || true
+# ===== Tags de ambiente (Python/CUDA/Torch) =====
+PY_TAG="$(python -c 'import sys; print(f"cp{sys.version_info[0]}{sys.version_info[1]}")' 2>/dev/null || echo cp310)"
+TORCH_VER="$(python - <<'PY'
+try:
+    import torch, re
+    v = torch.__version__
+    print(re.sub(r'\+.*$', '', v))
+except Exception:
+    print("unknown")
+PY
+)"
+CU_TAG="$(python - <<'PY'
+try:
+    import torch
+    cu = getattr(torch.version, "cuda", None)
+    print("cu"+cu.replace(".","")) if cu else print("")
+except Exception:
+    print("")
+PY
+)"
+echo "[env] PY_TAG=${PY_TAG} TORCH_VER=${TORCH_VER} CU_TAG=${CU_TAG}"
+# ===== Checkers =====
+check_apex() {
+python - <<'PY'
+try:
+    from apex.normalization import FusedLayerNorm, FusedRMSNorm
+    import importlib; importlib.import_module("fused_layer_norm_cuda")
+    ok = True
+except Exception:
+    ok = False
+raise SystemExit(0 if ok else 1)
+PY
+}
+check_q8() {
+python - <<'PY'
+import importlib.util
+spec = importlib.util.find_spec("ltx_q8_kernels") or importlib.util.find_spec("q8_kernels")
+raise SystemExit(0 if spec else 1)
+PY
+}
+# ===== Download do Hub =====
+install_from_hf () {
+  local PKG="$1"    # 'apex' ou 'q8_kernels'
+  echo "[hub] Verificando wheel de ${PKG} no repositório ${SELF_HF_REPO_ID}"
+  python - "$PKG" "$PY_TAG" "$CU_TAG" <<'PY' || exit 0
+import os, sys
+from huggingface_hub import HfApi, hf_hub_download, HfFolder
+pkg, py_tag, cu_tag = sys.argv[1], sys.argv[2], sys.argv[3]
+repo = os.environ.get("SELF_HF_REPO_ID","carlex3321/aduc-sdr")
+api = HfApi(token=os.getenv("HF_TOKEN") or HfFolder.get_token())
+try:
+    files = api.list_repo_files(repo_id=repo, repo_type="model")
+except Exception:
+    raise SystemExit(0)
+cands = [f for f in files if f.endswith(".whl") and f.rsplit("/",1)[-1].startswith(pkg+"-") and py_tag in f]
+pref  = [f for f in cands if cu_tag and cu_tag in f] or cands
+if not pref:
+    raise SystemExit(0)
+target = sorted(pref, reverse=True)[0]
+print(target)
+path = hf_hub_download(repo_id=repo, filename=target, repo_type="model", local_dir="/app/wheels")
+print(path)
+PY
+}
+# ===== Builders =====
+build_apex () {
+  local SRC="/app/wheels/src/apex"
+  echo "[build] Preparando fonte Apex em ${SRC}"
+  if [ -d "$SRC/.git" ]; then
+    git -C "$SRC" fetch --all -p || true
+    git -C "$SRC" reset --hard HEAD || true
+    git -C "$SRC" clean -fdx || true
+  else
+    rm -rf "$SRC"
+    git clone --depth 1 https://github.com/NVIDIA/apex "$SRC"
+  fi
+  echo "[build] Compilando Apex -> wheel"
+  export APEX_CPP_EXT=1 APEX_CUDA_EXT=1 APEX_ALL_CONTRIB_EXT=0
+  python -m pip wheel -v --no-build-isolation --no-deps "$SRC" -w /app/wheels || true
+  local W="$(ls -t /app/wheels/apex-*.whl 2>/dev/null | head -n1 || true)"
+  if [ -n "${W}" ]; then
+    python -m pip install -v -U --no-deps "${W}" || true
+    echo "[build] Apex instalado da wheel recém-compilada: ${W}"
+  else
+    echo "[build] Nenhuma wheel Apex gerada; instalando do source (pode falhar)"
+    python -m pip install -v --no-build-isolation "$SRC" || true
+  fi
+}
+Q8_REPO="${Q8_REPO:-https://github.com/Lightricks/LTX-Video-Q8-Kernels.git}"
+Q8_COMMIT="${Q8_COMMIT:-f3066edea210082799ca5a2bbf9ef0321c5dd8fc}"
+build_q8 () {
+  local SRC="/app/wheels/src/q8_kernels"
+  rm -rf "$SRC"
+  git clone --filter=blob:none "$Q8_REPO" "$SRC"
+  git -C "$SRC" checkout "$Q8_COMMIT"
+  git -C "$SRC" submodule update --init --recursive
+  echo "[build] Compilando Q8 Kernels -> wheel"
+  python -m pip wheel -v --no-build-isolation "$SRC" -w /app/wheels || true
+  local W="$(ls -t /app/wheels/q8_kernels-*.whl 2>/dev/null | head -n1 || true)"
+  if [ -n "${W}" ]; then
+    python -m pip install -v -U --no-deps "${W}" || true
+    echo "[build] Q8 instalado da wheel recém-compilada: ${W}"
+  else
+    echo "[build] Nenhuma wheel q8_kernels gerada; instalando do source (pode falhar)"
+    python -m pip install -v --no-build-isolation "$SRC" || true
+  fi
+}
+# ===== Pipeline genérico =====
+ensure_pkg () {
+  local PKG="$1"      # apex | q8_kernels
+  local CHECK_FN="$2" # check_apex | check_q8
+  local BUILD_FN="$3" # build_apex | build_q8
+  echo "[flow] === ${PKG} ==="
+  if ${CHECK_FN}; then
+    echo "[flow] ${PKG}: já instalado (import OK)"
+    return 0
+  fi
+  echo "[flow] ${PKG}: tentando wheel do Hub (${SELF_HF_REPO_ID})"
+  HF_OUT="$(install_from_hf "$PKG" || true)"
+  if [ -n "${HF_OUT:-}" ]; then
+    WHEEL_PATH="$(printf "%s\n" "${HF_OUT}" | tail -n1)"
+    echo "[hub] Baixado: ${WHEEL_PATH}"
+    python -m pip install -v -U --no-build-isolation "${WHEEL_PATH}" || true
+    if ${CHECK_FN}; then
+      echo "[flow] ${PKG}: sucesso via Hub (${WHEEL_PATH})"
+      return 0
+    else
+      echo "[flow] ${PKG}: import falhou após wheel do Hub; compilando"
+    fi
+  else
+    echo "[hub] Nenhuma wheel compatível encontrada para ${PKG}"
+  fi
+  echo "[flow] ${PKG}: compilando (fallback)"
+  ${BUILD_FN}
+  if ${CHECK_FN}; then
+    echo "[flow] ${PKG}: sucesso após compilação"
+    return 0
+  fi
+  echo "[flow] ${PKG}: falhou após build; registrando logs e seguindo"
+  return 1
+}
+# ===== Execução: Apex e Q8 =====
+ensure_pkg "apex" check_apex build_apex || true
+ensure_pkg "q8_kernels" check_q8 build_q8 || true
+python - <<'PY'
+import os
+from huggingface_hub import HfApi, HfFolder
+repo=os.environ.get("SELF_HF_REPO_ID","carlex3321/aduc-sdr")
+token=os.getenv("HF_TOKEN") or HfFolder.get_token()
+if not token:
+    raise SystemExit("HF_TOKEN ausente; upload desabilitado")
+api=HfApi(token=token)
+api.upload_folder(
+    folder_path="/app/wheels",
+    repo_id=repo,
+    repo_type="model",
+    allow_patterns=["*.whl","NGC-DL-CONTAINER-LICENSE"],
+    ignore_patterns=["**/src/**","**/*.log","**/logs/**",".git/**"],
+)
+print("Upload concluído (wheels + licença).")
+PY
+chmod -R 777 /app/wheels || true
+echo "✅ Builder finalizado."

info.sh ADDED Viewed

	@@ -0,0 +1,113 @@

+#!/usr/bin/env bash
+set -euo pipefail
+echo "================= RUNTIME CAPABILITIES ================="
+nvidia-smi || true
+echo "CUDA_HOME: ${CUDA_HOME:-/usr/local/cuda}"
+echo "NVCC: $(nvcc --version 2>/dev/null | tail -n1 || echo 'N/A')"
+echo
+echo "[PyTorch / CUDA backend]"
+python3 - <<'PY'
+import json
+try:
+    import torch
+    info = {
+      "torch": torch.__version__,
+      "cuda_available": torch.cuda.is_available(),
+      "cuda_device_count": torch.cuda.device_count(),
+      "cuda_runtime_version": getattr(torch.version, "cuda", None),
+      "cudnn_version": (torch.backends.cudnn.version() if torch.cuda.is_available() else None),
+      "tf32": (torch.backends.cuda.matmul.allow_tf32 if torch.cuda.is_available() else None),
+      "flash_sdp": (torch.backends.cuda.flash_sdp_enabled() if hasattr(torch.backends.cuda,"flash_sdp_enabled") else None),
+      "mem_efficient_sdp": (torch.backends.cuda.mem_efficient_sdp_enabled() if hasattr(torch.backends.cuda,"mem_efficient_sdp_enabled") else None),
+      "math_sdp": (torch.backends.cuda.math_sdp_enabled() if hasattr(torch.backends.cuda,"math_sdp_enabled") else None),
+    }
+    print(json.dumps(info, indent=2))
+    if torch.cuda.is_available():
+        for i in range(torch.cuda.device_count()):
+            print(f"GPU {i}: {torch.cuda.get_device_name(i)}")
+except Exception as e:
+    print(f"[ERR torch] {type(e).__name__}: {e}")
+PY
+echo
+echo "[Apex]"
+python3 - <<'PY'
+try:
+    import importlib
+    importlib.import_module("apex.normalization")
+    print("apex.normalization: OK")
+except Exception as e:
+    print(f"Apex: ERR {type(e).__name__}: {e}")
+PY
+echo
+echo "[FlashAttention]"
+python3 - <<'PY'
+try:
+    import flash_attn
+    print(f"flash_attn: OK (version={getattr(flash_attn,'__version__', 'unknown')})")
+    try:
+        import flash_attn_2_cuda
+        print("flash_attn_2_cuda: OK")
+    except Exception as e:
+        print(f"flash_attn_2_cuda: ERR {type(e).__name__}: {e}")
+except Exception as e:
+    print(f"flash_attn: ERR {type(e).__name__}: {e}")
+PY
+echo
+echo "[Triton]"
+python3 - <<'PY'
+try:
+    import triton
+    print(f"triton: OK (version={getattr(triton,'__version__','unknown')})")
+    try:
+        import triton.ops
+        print("triton.ops: legacy module present")
+    except ModuleNotFoundError:
+        print("triton.ops: not present (ok on Triton>=3.x)")
+    except Exception as e:
+        print(f"triton.ops: WARN {type(e).__name__}: {e}")
+except Exception as e:
+    print(f"triton: ERR {type(e).__name__}: {e}")
+PY
+echo
+echo "[BitsAndBytes (Q8/Q4)]"
+python3 - <<'PY'
+try:
+    import bitsandbytes as bnb
+    v = getattr(bnb, "__version__", "unknown")
+    print(f"bitsandbytes: OK (version={v})")
+    try:
+        import bitsandbytes.triton.int8_matmul_mixed_dequantize as q8
+        print("bnb.triton.int8_matmul_mixed_dequantize: OK")
+    except ModuleNotFoundError:
+        print("bnb.q8.triton: not present (disabled or no GPU build)")
+    except Exception as e:
+        print(f"bnb.q8.triton: WARN {type(e).__name__}: {e}")
+except Exception as e:
+    print(f"bitsandbytes: ERR {type(e).__name__}: {e}")
+PY
+echo
+echo "[Transformers / Diffusers / XFormers]"
+python3 - <<'PY'
+import importlib
+def ver(name):
+    try:
+        m = importlib.import_module(name)
+        return getattr(m, "__version__", "unknown")
+    except Exception as e:
+        return f"ERR:{type(e).__name__}"
+print("transformers:", ver("transformers"))
+print("diffusers:", ver("diffusers"))
+print("xformers:", ver("xformers"))
+PY
+echo
+echo "[Distribuído / NCCL Env]"
+env | egrep 'MASTER_|NCCL|CUDA_VISIBLE_DEVICES|TORCH_|ENABLE_' | sort
+echo "================= END CAPABILITIES ================="

requirements.txt CHANGED Viewed

@@ -1,65 +1,50 @@
-#torch>=2.6.t
-#torchvision==0.21.0
-#torchaudio==2.6.0
-opencv-python>=4.9.0.80
-torchao
-librosa
-moviepy==1.0.3
 mediapy
 OmegaConf
-transformers
-accelerate
-safetensors
-einops
-decord
 sentencepiece
-#git+https://github.com/hkchengrex/MMAudio.git@main
-#git+https://github.com/huggingface/diffusers.git@main
-gradio>=5.23.1
 gradio[oauth]
 fastapi
 uvicorn[standard]
-pydantic
-soundfile
 tiktoken
 transformers_stream_generator
 rotary-embedding-torch
-Pillow
-PyYAML
-imageio
-imageio-ffmpeg
-av
 huggingface_hub
 google-generativeai
-torchmetrics
-pycocotools
-torch-fidelity
-imageio
-tabulate
-deepdiff
-parameterized
-mediapy
-black
-flake8
-isort
-pre-commit
-expecttest
-hypothesis
-numpy<2
-ninja
-psutil
-packaging
-#https://github.com/Dao-AILab/flash-attention/releases/download/v2.7.4.post1/flash_attn-2.7.4.post1+cu12torch2.6cxx11abiFALSE-cp310-cp310-linux_x86_64.whl
-#https://huggingface.co/ByteDance-Seed/SeedVR2-3B/resolve/main/apex-0.1-cp310-cp310-linux_x86_64.whl
-peft
-#sentencepiece
-peft
 ftfy
-#imageio-ffmpeg
-#opencv-python
-#torchao==0.11.0
 easydict

+gradio
+opencv-python-headless
+pillow>=10.4.0
+numpy==1.24.4
+safetensors>=0.4.5
+einops>=0.8.0
+pyyaml>=6.0.2
+omegaconf==2.3.0
 mediapy
+librosa
+moviepy
 OmegaConf
+beartype
 sentencepiece
 gradio[oauth]
+mediapy
 fastapi
 uvicorn[standard]
 tiktoken
 transformers_stream_generator
 rotary-embedding-torch
+transformers
+accelerate
+safetensors
+einops
+decord
 huggingface_hub
 google-generativeai
+gradio
+tabulate
+pydantic
+soundfile
+requests
+hf_transfer
+timm
 ftfy
 easydict
+#vince
+bitsandbytes
+einop
+numpy
+rotary-embedding-torch
+safetensors
+sentencepiece
+torch
+torchvision
+transformers

start.sh CHANGED Viewed

@@ -1,97 +1,75 @@
-#!/bin/bash
-# ==============================================================================
-# start.sh v4.0 - Verificador de Integridade e Orquestrador de Inicialização
-# ==============================================================================
-#
-# Este script verifica se os repositórios essenciais, instalados durante o build
-# do Docker, existem e são válidos. Somente após a verificação, ele prossegue
-# para o download dos modelos e a inicialização da aplicação.
-#
-# ==============================================================================
-#set -e
-#pip -v install flash-attn>=2.8.0 --no-build-isolation --no-cache-dir
-#pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu128
-#pip install packaging wheel ninja setuptools
-#pip install --no-build-isolation git+https://github.com/Lightricks/LTX-Video-Q8-Kernels.git
-# Define o nome do pacote para facilitar a leitura
-PACKAGE_NAME="diffusers-aduc-sdr"
-GIT_REPO_URL="git+https://github.com/carlex22/diffusers-aduc-sdr.git"
-echo "======================================================================"
-echo "ADUC-SDR: Verificando e atualizando o fork $PACKAGE_NAME..."
-echo "======================================================================"
-# Força a desinstalação de qualquer versão existente para evitar conflitos
-pip uninstall -y $PACKAGE_NAME
-# Instala a versão mais recente diretamente do branch 'main' do seu repositório
-# --no-cache-dir: Garante que o pip não use pacotes em cache
-# --upgrade: Garante que está pegando a versão mais recente
-pip -q install $GIT_REPO_URL
-echo ""
-echo "======================================================================"
-echo "$PACKAGE_NAME instalado/atualizado com sucesso."
-echo "Iniciando a aplicação Gradio..."
-echo "======================================================================"
-echo ""
-echo "🚀 Iniciando ADUC-SDR (Ambiente Pré-compilado)..."
-# --- Etapa 1: Verificação da Integridade dos Repositórios ---
-echo "----------------------------------------------------------------------"
-echo "🔍 Verificando a integridade das instalações do Docker..."
-# Lista de diretórios dos repositórios que devem existir
-REPOS_TO_CHECK=(
-    "/app/LTX-Video"
-    #"/app/Wan2.2"
-    "/app/SeedVR"
-    "/app/MMAudio"
-)
-# Flag para rastrear se tudo está correto
-ALL_REPOS_OK=true
-for repo_dir in "${REPOS_TO_CHECK[@]}"; do
-    # Verifica se o diretório do repositório existe
-    if [ -d "$repo_dir" ]; then
-        echo "  [✅ OK] Repositório encontrado: $repo_dir"
-    else
-        echo "  [❌ ERRO] Repositório CRÍTICO não encontrado: $repo_dir"
-        echo "        -> Isso indica uma falha durante o 'docker build'."
-        ALL_REPOS_OK=false
-    fi
-done
-# Se qualquer verificação falhou, o script para com uma mensagem de erro clara.
-if [ "$ALL_REPOS_OK" = false ]; then
-    echo "----------------------------------------------------------------------"
-    echo "🔥 Falha na verificação de integridade! A aplicação não pode iniciar."
-    echo "   Por favor, verifique os logs de build do Docker para encontrar a causa do erro na instalação."
-    exit 1
 fi
-echo "✅ Verificação de integridade concluída com sucesso. Todos os repositórios estão presentes."
-echo "----------------------------------------------------------------------"
-# --- Etapa 2: Baixar os Modelos Essenciais ---
-echo "📦 Verificando e baixando os modelos de IA..."
-# O script python cuidará da lógica de verificar se o download é necessário
-#python3 download_models.py
-echo "✅ Modelos prontos."
-# --- Etapa 3: Iniciar a Aplicação Principal ---
-echo "🎬 Iniciando a aplicação ($1)..."
-echo "🚀 Iniciando app.py..."
-python3 -d /app/app_animatediff.py --listen --port ${PORT:-7860}

+#!/usr/bin/env bash
+set -euo pipefail
+echo "======================================================="
+echo " ADUC-SDR — Start (VINCIE/SeedVR, 8× L40S)"
+echo "======================================================="
+# ---------------------- Env base ----------------------
+export CUDA_VISIBLE_DEVICES="${CUDA_VISIBLE_DEVICES:-0,1,2,3,4,5,6,7}"
+export TORCH_DTYPE="${TORCH_DTYPE:-bfloat16}"
+# SDPA/FA toggles
+export ENABLE_FLASH_SDP="${ENABLE_FLASH_SDP:-1}"
+export ENABLE_MEMORY_EFFICIENT_SDP="${ENABLE_MEMORY_EFFICIENT_SDP:-1}"
+export ENABLE_MATH_SDP="${ENABLE_MATH_SDP:-0}"
+export FLASH_ATTENTION_DISABLE="${FLASH_ATTENTION_DISABLE:-0}"
+export XFORMERS_FORCE_DISABLE="${XFORMERS_FORCE_DISABLE:-1}"
+# CUDA/NCCL/perf — single-node robust
+export CUDA_MODULE_LOADING="${CUDA_MODULE_LOADING:-LAZY}"
+export CUDA_DEVICE_MAX_CONNECTIONS="${CUDA_DEVICE_MAX_CONNECTIONS:-32}"
+export CUDA_DEVICE_ORDER="${CUDA_DEVICE_ORDER:-PCI_BUS_ID}"
+export PYTORCH_CUDA_ALLOC_CONF="${PYTORCH_CUDA_ALLOC_CONF:-max_split_size_mb:512,garbage_collection_threshold:0.8}"
+export OMP_NUM_THREADS="${OMP_NUM_THREADS:-8}"
+export MKL_NUM_THREADS="${MKL_NUM_THREADS:-8}"
+export NCCL_DEBUG="${NCCL_DEBUG:-INFO}"
+export NCCL_ASYNC_ERROR_HANDLING="${NCCL_ASYNC_ERROR_HANDLING:-1}"
+export NCCL_P2P_DISABLE="${NCCL_P2P_DISABLE:-0}"
+export NCCL_IB_DISABLE="${NCCL_IB_DISABLE:-1}"
+export NCCL_SOCKET_IFNAME="${NCCL_SOCKET_IFNAME:-lo}"
+export NCCL_BLOCKING_WAIT=1
+export TORCH_NCCL_BLOCKING_WAIT=1
+export NCCL_TIMEOUT="${NCCL_TIMEOUT:-600}"
+# HF caches
+export HF_HOME="${HF_HOME:-/app/.cache/huggingface}"
+unset TRANSFORMERS_CACHE
+# ---------------------- Builder (Apex + Q8) ----------------------
+# Executa com GPU disponível; busca wheels no HF e compila se necessário (sem FlashAttention)
+if nvidia-smi >/dev/null 2>&1; then
+  if [ "${DISABLE_BUILDER:-0}" = "0" ]; then
+    echo "🔧 Executando builder (Apex + Q8)..."
+    chmod +x /app/builder.sh || true
+    # Configuráveis:
+    SELF_HF_REPO_ID="carlex3321/aduc-sdr"    # repo de wheels no HF
+    HF_UPLOAD_WHEELS=0         # publica wheels geradas
+    BUILDER_TIMEOUT_SEC=6000000      # tempo limite
+    #Q8_REPO / Q8_COMMIT          # pin do LTX Q8
+    ( timeout ${BUILDER_TIMEOUT_SEC:-60000} bash -lc "/app/builder.sh" ) || {
+      echo "⚠️ Builder excedeu tempo/retornou erro; prosseguindo com a aplicação."
+    }
+  else
+    echo "ℹ️ Builder desabilitado por DISABLE_BUILDER=1"
+  fi
+else
+  echo "⚠️ GPU não visível; pulando builder (Apex/Q8)."
 fi
+# ---------------------- Banner ----------------------
+./info.sh || true
+ls -la /app && ls -R /app | head -n 2000
+echo "🚀 Subindo serviços..."
+# Exemplo: subir UI mínima SD Img2Img (ajuste conforme seu app)
+# python app_animatediff_min.py
+# Ou subir VINCIE UI se for o caso
+python app_vince.py