Spaces:

GF-John
/

video-caption

Running on Zero

John Ho commited on Jul 28

Commit

9137c51

1 Parent(s): a792463

added do_sample to generate

Files changed (1) hide show

app.py CHANGED Viewed

@@ -233,7 +233,10 @@ def inference(
                 # Inference
                 generated_ids = model.generate(
-                    **inputs, max_new_tokens=max_tokens, temperature=float(temperature)
                 )
                 generated_ids_trimmed = [
                     out_ids[len(in_ids) :]
@@ -255,7 +258,10 @@ def inference(
                 ).to("cuda", dtype=DTYPE)
                 output = model.generate(
-                    **inputs, max_new_tokens=max_tokens, temperature=float(temperature)
                 )
                 output_text = processor.decode(
                     output[0, inputs["input_ids"].shape[1] :], skip_special_tokens=True

                 # Inference
                 generated_ids = model.generate(
+                    **inputs,
+                    max_new_tokens=max_tokens,
+                    temperature=float(temperature),
+                    do_sample=temperature > 0.0,
                 )
                 generated_ids_trimmed = [
                     out_ids[len(in_ids) :]
                 ).to("cuda", dtype=DTYPE)
                 output = model.generate(
+                    **inputs,
+                    max_new_tokens=max_tokens,
+                    temperature=float(temperature),
+                    do_sample=temperature > 0.0,
                 )
                 output_text = processor.decode(
                     output[0, inputs["input_ids"].shape[1] :], skip_special_tokens=True