Spaces:

samwell
/

medrax2

Sleeping

App Files Files Community

VictorLJZ commited on Jul 24

Commit

f60c51c

1 Parent(s): e040fb2

added openrouter provider

Browse files

Files changed (4) hide show

benchmarking/cli.py +3 -2
benchmarking/llm_providers/__init__.py +2 -0
benchmarking/llm_providers/openrouter_provider.py +90 -0
medrax/models/model_factory.py +5 -1

benchmarking/cli.py CHANGED Viewed

@@ -22,6 +22,7 @@ def create_llm_provider(model_name: str, provider_type: str, **kwargs) -> LLMPro
     provider_map = {
         "openai": OpenAIProvider,
         "google": GoogleProvider,
         "medrax": MedRAXProvider,
     }
@@ -112,14 +113,14 @@ def main():
     # Run benchmark command
     run_parser = subparsers.add_parser("run", help="Run a benchmark")
     run_parser.add_argument("--model", required=True, help="Model name (e.g., gpt-4o, gemini-2.5-pro)")
-    run_parser.add_argument("--provider", required=True, choices=["openai", "google", "medrax"], help="LLM provider")
     run_parser.add_argument("--benchmark", required=True, choices=["rexvqa", "chestagentbench"], help="Benchmark to run")
     run_parser.add_argument("--data-dir", required=True, help="Directory containing benchmark data")
     run_parser.add_argument("--output-dir", default="benchmark_results", help="Output directory for results")
     run_parser.add_argument("--max-questions", type=int, help="Maximum number of questions to process")
     run_parser.add_argument("--temperature", type=float, default=0.7, help="Model temperature")
     run_parser.add_argument("--top-p", type=float, default=0.95, help="Top-p value")
-    run_parser.add_argument("--max-tokens", type=int, default=5000, help="Maximum tokens per response")
     run_parser.set_defaults(func=run_benchmark_command)

     provider_map = {
         "openai": OpenAIProvider,
         "google": GoogleProvider,
+        "openrouter": OpenRouterProvider,
         "medrax": MedRAXProvider,
     }
     # Run benchmark command
     run_parser = subparsers.add_parser("run", help="Run a benchmark")
     run_parser.add_argument("--model", required=True, help="Model name (e.g., gpt-4o, gemini-2.5-pro)")
+    run_parser.add_argument("--provider", required=True, choices=["openai", "google", "openrouter", "medrax"], help="LLM provider")
     run_parser.add_argument("--benchmark", required=True, choices=["rexvqa", "chestagentbench"], help="Benchmark to run")
     run_parser.add_argument("--data-dir", required=True, help="Directory containing benchmark data")
     run_parser.add_argument("--output-dir", default="benchmark_results", help="Output directory for results")
     run_parser.add_argument("--max-questions", type=int, help="Maximum number of questions to process")
     run_parser.add_argument("--temperature", type=float, default=0.7, help="Model temperature")
     run_parser.add_argument("--top-p", type=float, default=0.95, help="Top-p value")
+    run_parser.add_argument("--max-tokens", type=int, default=1000, help="Maximum tokens per response")
     run_parser.set_defaults(func=run_benchmark_command)

benchmarking/llm_providers/__init__.py CHANGED Viewed

@@ -4,6 +4,7 @@ from .base import LLMProvider, LLMRequest, LLMResponse
 from .openai_provider import OpenAIProvider
 from .google_provider import GoogleProvider
 from .medrax_provider import MedRAXProvider
 __all__ = [
     "LLMProvider",
@@ -12,4 +13,5 @@ __all__ = [
     "OpenAIProvider",
     "GoogleProvider",
     "MedRAXProvider",
 ]

 from .openai_provider import OpenAIProvider
 from .google_provider import GoogleProvider
 from .medrax_provider import MedRAXProvider
+from .openrouter_provider import OpenRouterProvider
 __all__ = [
     "LLMProvider",
     "OpenAIProvider",
     "GoogleProvider",
     "MedRAXProvider",
+    "OpenRouterProvider",
 ]

benchmarking/llm_providers/openrouter_provider.py ADDED Viewed

	@@ -0,0 +1,90 @@

+"""xAI LLM provider implementation using OpenRouter API via OpenAI SDK."""
+import os
+import time
+from tenacity import retry, wait_exponential, stop_after_attempt
+import base64
+from openai import OpenAI
+from .base import LLMProvider, LLMRequest, LLMResponse
+class OpenRouterProvider(LLMProvider):
+    """LLM provider using OpenRouter API via OpenAI SDK."""
+    def _setup(self) -> None:
+        """Set up OpenRouter client models."""
+        api_key = os.getenv("OPENROUTER_API_KEY")
+        if not api_key:
+            raise ValueError("OPENROUTER_API_KEY environment variable is required for xAI Grok via OpenRouter.")
+        base_url = os.getenv("OPENROUTER_BASE_URL", "https://openrouter.ai/api/v1")
+        # Use OpenAI SDK with OpenRouter endpoint
+        self.client = OpenAI(api_key=api_key, base_url=base_url)
+    @retry(wait=wait_exponential(multiplier=1, min=4, max=10), stop=stop_after_attempt(3))
+    def generate_response(self, request: LLMRequest) -> LLMResponse:
+        """Generate response using OpenRouter Grok model via OpenAI SDK.
+        Args:
+            request (LLMRequest): The request containing text, images, and parameters
+        Returns:
+            LLMResponse: The response from xAI Grok via OpenRouter
+        """
+        start_time = time.time()
+        # Build messages
+        messages = []
+        if self.system_prompt:
+            messages.append({"role": "system", "content": self.system_prompt})
+        user_content = []
+        user_content.append({"type": "text", "text": request.text})
+        # Add images if provided
+        if request.images:
+            valid_images = self._validate_image_paths(request.images)
+            for image_path in valid_images:
+                try:
+                    image_b64 = self._encode_image(image_path)
+                    user_content.append({
+                        "type": "image_url",
+                        "image_url": {
+                            "url": f"data:image/jpeg;base64,{image_b64}",
+                            "detail": "high"
+                        }
+                    })
+                except Exception as e:
+                    print(f"Error reading image {image_path}: {e}")
+        messages.append({"role": "user", "content": user_content})
+        try:
+            response = self.client.chat.completions.create(
+                model=self.model_name,
+                messages=messages,
+                temperature=request.temperature,
+                top_p=request.top_p,
+                max_tokens=request.max_tokens,
+                **(request.additional_params or {})
+            )
+            duration = time.time() - start_time
+            content = response.choices[0].message.content if response.choices else ""
+            usage = {}
+            if hasattr(response, 'usage') and response.usage:
+                usage = {
+                    "prompt_tokens": getattr(response.usage, "prompt_tokens", 0),
+                    "completion_tokens": getattr(response.usage, "completion_tokens", 0),
+                    "total_tokens": getattr(response.usage, "total_tokens", 0)
+                }
+            return LLMResponse(
+                content=content,
+                usage=usage,
+                duration=duration,
+                raw_response=response
+            )
+        except Exception as e:
+            return LLMResponse(
+                content=f"Error: {str(e)}",
+                duration=time.time() - start_time,
+                raw_response=None
+            )

medrax/models/model_factory.py CHANGED Viewed

@@ -28,7 +28,11 @@ class ModelFactory:
             "env_key": "OPENAI_API_KEY",
             "base_url_key": "OPENAI_BASE_URL",
         },
-        "gemini": {"class": ChatGoogleGenerativeAI, "env_key": "GOOGLE_API_KEY"},
         "openrouter": {
             "class": ChatOpenAI,  # OpenRouter uses OpenAI-compatible interface
             "env_key": "OPENROUTER_API_KEY",

             "env_key": "OPENAI_API_KEY",
             "base_url_key": "OPENAI_BASE_URL",
         },
+        "gemini": {
+            "class": ChatGoogleGenerativeAI,
+            "env_key": "GOOGLE_API_KEY",
+            "base_url_key": "GOOGLE_BASE_URL",
+        },
         "openrouter": {
             "class": ChatOpenAI,  # OpenRouter uses OpenAI-compatible interface
             "env_key": "OPENROUTER_API_KEY",