browserbase · ZhengKai91 · Dec 7, 2025 · cubic-dev-ai · Dec 7, 2025
diff --git a/stagehand/llm/client.py b/stagehand/llm/client.py
@@ -5,6 +5,8 @@
 import litellm
 
 from stagehand.metrics import get_inference_time_ms, start_inference_timer
+from pydantic import BaseModel
+from .structed_output_handler import StructuredOutputHandler
 
 if TYPE_CHECKING:
     from ..logging import StagehandLogger
@@ -119,6 +121,7 @@ async def create_response(
             category="llm",
         )
 
+
         try:
             # Start tracking inference time
             start_time = start_inference_timer()
@@ -134,6 +137,13 @@ async def create_response(
                 self.metrics_callback(response, inference_time_ms, function_name)
 
             return response
+        except litellm.BadRequestError as e:
+            handler = StructuredOutputHandler(litellm)
+            response = await handler.handle_structured_inference(**filtered_params)
+            inference_time_ms = get_inference_time_ms(start_time)
+            if self.metrics_callback:
+                self.metrics_callback(response, inference_time_ms, function_name)
+            return response
 
         except Exception as e:
             self.logger.error(f"Error calling litellm.acompletion: {e}", category="llm")