microsoft · gziz · Dec 20, 2024 · Dec 26, 2024 · Dec 26, 2024 · gziz
diff --git a/python/packages/autogen-ext/src/autogen_ext/models/openai/_openai_client.py b/python/packages/autogen-ext/src/autogen_ext/models/openai/_openai_client.py
@@ -293,13 +293,6 @@ def calculate_vision_tokens(image: Image, detail: str = "auto") -> int:
     return total_tokens
 
 
-def _add_usage(usage1: RequestUsage, usage2: RequestUsage) -> RequestUsage:
-    return RequestUsage(
-        prompt_tokens=usage1.prompt_tokens + usage2.prompt_tokens,
-        completion_tokens=usage1.completion_tokens + usage2.completion_tokens,
-    )
-
-
 def convert_tools(
     tools: Sequence[Tool | ToolSchema],
 ) -> List[ChatCompletionToolParam]:
@@ -572,8 +565,7 @@ async def create(
             logprobs=logprobs,
         )
 
-        _add_usage(self._actual_usage, usage)
-        _add_usage(self._total_usage, usage)
+        self.add_usage(usage)
 
         # TODO - why is this cast needed?
         return response
@@ -789,8 +781,7 @@ async def create_stream(
             logprobs=logprobs,
         )
 
-        _add_usage(self._actual_usage, usage)
-        _add_usage(self._total_usage, usage)
+        self.add_usage(usage)
 
         yield result
 
@@ -897,6 +888,13 @@ def remaining_tokens(self, messages: Sequence[LLMMessage], tools: Sequence[Tool
     def capabilities(self) -> ModelCapabilities:
         return self._model_capabilities
 
+    def add_usage(self, usage: RequestUsage) -> None:
+        self._total_usage.prompt_tokens += usage.prompt_tokens
+        self._total_usage.completion_tokens += usage.completion_tokens
+
+        self._actual_usage.prompt_tokens += usage.prompt_tokens
+        self._actual_usage.completion_tokens += usage.completion_tokens
+
 
 class OpenAIChatCompletionClient(BaseOpenAIChatCompletionClient, Component[OpenAIClientConfigurationConfigModel]):
     """Chat completion client for OpenAI hosted models.