Merge pull request #236 from FellouAI/develop

veasion · web-flow · commit e09b7c9236ef · 2025-09-19T21:35:22.000+08:00
chore: Optimize agent compress
diff --git a/package.json b/package.json
@@ -1,6 +1,6 @@
 {
   "name": "@eko-ai/eko",
-  "version": "3.0.7",
+  "version": "3.0.8",
   "description": "Empowering language to transform human words into action.",
   "workspaces": [
     "packages/eko-core",
diff --git a/packages/eko-core/package.json b/packages/eko-core/package.json
@@ -1,6 +1,6 @@
 {
   "name": "@eko-ai/eko",
-  "version": "3.0.7",
+  "version": "3.0.8",
   "description": "Empowering language to transform human words into action.",
   "main": "dist/index.cjs.js",
   "module": "dist/index.esm.js",
@@ -24,8 +24,8 @@
   },
   "scripts": {
     "build": "rollup -c",
-    "test": "jest",
-    "docs": "typedoc"
+    "docs": "typedoc",
+    "test": "npx jest test/core/eko.test.ts"
   },
   "author": "FellouAI",
   "license": "MIT",
diff --git a/packages/eko-core/src/agent/llm.ts b/packages/eko-core/src/agent/llm.ts
@@ -5,25 +5,25 @@ import { RetryLanguageModel } from "../llm";
 import { AgentContext } from "../core/context";
 import { uuidv4, sleep, toFile, getMimeType } from "../common/utils";
 import {
-  LLMRequest,
-  StreamCallbackMessage,
-  StreamCallback,
-  HumanCallback,
-  StreamResult,
   Tool,
+  LLMRequest,
   ToolResult,
   DialogueTool,
+  StreamResult,
+  HumanCallback,
+  StreamCallback,
+  StreamCallbackMessage,
 } from "../types";
 import {
-  LanguageModelV2FunctionTool,
   LanguageModelV2Prompt,
-  LanguageModelV2StreamPart,
   LanguageModelV2TextPart,
-  LanguageModelV2ToolCallPart,
+  SharedV2ProviderOptions,
   LanguageModelV2ToolChoice,
-  LanguageModelV2ToolResultOutput,
+  LanguageModelV2StreamPart,
+  LanguageModelV2ToolCallPart,
+  LanguageModelV2FunctionTool,
   LanguageModelV2ToolResultPart,
-  SharedV2ProviderOptions,
+  LanguageModelV2ToolResultOutput,
 } from "@ai-sdk/provider";
 
 export function defaultLLMProviderOptions(): SharedV2ProviderOptions {
@@ -90,7 +90,10 @@ export function convertToolResult(
       type: "error-text",
       value: "Error",
     };
-  } else if (toolResult.content.length == 1 && toolResult.content[0].type == "text") {
+  } else if (
+    toolResult.content.length == 1 &&
+    toolResult.content[0].type == "text"
+  ) {
     let text = toolResult.content[0].text;
     result = {
       type: "text",
@@ -188,7 +191,11 @@ export async function callAgentLLM(
   requestHandler?: (request: LLMRequest) => void
 ): Promise<Array<LanguageModelV2TextPart | LanguageModelV2ToolCallPart>> {
   await agentContext.context.checkAborted();
-  if (messages.length >= config.compressThreshold && !noCompress) {
+  if (
+    !noCompress &&
+    (messages.length >= config.compressThreshold || (messages.length >= 10 && estimatePromptTokens(messages, tools) >= config.compressTokensThreshold))
+  ) {
+    // Compress messages
     await memory.compressAgentMessages(agentContext, rlm, messages, tools);
   }
   if (!toolChoice) {
@@ -221,8 +228,7 @@ export async function callAgentLLM(
   let thinkStreamId = uuidv4();
   let textStreamDone = false;
   const toolParts: LanguageModelV2ToolCallPart[] = [];
-  let reader: ReadableStreamDefaultReader<LanguageModelV2StreamPart> | null =
-    null;
+  let reader: ReadableStreamDefaultReader<LanguageModelV2StreamPart> | null = null;
   try {
     agentChain.agentRequest = request;
     context.currentStepControllers.add(stepController);
@@ -509,6 +515,9 @@ export async function callAgentLLM(
     await context.checkAborted();
     if (retryNum < config.maxRetryNum) {
       await sleep(300 * (retryNum + 1) * (retryNum + 1));
+      if ((e + "").indexOf("is too long") > -1) {
+        await memory.compressAgentMessages(agentContext, rlm, messages, tools);
+      }
       return callAgentLLM(
         agentContext,
         rlm,
@@ -534,6 +543,108 @@ export async function callAgentLLM(
     : toolParts;
 }
 
+export function estimatePromptTokens(
+  messages: LanguageModelV2Prompt,
+  tools?: LanguageModelV2FunctionTool[]
+) {
+  let tokens = messages.reduce((total, message) => {
+    if (message.role == "system") {
+      return total + estimateTokens(message.content);
+    } else if (message.role == "user") {
+      return (
+        total +
+        estimateTokens(
+          message.content
+            .filter((part) => part.type == "text")
+            .map((part) => part.text)
+            .join("\n")
+        )
+      );
+    } else if (message.role == "assistant") {
+      return (
+        total +
+        estimateTokens(
+          message.content
+            .map((part) => {
+              if (part.type == "text") {
+                return part.text;
+              } else if (part.type == "reasoning") {
+                return part.text;
+              } else if (part.type == "tool-call") {
+                return part.toolName + JSON.stringify(part.input || {});
+              } else if (part.type == "tool-result") {
+                return part.toolName + JSON.stringify(part.output || {});
+              }
+              return "";
+            })
+            .join("")
+        )
+      );
+    } else if (message.role == "tool") {
+      return (
+        total +
+        estimateTokens(
+          message.content
+            .map((part) => part.toolName + JSON.stringify(part.output || {}))
+            .join("")
+        )
+      );
+    }
+    return total;
+  }, 0);
+  if (tools) {
+    tokens += tools.reduce((total, tool) => {
+      return total + estimateTokens(JSON.stringify(tool));
+    }, 0);
+  }
+  return tokens;
+}
+
+export function estimateTokens(text: string) {
+  if (!text) {
+    return 0;
+  }
+  let tokenCount = 0;
+  for (let i = 0; i < text.length; i++) {
+    const char = text[i];
+    const code = char.charCodeAt(0);
+    if (
+      (code >= 0x4e00 && code <= 0x9fff) ||
+      (code >= 0x3400 && code <= 0x4dbf) ||
+      (code >= 0x3040 && code <= 0x309f) ||
+      (code >= 0x30a0 && code <= 0x30ff) ||
+      (code >= 0xac00 && code <= 0xd7af)
+    ) {
+      tokenCount += 2;
+    } else if (/\s/.test(char)) {
+      continue;
+    } else if (/[a-zA-Z]/.test(char)) {
+      let word = "";
+      while (i < text.length && /[a-zA-Z]/.test(text[i])) {
+        word += text[i];
+        i++;
+      }
+      i--;
+      if (word.length <= 4) {
+        tokenCount += 1;
+      } else {
+        tokenCount += Math.ceil(word.length / 4);
+      }
+    } else if (/\d/.test(char)) {
+      let number = "";
+      while (i < text.length && /\d/.test(text[i])) {
+        number += text[i];
+        i++;
+      }
+      i--;
+      tokenCount += Math.max(1, Math.ceil(number.length / 3));
+    } else {
+      tokenCount += 1;
+    }
+  }
+  return Math.max(1, tokenCount);
+}
+
 function appendUserConversation(
   agentContext: AgentContext,
   messages: LanguageModelV2Prompt
diff --git a/packages/eko-core/src/config/index.ts b/packages/eko-core/src/config/index.ts
@@ -6,6 +6,7 @@ type GlobalConfig = {
   maxRetryNum: number;
   agentParallel: boolean;
   compressThreshold: number; // Dialogue context compression threshold (message count)
+  compressTokensThreshold: number; // Dialogue context compression threshold (token count)
   largeTextLength: number;
   fileTextMaxLength: number;
   maxDialogueImgFileNum: number;
@@ -23,6 +24,7 @@ const config: GlobalConfig = {
   maxRetryNum: 3,
   agentParallel: false,
   compressThreshold: 80,
+  compressTokensThreshold: 100000,
   largeTextLength: 5000,
   fileTextMaxLength: 20000,
   maxDialogueImgFileNum: 1,
diff --git a/packages/eko-core/src/prompt/agent.ts b/packages/eko-core/src/prompt/agent.ts
@@ -1,5 +1,5 @@
-import { Agent } from "../agent";
 import config from "../config";
+import { Agent } from "../agent";
 import Context from "../core/context";
 import { sub } from "../common/utils";
 import { WorkflowAgent, Tool } from "../types";
@@ -37,6 +37,7 @@ During the task execution process, you can use the \`${human_interact}\` tool to
 - When performing dangerous operations such as deleting files, confirmation from humans is required.
 - When encountering obstacles while accessing websites, such as requiring user login, captcha verification, QR code scanning, or human verification, you need to request manual assistance.
 - Please do not use the \`${human_interact}\` tool frequently.
+- The \`${human_interact}\` tool does not support parallel calls.
 `;
 
 const VARIABLE_PROMPT = `
diff --git a/packages/eko-extension/package.json b/packages/eko-extension/package.json
@@ -1,6 +1,6 @@
 {
   "name": "@eko-ai/eko-extension",
-  "version": "3.0.7",
+  "version": "3.0.8",
   "description": "Empowering language to transform human words into action.",
   "main": "dist/index.cjs.js",
   "module": "dist/index.esm.js",
diff --git a/packages/eko-nodejs/package.json b/packages/eko-nodejs/package.json
@@ -1,6 +1,6 @@
 {
   "name": "@eko-ai/eko-nodejs",
-  "version": "3.0.7",
+  "version": "3.0.8",
   "description": "Empowering language to transform human words into action.",
   "main": "dist/index.cjs.js",
   "module": "dist/index.esm.js",
diff --git a/packages/eko-web/package.json b/packages/eko-web/package.json
@@ -1,6 +1,6 @@
 {
   "name": "@eko-ai/eko-web",
-  "version": "3.0.7",
+  "version": "3.0.8",
   "description": "Empowering language to transform human words into action.",
   "main": "dist/index.cjs.js",
   "module": "dist/index.esm.js",

Original file line number	Diff line number	Diff line change
`@@ -1,6 +1,6 @@`
`1`	`1`	`{`
`2`	`2`	`"name": "@eko-ai/eko",`
`3`		`- "version": "3.0.7",`
	`3`	`+ "version": "3.0.8",`
`4`	`4`	`"description": "Empowering language to transform human words into action.",`
`5`	`5`	`"workspaces": [`
`6`	`6`	`"packages/eko-core",`
Original file line number	Diff line number	Diff line change
`@@ -1,6 +1,6 @@`
`1`	`1`	`{`
`2`	`2`	`"name": "@eko-ai/eko-extension",`
`3`		`- "version": "3.0.7",`
	`3`	`+ "version": "3.0.8",`
`4`	`4`	`"description": "Empowering language to transform human words into action.",`
`5`	`5`	`"main": "dist/index.cjs.js",`
`6`	`6`	`"module": "dist/index.esm.js",`
Original file line number	Diff line number	Diff line change
`@@ -1,6 +1,6 @@`
`1`	`1`	`{`
`2`	`2`	`"name": "@eko-ai/eko-nodejs",`
`3`		`- "version": "3.0.7",`
	`3`	`+ "version": "3.0.8",`
`4`	`4`	`"description": "Empowering language to transform human words into action.",`
`5`	`5`	`"main": "dist/index.cjs.js",`
`6`	`6`	`"module": "dist/index.esm.js",`
Original file line number	Diff line number	Diff line change
`@@ -1,6 +1,6 @@`
`1`	`1`	`{`
`2`	`2`	`"name": "@eko-ai/eko-web",`
`3`		`- "version": "3.0.7",`
	`3`	`+ "version": "3.0.8",`
`4`	`4`	`"description": "Empowering language to transform human words into action.",`
`5`	`5`	`"main": "dist/index.cjs.js",`
`6`	`6`	`"module": "dist/index.esm.js",`