test: add vitest tests for slug generator model resolution

Verifies that generateSlugViaLLM respects the configured default model instead of using hardcoded Opus. Tests cover: - Model resolution from agents.defaults.model.primary - Custom provider support (e.g., OpenRouter) - Fallback to DEFAULT_MODEL when no config - Alternative models (Haiku, Sonnet) - Slug generation and cleanup logic - Parameter passing to runEmbeddedPiAgent All tests use mocked runEmbeddedPiAgent to avoid actual LLM calls. Relates to #4315
2026-01-30 02:10:09 -05:00 · 2026-01-30 02:10:09 -05:00 · d03adcc6a2
commit d03adcc6a2
parent 080a4dbd86
1 changed files with 313 additions and 0 deletions
--- a/src/hooks/llm-slug-generator.test.ts
+++ b/src/hooks/llm-slug-generator.test.ts
@ -0,0 +1,313 @@
+import { beforeEach, describe, expect, it, vi } from "vitest";
+import { generateSlugViaLLM } from "./llm-slug-generator.js";
+import type { OpenClawConfig } from "../config/config.js";
+import type { EmbeddedPiRunResult } from "../agents/pi-embedded.js";
+
+const runEmbeddedPiAgentMock = vi.fn<
+  Parameters<typeof import("../agents/pi-embedded.js").runEmbeddedPiAgent>,
+  Promise<EmbeddedPiRunResult>
+>();
+
+vi.mock("../agents/pi-embedded.js", () => ({
+  runEmbeddedPiAgent: (...args: unknown[]) => runEmbeddedPiAgentMock(...args),
+}));
+
+describe("generateSlugViaLLM", () => {
+  beforeEach(() => {
+    runEmbeddedPiAgentMock.mockReset();
+  });
+
+  describe("model resolution", () => {
+    it("uses configured default model from agents.defaults.model.primary", async () => {
+      // Arrange: Config with custom default model (Sonnet instead of Opus)
+      const cfg: OpenClawConfig = {
+        agents: {
+          defaults: {
+            model: {
+              primary: "anthropic/claude-sonnet-4-5",
+            },
+          },
+        },
+      };
+
+      runEmbeddedPiAgentMock.mockResolvedValue({
+        payloads: [{ text: "test-slug" }],
+        meta: { runId: "test-run", sessionId: "test-session" },
+      });
+
+      // Act
+      await generateSlugViaLLM({
+        sessionContent: "Some conversation about testing",
+        cfg,
+      });
+
+      // Assert: Should use Sonnet, not hardcoded Opus
+      expect(runEmbeddedPiAgentMock).toHaveBeenCalledTimes(1);
+      const callArgs = runEmbeddedPiAgentMock.mock.calls[0]?.[0];
+      expect(callArgs).toMatchObject({
+        provider: "anthropic",
+        model: "claude-sonnet-4-5",
+        config: cfg,
+      });
+    });
+
+    it("uses configured default model with custom provider", async () => {
+      // Arrange: Config with OpenRouter model
+      const cfg: OpenClawConfig = {
+        agents: {
+          defaults: {
+            model: {
+              primary: "openrouter/anthropic/claude-3.5-sonnet",
+            },
+          },
+        },
+      };
+
+      runEmbeddedPiAgentMock.mockResolvedValue({
+        payloads: [{ text: "custom-provider-slug" }],
+        meta: { runId: "test-run", sessionId: "test-session" },
+      });
+
+      // Act
+      await generateSlugViaLLM({
+        sessionContent: "Testing custom provider",
+        cfg,
+      });
+
+      // Assert: Should use OpenRouter provider
+      expect(runEmbeddedPiAgentMock).toHaveBeenCalledTimes(1);
+      const callArgs = runEmbeddedPiAgentMock.mock.calls[0]?.[0];
+      expect(callArgs).toMatchObject({
+        provider: "openrouter",
+        model: "anthropic/claude-3.5-sonnet",
+        config: cfg,
+      });
+    });
+
+    it("falls back to DEFAULT_MODEL when no model.primary is configured", async () => {
+      // Arrange: Empty config (no custom model)
+      const cfg: OpenClawConfig = {};
+
+      runEmbeddedPiAgentMock.mockResolvedValue({
+        payloads: [{ text: "default-model-slug" }],
+        meta: { runId: "test-run", sessionId: "test-session" },
+      });
+
+      // Act
+      await generateSlugViaLLM({
+        sessionContent: "Testing default fallback",
+        cfg,
+      });
+
+      // Assert: Should fall back to DEFAULT_MODEL (claude-opus-4-5)
+      expect(runEmbeddedPiAgentMock).toHaveBeenCalledTimes(1);
+      const callArgs = runEmbeddedPiAgentMock.mock.calls[0]?.[0];
+      expect(callArgs).toMatchObject({
+        provider: "anthropic",
+        model: "claude-opus-4-5",
+        config: cfg,
+      });
+    });
+
+    it("uses Haiku when configured as default model", async () => {
+      // Arrange: Config with Haiku as default
+      const cfg: OpenClawConfig = {
+        agents: {
+          defaults: {
+            model: {
+              primary: "anthropic/claude-3-5-haiku-20241022",
+            },
+          },
+        },
+      };
+
+      runEmbeddedPiAgentMock.mockResolvedValue({
+        payloads: [{ text: "haiku-slug" }],
+        meta: { runId: "test-run", sessionId: "test-session" },
+      });
+
+      // Act
+      await generateSlugViaLLM({
+        sessionContent: "Budget-friendly slug generation",
+        cfg,
+      });
+
+      // Assert: Should use Haiku
+      expect(runEmbeddedPiAgentMock).toHaveBeenCalledTimes(1);
+      const callArgs = runEmbeddedPiAgentMock.mock.calls[0]?.[0];
+      expect(callArgs).toMatchObject({
+        provider: "anthropic",
+        model: "claude-3-5-haiku-20241022",
+        config: cfg,
+      });
+    });
+  });
+
+  describe("slug generation", () => {
+    it("generates valid slug from LLM response", async () => {
+      const cfg: OpenClawConfig = {};
+
+      runEmbeddedPiAgentMock.mockResolvedValue({
+        payloads: [{ text: "api-design" }],
+        meta: { runId: "test-run", sessionId: "test-session" },
+      });
+
+      const slug = await generateSlugViaLLM({
+        sessionContent: "Discussion about API design patterns",
+        cfg,
+      });
+
+      expect(slug).toBe("api-design");
+    });
+
+    it("cleans up LLM response with extra characters", async () => {
+      const cfg: OpenClawConfig = {};
+
+      runEmbeddedPiAgentMock.mockResolvedValue({
+        payloads: [{ text: "  Bug Fix!  " }],
+        meta: { runId: "test-run", sessionId: "test-session" },
+      });
+
+      const slug = await generateSlugViaLLM({
+        sessionContent: "Bug fix discussion",
+        cfg,
+      });
+
+      expect(slug).toBe("bug-fix");
+    });
+
+    it("truncates long slugs to 30 characters", async () => {
+      const cfg: OpenClawConfig = {};
+
+      runEmbeddedPiAgentMock.mockResolvedValue({
+        payloads: [{ text: "this-is-a-very-long-slug-that-should-be-truncated-significantly" }],
+        meta: { runId: "test-run", sessionId: "test-session" },
+      });
+
+      const slug = await generateSlugViaLLM({
+        sessionContent: "Long discussion",
+        cfg,
+      });
+
+      // Verify length is enforced (implementation slices before final cleanup)
+      expect(slug?.length).toBeLessThanOrEqual(30);
+      expect(slug).toMatch(/^this-is-a-very-long-slug/);
+    });
+
+    it("returns null when LLM returns no payloads", async () => {
+      const cfg: OpenClawConfig = {};
+
+      runEmbeddedPiAgentMock.mockResolvedValue({
+        payloads: [],
+        meta: { runId: "test-run", sessionId: "test-session" },
+      });
+
+      const slug = await generateSlugViaLLM({
+        sessionContent: "Test content",
+        cfg,
+      });
+
+      expect(slug).toBeNull();
+    });
+
+    it("returns null when LLM returns empty text", async () => {
+      const cfg: OpenClawConfig = {};
+
+      runEmbeddedPiAgentMock.mockResolvedValue({
+        payloads: [{ text: "" }],
+        meta: { runId: "test-run", sessionId: "test-session" },
+      });
+
+      const slug = await generateSlugViaLLM({
+        sessionContent: "Test content",
+        cfg,
+      });
+
+      expect(slug).toBeNull();
+    });
+
+    it("returns null when embedded agent throws error", async () => {
+      const cfg: OpenClawConfig = {};
+
+      runEmbeddedPiAgentMock.mockRejectedValue(new Error("LLM timeout"));
+
+      const slug = await generateSlugViaLLM({
+        sessionContent: "Test content",
+        cfg,
+      });
+
+      expect(slug).toBeNull();
+    });
+  });
+
+  describe("embedded agent parameters", () => {
+    it("passes correct parameters to runEmbeddedPiAgent", async () => {
+      const cfg: OpenClawConfig = {
+        agents: {
+          defaults: {
+            model: {
+              primary: "anthropic/claude-sonnet-4-5",
+            },
+          },
+        },
+      };
+
+      runEmbeddedPiAgentMock.mockResolvedValue({
+        payloads: [{ text: "test-slug" }],
+        meta: { runId: "test-run", sessionId: "test-session" },
+      });
+
+      await generateSlugViaLLM({
+        sessionContent: "Testing parameters",
+        cfg,
+      });
+
+      expect(runEmbeddedPiAgentMock).toHaveBeenCalledTimes(1);
+      const callArgs = runEmbeddedPiAgentMock.mock.calls[0]?.[0];
+
+      // Verify all expected parameters are present
+      expect(callArgs).toMatchObject({
+        config: cfg,
+        provider: "anthropic",
+        model: "claude-sonnet-4-5",
+        timeoutMs: 15_000,
+      });
+
+      // Verify prompt includes session content
+      expect(callArgs?.prompt).toContain("Testing parameters");
+      expect(callArgs?.prompt).toContain("1-2 word filename slug");
+
+      // Verify session parameters
+      expect(callArgs?.sessionId).toMatch(/^slug-generator-\d+$/);
+      expect(callArgs?.sessionKey).toBe("temp:slug-generator");
+      expect(callArgs?.runId).toMatch(/^slug-gen-\d+$/);
+
+      // Verify temp session file path
+      expect(callArgs?.sessionFile).toContain("openclaw-slug-");
+      expect(callArgs?.sessionFile).toContain("session.jsonl");
+    });
+
+    it("truncates session content to 2000 characters in prompt", async () => {
+      const cfg: OpenClawConfig = {};
+      const longContent = "a".repeat(3000);
+
+      runEmbeddedPiAgentMock.mockResolvedValue({
+        payloads: [{ text: "truncated-slug" }],
+        meta: { runId: "test-run", sessionId: "test-session" },
+      });
+
+      await generateSlugViaLLM({
+        sessionContent: longContent,
+        cfg,
+      });
+
+      const callArgs = runEmbeddedPiAgentMock.mock.calls[0]?.[0];
+      const promptContentMatch = callArgs?.prompt.match(
+        /Conversation summary:\n([\s\S]+)\n\nReply/,
+      );
+      const extractedContent = promptContentMatch?.[1] ?? "";
+
+      expect(extractedContent.length).toBeLessThanOrEqual(2000);
+    });
+  });
+});