Agent Tool Use ist der Mechanismus, der ein Sprachmodell von einem Text-Generator in ein agierendes System verwandelt. Die Applikation gibt dem Modell einen typisierten Katalog von Funktionen, die es aufrufen kann; pro Turn antwortet das Modell entweder mit Text oder emittiert einen Funktionsaufruf mit Argumenten; die Runtime führt die Funktion aus und gibt das Ergebnis als nächste Nachricht zurück.

Anatomie eines Tool-Aufrufs.

  • Tool-Schema. Der Anbieter erhält ein JSON Schema für jedes Tool: Name, Beschreibung, Parameter, Return-Shape. Dieses Schema ist das, was das Modell nutzt, um zu entscheiden, wann es aufruft und wie es Argumente konstruiert.
  • Call-Nachricht. Wenn das Modell entscheidet, ein Tool zu benutzen, gibt es eine strukturierte Tool-Call-Nachricht statt freiem Text zurück. Die Applikation validiert die Argumente gegen das Schema und führt aus.
  • Result-Nachricht. Die Applikation gibt den Funktionsoutput als Tool-Result-Nachricht zurück. Das Modell liest ihn und setzt die Konversation fort — mit weiteren Tool-Aufrufen oder einer finalen Textantwort.

Wo die Rails sitzen.

Das Modell ist nicht die Autorisierungsentscheidung. Jedes Tool, das Kundendaten berührt oder externen Zustand verändert, läuft durch die echten Auth-, Validierungs- und Rate-Limit- Schichten der Applikation. Das Tool-Schema beschreibt, was das Modell verlangen kann; die Applikation entscheidet, was es tun darf.

Tool-Katalog designen.

Wenige, scharfe Tools schlagen mehr, unscharfe Tools. Ein Katalog mit fünf gut-benannten Tools, die jeweils eine Sache gut tun, übertrifft einen Katalog mit zwanzig überlappenden Tools. Die Modell-Auswahlqualität korreliert invers mit der Kataloggrösse; zielen Sie auf den kleinsten Katalog, der den Workflow abdeckt. Wenn der Workflow mehrere distinkte Rollen braucht, splitten Sie in einen Multi-Agent-Workflow mit typisierten Agent-Handoffs.

Häufige Fragen.

Was ist Tool Use bei Sprachmodellen?
Tool Use ist das Muster, bei dem einem Modell ein typisierter Satz von Funktionen gegeben wird, die es aufrufen kann (Suche, Datenbank-Queries, API-Aufrufe, Code-Execution). Die Runtime führt die Aufrufe aus und gibt Ergebnisse zurück. Das Modell wird zu einem Akteur in echten Systemen, nicht nur zu einem Text-Generator. Die grossen Anbieter (Anthropic, OpenAI, Google) unterstützen das nativ.
Ist Tool Use dasselbe wie Function Calling?
Es ist derselbe Mechanismus mit leicht unterschiedlichen Vendor-Namen. OpenAI nennt es 'Function Calling'; Anthropic nennt es 'Tool Use'. Beide beziehen sich darauf, dass das Modell eine strukturierte Funktionsaufrufnachricht emittiert, die die Runtime ausführt und zurückspeist. Das Model Context Protocol verallgemeinert das.
Wie viele Tools soll ein Agent kennen?
So wenige wie der Workflow erlaubt. Fünf scharf definierte Tools übertreffen meist zwanzig unscharfe. Mit wachsendem Katalog wird das Modell schlechter darin, das richtige Tool zu wählen und Argumente zu konstruieren. Bei mehr Bedarf den Workflow auf mehrere spezialisierte Agenten splitten.
Wer autorisiert einen Tool-Aufruf — das Modell oder die Applikation?
Immer die Applikation. Das Modell entscheidet, welches Tool es benutzen will; die Auth- und Validierungsschichten der Applikation entscheiden, ob der Aufruf erlaubt ist. Dem Modell Autorisierungsentscheidungen zu überlassen ist der kanonische Weg, einen Sicherheitsvorfall auszuliefern.

Englische Fassung: Agent Tool Use on the EN edition.