DField SolutionsMérnöki stúdió · Budapest
Loading · Töltődik
Ugrás a tartalomhoz

Ágens-memória (Agent Memory)

Kapcsolódó szolgáltatás AI fejlesztés

MEGHATÁROZÁS

Ahogy egy AI-ágens megőrzi az állapotát a fordulók és munkamenetek között: rövid távú (kontextusablak), hosszú távú (vektortár/DB tényekkel) és epizodikus. Ez a különbség egy felejtő ágens és egy olyan közt, amely tanulja a cégedet.

KAPCSOLÓDÓ FOGALMAK06
  • Kontextus-tervezés (Context Engineering)

    A prompt engineering utódja: tudatosan állítjuk össze, mi kerül a modell kontextusába — rendszerprompt, lekért dokumentumok, eszközök, memória. A cél a maximális pontosság a lehető legkevesebb tokenből. A modell csak annyit tud, amennyit beletettünk.

  • AI Gateway

    Proxy-réteg az app és az LLM-szolgáltatók (OpenAI, Anthropic) között: routing, újrapróbálás, cache, rate-limit, kulcskezelés, költségkövetés és átkapcsolás kiesés esetén. Egy helyen látod a teljes AI-számládat, és nem ragadsz be egy szállítóhoz.

  • Modell-routing (Model Routing)

    Minden kérést a legolcsóbb modellhez küldünk, ami még megbirkózik vele: kis modell az egyszerű kérdéseknek, frontier modell a nehezeknek — gyakran egy osztályozó dönt. A drága hívásokat 5-10×-esére csökkenti az inference-költséget.

  • Graph RAG

    RAG-változat, amely tudásgráfon (entitások + kapcsolatok) keres, nem lapos szövegdarabokon. Így megválaszolja a több lépéses kérdéseket („hogyan kapcsolódik X-hez Y?”), amiket a tisztán vektoros keresés elszalaszt.

  • Szintetikus adat (Synthetic Data)

    Modell által generált tanító- és teszt-adat, ha a valódi szűkös, érzékeny (GDPR) vagy kiegyensúlyozatlan. Hasznos, de a minőséget és diverzitást ellenőrizni kell — különben a modell saját vakfoltjait sütöd bele a rendszerbe.

  • RAG (Retrieval-Augmented Generation)

    Olyan AI-architektúra, ahol a modell minden válasz előtt lekér releváns dokumentumokat a saját adattáradból, és csak a kontextusra támaszkodva válaszol. 80%-ban kivédi a hallucinációt.

EMLÍTÉSEK A BLOGON08