A tantárgy az alábbi témakörök ismeretére épít:
A tantárgy szerepe a képzés céljának megvalósításában:
Szabadon választható tárgy
A tantárgy részletes tematikája magyarul és angolul:
A Nagy Nyelvi Modellek (LLM-ek) nyelvtanilag, de nem feltétlenül tényszerűen, tökéletes vagy majdnem tökéletes természetes nyelvi (NL) kimenetet állítanak elő NL kérdésekre válaszolva. Különösen jelentős hallucinációs problémájuk van, amely valószerűnek hangzó, de nagyon helytelen válaszokat ad tényszerű kérdésekre, még akkor is, ha a helyes válaszról tudjuk, hogy jelen van a tanítóadatok között. A Kereséssel Kiegészített Generálás (RAG) népszerű módszerré vált a probléma enyhítésére. A kurzus a RAG-ot és más megközelítéseket vizsgálja az általános problémára, hogy hogyan lehet deklaratív (pl. adatbázis) információkat hozni az LLM-alapú kérdés-válaszoláshoz.
Large Language Models (LLMs) produce grammatically, but not necessarily factually, perfect or near-perfect natural language (NL) output in response to NL prompts. In particular, they have a significant hallucination problem providing plausibly sounding, but quite incorrect answers to factually sounding questions, even when the correct answer is known to be present in their training data. Retrieval-augmented generation (RAG) has emerged as a popular method for mitigating the problem. The course will look at RAG and other approaches to the general problem of bringing declarative (e.g. database) information to LLM-based question answering.
Követelmények szorgalmi időszakban:
Prezentáció és/vagy projektmunka
Konzultációs lehetőségek:
Igény szerint az előadóval egyeztetve.
Jegyzet, tankönyv, felhasználható irodalom:
Wang, Wang et al. (2024). Factuality of Large Language Models in the Year 2024.
Rawte, Sheth, Das (2023). A Survey of Hallucination in Large Foundation Models
Ashikur Rahman, Anwar et al. (2024). DefAn: Definitive Answer Dataset for LLMs Hallucination Evaluation