Tantárgy azonosító adatok
1. A tárgy címe Kereséssel kiegészített generálás nyelvi modellekben
2. A tárgy angol címe Retreival Augmented Generation in Language Models
3. Heti óraszámok (ea + gy + lab) és a félévvégi követelmény típusa 2 + 0 + 0 f Kredit 2
4. Ajánlott/kötelező előtanulmányi rend
vagy Tantárgy kód 1 Rövid cím 1 Tantárgy kód 2 Rövid cím 2 Tantárgy kód 3 Rövid cím 3
4.1
4.2
4.3
5. Kizáró tantárgyak
6. A tantárgy felelős tanszéke Algebra és Geometria Tanszék
7. A tantárgy felelős oktatója Dr. Kornai András beosztása egyetemi tanár
Akkreditációs adatok
8. Akkreditációra benyújtás időpontja 2024.08.08. Akkreditációs bizottság döntési időpontja 2024.08.09.
Tematika
9. A tantárgy az alábbi témakörök ismeretére épít
Python alapismeretek
10. A tantárgy szerepe a képzés céljának megvalósításában (szak, kötelező, kötelezően választható, szabadon választható)
Szabadon választható tárgy
11. A tárgy részletes tematikája

A Nagy Nyelvi Modellek (LLM-ek) nyelvtanilag, de nem feltétlenül tényszerűen, tökéletes vagy majdnem tökéletes természetes nyelvi (NL) kimenetet állítanak elő NL kérdésekre válaszolva. Különösen jelentős hallucinációs problémájuk van, amely valószerűnek hangzó, de nagyon helytelen válaszokat ad tényszerű kérdésekre, még akkor is, ha a helyes válaszról tudjuk, hogy jelen van a tanítóadatok között. A Kereséssel Kiegészített Generálás (RAG) népszerű módszerré vált a probléma enyhítésére. A kurzus a RAG-ot és más megközelítéseket vizsgálja az általános problémára, hogy hogyan lehet deklaratív (pl. adatbázis) információkat hozni az LLM-alapú kérdés-válaszoláshoz.

Large Language Models (LLMs) produce grammatically, but not necessarily factually, perfect or near-perfect natural language (NL) output in response to NL prompts. In particular, they have a significant hallucination problem providing plausibly sounding, but quite incorrect answers to factually sounding questions, even when the correct answer is known to be present in their training data. Retrieval-augmented generation (RAG) has emerged as a popular method for mitigating the problem. The course will look at RAG and other approaches to the general problem of bringing declarative (e.g. database) information to LLM-based question answering.

12. Követelmények, az osztályzat (aláírás) kialakításának módja
szorgalmi
időszakban
Prezentáció és/vagy projektmunka vizsga-
időszakban
13. Pótlási lehetőségek
14. Konzultációs lehetőségek
Igény szerint az előadóval egyeztetve.
15. Jegyzet, tankönyv, felhasználható irodalom
Wang, Wang et al. (2024). Factuality of Large Language Models in the Year 2024.
Rawte, Sheth, Das (2023). A Survey of Hallucination in Large Foundation Models
Ashikur Rahman, Anwar et al. (2024). DefAn: Definitive Answer Dataset for LLMs Hallucination Evaluation
16. A tantárgy elvégzéséhez átlagosan szükséges tanulmányi munka mennyisége órákban (a teljes szemeszterre számítva)
16.1 Kontakt óra
28
16.2 Félévközi felkészülés órákra
10
16.3 Felkészülés zárthelyire
0
16.4 Zárthelyik megírása
0
16.5 Házi feladat elkészítése
0
16.6 Kijelölt írásos tananyag elsajátítása (beszámoló)
22
16.7 Egyéb elfoglaltság
0
16.8 Vizsgafelkészülés
0
16.9 Összesen
60
17. Ellenőrző adat Kredit * 30
60
A tárgy tematikáját kidolgozta
18. Név beosztás Munkahely (tanszék, kutatóintézet, stb.)
Dr. Kornai András
egyetemi tanár
Algebra és Geometria Tanszék
A tanszékvezető
19. Neve aláírása
Dr. G.Horváth Ákos