BMETEAGMsMKKGN-00

Nyomtatóbarát változatNyomtatóbarát változat
Tantárgy azonosító adatok
A tárgy címe: 
Kereséssel kiegészített generálás nyelvi modellekben
A tárgy angol címe: 
Retreival Augmented Generation in Language Models
A tárgy rövid címe: 
KeresésselKiegGenerálás
2
0
0
f
Kredit: 
2
A tantárgy felelős tanszéke: 
Algebra és Geometria Tanszék
A tantárgy felelős oktatója: 
Dr. Kornai András
A tantárgy felelős oktatójának beosztása: 
egyetemi tanár
Akkreditációs adatok
Akkreditációra benyújtás időpontja: 
2024.08.08.
Akkreditációs bizottság döntési időpontja: 
2024.08.09.
Tematika
A tantárgy az alábbi témakörök ismeretére épít: 
Python alapismeretek
A tantárgy szerepe a képzés céljának megvalósításában: 
Szabadon választható tárgy
A tantárgy részletes tematikája magyarul és angolul: 

A Nagy Nyelvi Modellek (LLM-ek) nyelvtanilag, de nem feltétlenül tényszerűen, tökéletes vagy majdnem tökéletes természetes nyelvi (NL) kimenetet állítanak elő NL kérdésekre válaszolva. Különösen jelentős hallucinációs problémájuk van, amely valószerűnek hangzó, de nagyon helytelen válaszokat ad tényszerű kérdésekre, még akkor is, ha a helyes válaszról tudjuk, hogy jelen van a tanítóadatok között. A Kereséssel Kiegészített Generálás (RAG) népszerű módszerré vált a probléma enyhítésére. A kurzus a RAG-ot és más megközelítéseket vizsgálja az általános problémára, hogy hogyan lehet deklaratív (pl. adatbázis) információkat hozni az LLM-alapú kérdés-válaszoláshoz.

Large Language Models (LLMs) produce grammatically, but not necessarily factually, perfect or near-perfect natural language (NL) output in response to NL prompts. In particular, they have a significant hallucination problem providing plausibly sounding, but quite incorrect answers to factually sounding questions, even when the correct answer is known to be present in their training data. Retrieval-augmented generation (RAG) has emerged as a popular method for mitigating the problem. The course will look at RAG and other approaches to the general problem of bringing declarative (e.g. database) information to LLM-based question answering.

Követelmények szorgalmi időszakban: 
Prezentáció és/vagy projektmunka
Konzultációs lehetőségek: 
Igény szerint az előadóval egyeztetve.
Jegyzet, tankönyv, felhasználható irodalom: 
Wang, Wang et al. (2024). Factuality of Large Language Models in the Year 2024.
Rawte, Sheth, Das (2023). A Survey of Hallucination in Large Foundation Models
Ashikur Rahman, Anwar et al. (2024). DefAn: Definitive Answer Dataset for LLMs Hallucination Evaluation
A tárgy elvégzéséhez átlagosan szükséges tanulmányi munka mennyisége órákban (a teljes szemeszterre számítva)
Kontakt óra: 
28
Félévközi felkészülés órákra: 
10
Felkészülés zárthelyire: 
0
Zárthelyik megírása: 
0
Házi feladat elkészítése: 
0
Kijelölt írásos tananyag elsajátítása (beszámoló): 
22
Egyéb elfoglaltság: 
0
Vizsgafelkészülés: 
0
Összesen: 
60
Ellenőrző adat: 
60
A tárgy tematikáját kidolgozta
Név: 
Dr. Kornai András
Beosztás: 
egyetemi tanár
Munkahely (tanszék, kutatóintézet, stb.): 
Algebra és Geometria Tanszék
A tanszékvezető neve: 
Dr. G.Horváth Ákos