Citat:
Ursprungligen postat av lördagsgrogg
Nu är jag inne på sjätte ölen och tredje groggen men om du/ni har möjlighet att förklara för mig vore jag tacksam.
Är det inte tre R i StRawbeRRy?
Sen är ju själva frågeställningen ointressant. Självklart går det att bugga ett program om man försöker. Säger ju ingenting om vad dess maxkapacitet är. Men absolut något om dess mini.
|
Ytterst förenklat så fungerar det flesta LLM:er (Large Language Models) så att de tar textsträngen som användaren matar in och delar upp den i bitar, sk.
tokens. Varje token ges sedan ett unikt nummer (datorer är ju generellt sätt bra på siffror).
Din fråga konverteras alltså ifrån en textrepresentation till en serie siffror.
Ur träningsdatat så har LLM:en lärt sig att beräkna den statistiska chansen att olika serier av siffror kommer efter varandra. Utifrån denna statistik så genererar den den lämpliga svaret.
Eller kanske ännu mer förenklat:
Datorn ser inte de enskilda bokstäverna utan bara orden i sin helhet.