เปิดฝากล่อง Large Language Model ตั้งแต่ Attention Mechanism, Positional Encoding ไปจนถึง RLHF Open up the Large Language Model from Attention Mechanism, Positional Encoding to RLHF

Transformer เป็นสถาปัตยกรรม neural network ที่เปลี่ยนโลก NLP ไปตลอดกาล ตั้งแต่ปี 2017 จนถึงวันนี้ทุกโมเดลภาษาใหญ่ตั้งแต่ GPT-4 ไปจนถึง Claude ล้วนต่อยอดมาจากแนวคิดเดียวกัน

Transformer คืออะไร?

Transformer คือสถาปัตยกรรม deep learning ที่ถูกเสนอในงานวิจัย "Attention Is All You Need" โดยทีม Google Brain เมื่อปี 2017

Transformer is a neural network architecture that changed the NLP world forever. Since 2017, all major language models from GPT-4 to Claude have built upon the same concept.

What is a Transformer?

Transformer is a deep learning architecture proposed in the paper "Attention Is All You Need" by the Google Brain team in 2017.