ในวันที่คำว่า “Generative AI” และ “ChatGPT” กลายเป็นคำที่ทุกคนพูดถึง หลายคนอาจจะลืมไปว่าเทคโนโลยีที่ดูเหมือน “เวทมนตร์” นี้ไม่ได้เกิดขึ้นเพียงชั่วข้ามคืน แต่มันมีวิวัฒนาการที่ยาวนานและเต็มไปด้วยศัพท์เทคนิคที่น่าสนใจ ในรายการ TechCut EP.1 คุณบี - พีรณัฎฐ์ ทูลแสงงาม จาก Muze และ พี่หมู - ณัฐวุฒิ พึงเจริญพงศ์ ได้พาเราย้อนกลับไปทำความเข้าใจรากฐานที่สำคัญ เพื่อให้เรา “คุยกับ AI รู้เรื่อง” มากขึ้น — ไม่ใช่แค่ “AI ทำงานยังไง” แต่ “ทำไม AI ถึงทำงานแบบนี้”
1. จุดกำเนิด: เมื่อคอมพิวเตอร์เริ่ม “เรียนรู้” ได้เอง

ย้อนกลับไปก่อนยุคทองของ AI การทำให้คอมพิวเตอร์ทำงานอย่างใดอย่างหนึ่ง เราต้องเขียนคำสั่งแบบ “If-Then-Else” (ถ้าเป็นแบบนี้ ให้ทำแบบนั้น) ซึ่งมีความซับซ้อนและจำกัด แต่จุดเปลี่ยนเกิดขึ้นเมื่อเราก้าวเข้าสู่ยุคของ Machine Learning (ML)
Machine Learning คืออะไร? แทนที่จะบอกขั้นตอนทั้งหมด เราเปลี่ยนมาเป็นการให้ “ข้อมูล” (Data) และ “ผลลัพธ์ที่ต้องการ” เพื่อให้คอมพิวเตอร์ไปหาวิธีการ (Pattern) ด้วยตัวเอง
Deep Learning: คือขั้นกว่าของ ML ที่พยายามจำลองโครงสร้างสมองมนุษย์ที่เรียกว่า Neural Networks มาใช้ในการประมวลผล ทำให้ AI เริ่มจำแนกรูปภาพ หรือเข้าใจเสียงพูดได้ใกล้เคียงมนุษย์มากขึ้น
แต่ทำไม If-Then-Else ถึงไม่พอ? คำตอบคือ combinatorial explosion — จำนวนสถานการณ์ที่เป็นไปได้เพิ่มขึ้นเร็วจนเขียน rule ตามไม่ทัน หมากรุกมี 10¹²⁰ positions ที่เป็นไปได้ — มากกว่าจำนวนอะตอมในจักรวาล ไม่มีทางเขียน if-else ครอบคลุมได้หมด
ยิ่งชัดขึ้นกับ spam filter — เมื่อ rule บล็อกคำว่า “ฟรี” spam ก็เขียนว่า “fr33” หรือ “f.r.e.e.” ระบบ rule-based วิ่งตามไม่ทัน ก็สะสม rule หลายพันข้อที่ conflict กันเองและ maintain ไม่ได้
Machine Learning แก้ตรงนี้โดยไม่ได้ให้ระบบเรียนรู้ rule ที่เราเขียน แต่ให้เรียนรู้ representation จากข้อมูล — ชั้นแรกของ Neural Network เรียนรู้ pattern เล็กๆ เช่น ความสัมพันธ์ระหว่างคำ ชั้นถัดไปเรียนรู้ pattern ที่ซับซ้อนขึ้น จนชั้นสุดท้ายเข้าใจ concept ได้
2. เข้าใจคำว่า “Generative” มันต่างจาก AI ยุคก่อนอย่างไร?
คุณบีและพี่หมูได้อธิบายความแตกต่างที่ชัดเจนเพื่อให้เห็นภาพตามได้ง่ายๆ:
Predictive AI (AI ยุคเดิม): เน้นการ “ทำนาย” หรือ “จำแนก” เช่น ดูรูปแล้วบอกได้ว่าเป็นรูปแมว หรือทำนายว่ายอดขายเดือนหน้าจะเป็นอย่างไร
Generative AI (AI ยุคใหม่): คือการ “สร้างสรรค์” สิ่งใหม่ขึ้นมา (Generate) ไม่ว่าจะเป็น ข้อความ, รูปภาพ, หรือแม้แต่ Code โปรแกรม โดยอาศัยการเรียนรู้จากข้อมูลมหาศาลเพื่อเดาว่า “สิ่งที่ควรจะเกิดขึ้นต่อไปคืออะไร”
เปรียบให้เห็นภาพชัดขึ้น: Predictive AI คือ นักวิจารณ์เพลง ที่บอกได้ว่าเพลงไหนดีหรือไม่ดี — Generative AI คือ นักแต่งเพลง ที่เขียนเพลงใหม่ขึ้นมาได้เอง ทั้งคู่ต้องเรียนรู้จากเพลงจำนวนมากเท่ากัน แต่สิ่งที่ทำได้นั้นต่างกันโดยสิ้นเชิง
แทนที่จะเรียนรู้ว่า input แต่ละอันอยู่ใน category ไหน Generative AI เรียนรู้ distribution ของข้อมูลทั้งหมด จากนั้น sample จาก distribution นั้นเพื่อสร้างสิ่งใหม่ที่ไม่เคยมีมาก่อน
3. Large Language Model (LLM): สมองเบื้องหลังความฉลาด

หัวใจสำคัญที่ทำให้ Generative AI อย่าง ChatGPT เก่งจนน่าตกใจคือสิ่งที่เรียกว่า LLM หรือ Large Language Model
- มันคือการเอาข้อมูลจากโลกอินเทอร์เน็ตเกือบทั้งหมดมาให้ AI อ่าน เพื่อให้มันเข้าใจ “บริบทของภาษา” และ “ความสัมพันธ์ของคำ”
- ความมหัศจรรย์ของ Context: LLM ไม่ได้แค่จำคำศัพท์ แต่มันเข้าใจว่าเมื่อเราพูดคำว่า “ธนาคาร” ในประโยคที่เกี่ยวกับ “ปลา” มันควรจะหมายถึงสถานที่หรืออย่างอื่นกันแน่ (Semantic Meaning)
สิ่งที่ทำให้ LLM เข้าใจ context ได้ดีขนาดนี้คือสิ่งที่เรียกว่า Transformer + Self-Attention ซึ่งถูกเสนอในงานวิจัยชื่อ “Attention is All You Need” เมื่อปี 2017 — แทนที่จะอ่านทีละคำแบบ AI รุ่นก่อน Transformer “มอง” ทุกคำในประโยคพร้อมกัน และเรียนรู้ว่าคำไหนสำคัญต่อคำไหน
เมื่อ process คำว่า “มัน” ในประโยค “แมวกินปลา เพราะมันหิว” — Transformer เรียนรู้ที่จะ attend ไปยัง “แมว” ไม่ใช่ “ปลา” และสิ่งนี้เกิดขึ้นสำหรับทุกคำพร้อมกัน ทำให้เข้าใจ context ลึกกว่าระบบเดิมมาก
จากนั้น Scale นำมาซึ่ง Emergent Capabilities ที่นักวิจัยไม่ได้คาดไว้: GPT-2 เขียนต่อเนื่องได้พอใช้ → GPT-3 เริ่มทำ few-shot learning → GPT-4 อธิบาย code ผิดพลาดได้ เขียน legal document ได้ วิเคราะห์รูปภาพได้ — ไม่มีใครออกแบบให้ทำสิ่งเหล่านี้โดยตรง มันเกิดจาก scale ล้วนๆ
4. ทำไมเรื่องนี้ถึงสำคัญกับธุรกิจในวันนี้?

ที่ Muze เรามองว่าการเข้าใจศัพท์เหล่านี้ไม่ใช่แค่เรื่องของโปรแกรมเมอร์ แต่คืออาวุธสำคัญของนักธุรกิจยุคใหม่
Prompt Engineering: เมื่อเราเข้าใจว่า AI เรียนรู้แบบไหน เราจะสามารถ “สั่งการ” (Prompt) ได้อย่างแม่นยำ เพื่อให้ได้ผลลัพธ์ที่มีประสิทธิภาพสูงสุด
Efficiency: การนำ AI เข้ามาช่วยในกระบวนการทำงาน ไม่ใช่การแทนที่คน แต่คือการเพิ่มขีดความสามารถ (Augmented Intelligence) ให้มนุษย์ทำงานที่ซับซ้อนได้เร็วขึ้นหลายเท่าตัว
ตัวอย่างที่เห็นชัดจากงาน Muze คือ KTC search intelligence — ระบบค้นหาสินค้าและ promotion ที่ใช้ Elasticsearch เพื่อให้เข้าใจ intent ไม่ใช่แค่ keyword matching แบบเดิม: keyword search บล็อกคำว่า “บัตรกดเงิน” จะไม่เจอ “สินเชื่อส่วนบุคคล” แม้จะเป็นสิ่งเดียวกัน — แต่ semantic search เข้าใจความสัมพันธ์ระหว่าง concept ทำให้ผู้ใช้เจอสิ่งที่ต้องการจริงๆ แม้ใช้คำต่างกัน
ความเข้าใจ foundation ยังช่วยในการ ประเมิน AI vendor ได้จริง ทีมที่รู้ว่า Transformer ต้องการข้อมูลเยอะแค่ไหนถึงจะทำงานได้ดี จะตั้งคำถามที่ถูกต้องกับ vendor ที่บอกว่า “เรามี AI” แต่ไม่ได้อธิบายว่า train ด้วยอะไร กับ data ขนาดไหน
บทสรุปจาก Muze
การทำความเข้าใจรากฐานของ AI ในยุคแรกเริ่ม จะช่วยให้เรามองเห็นภาพรวมและทิศทางที่เทคโนโลยีนี้กำลังจะมุ่งไปในอนาคต ที่ Muze เราไม่หยุดเพียงแค่การติดตามกระแส แต่เราเจาะลึกถึงแก่นของเทคโนโลยีเพื่อนำมาปรับใช้ให้เกิดประโยชน์สูงสุดกับลูกค้าและพาร์ทเนอร์ของเรา
ไม่ว่าเทคโนโลยีจะเปลี่ยนไปแค่ไหน หัวใจสำคัญคือการนำมันมาใช้แก้ปัญหาให้ถูกจุด — เข้าใจว่า AI เหมาะกับงานแบบไหน ต้องการข้อมูลแบบไหน และควรตั้ง expectation ไว้ที่ระดับใด
อ่านเพิ่มเติม: วิธีที่ Muze ออกแบบ AI Workflow จริงในองค์กร →
ถอดบทเรียนจากรายการ TechCut EP.1 — “ก่อนจะกลายเป็น Generative AI ที่เรารู้จักทุกวันนี้ เขาเรียกว่าอะไร? ศัพท์ AI ตอนที่ 1”