จาก Code สู่ความคิด: เจาะลึกรากฐาน AI ก่อนจะมาเป็นยุค Generative AI ในปัจจุบัน

Muze เจาะ mechanics จริงของ AI — ทำไม rule-based ล้มเหลว, Neural Network เรียนรู้ยังไง, Transformer เปลี่ยนอะไรในปี 2017, และบทเรียนจากโปรเจกต์จริงที่ทำให้เห็นภาพ

ในวันที่คำว่า “Generative AI” และ “ChatGPT” กลายเป็นคำที่ทุกคนพูดถึง หลายคนอาจจะลืมไปว่าเทคโนโลยีที่ดูเหมือน “เวทมนตร์” นี้ไม่ได้เกิดขึ้นเพียงชั่วข้ามคืน แต่มันมีวิวัฒนาการที่ยาวนานและเต็มไปด้วยศัพท์เทคนิคที่น่าสนใจ ในรายการ TechCut EP.1 คุณบี - พีรณัฎฐ์ ทูลแสงงาม จาก Muze และ พี่หมู - ณัฐวุฒิ พึงเจริญพงศ์ ได้พาเราย้อนกลับไปทำความเข้าใจรากฐานที่สำคัญ เพื่อให้เรา “คุยกับ AI รู้เรื่อง” มากขึ้น — ไม่ใช่แค่ “AI ทำงานยังไง” แต่ “ทำไม AI ถึงทำงานแบบนี้”

1. จุดกำเนิด: เมื่อคอมพิวเตอร์เริ่ม “เรียนรู้” ได้เอง

จาก Code สู่ความคิด: flowchart rule-based ทางซ้ายเปลี่ยนผ่านเป็น Neural Network ทางขวา — visualizing the journey from code to cognition

ย้อนกลับไปก่อนยุคทองของ AI การทำให้คอมพิวเตอร์ทำงานอย่างใดอย่างหนึ่ง เราต้องเขียนคำสั่งแบบ “If-Then-Else” (ถ้าเป็นแบบนี้ ให้ทำแบบนั้น) ซึ่งมีความซับซ้อนและจำกัด แต่จุดเปลี่ยนเกิดขึ้นเมื่อเราก้าวเข้าสู่ยุคของ Machine Learning (ML)

Machine Learning คืออะไร? แทนที่จะบอกขั้นตอนทั้งหมด เราเปลี่ยนมาเป็นการให้ “ข้อมูล” (Data) และ “ผลลัพธ์ที่ต้องการ” เพื่อให้คอมพิวเตอร์ไปหาวิธีการ (Pattern) ด้วยตัวเอง

Deep Learning: คือขั้นกว่าของ ML ที่พยายามจำลองโครงสร้างสมองมนุษย์ที่เรียกว่า Neural Networks มาใช้ในการประมวลผล ทำให้ AI เริ่มจำแนกรูปภาพ หรือเข้าใจเสียงพูดได้ใกล้เคียงมนุษย์มากขึ้น

แต่ทำไม If-Then-Else ถึงไม่พอ? คำตอบคือ combinatorial explosion — จำนวนสถานการณ์ที่เป็นไปได้เพิ่มขึ้นเร็วจนเขียน rule ตามไม่ทัน หมากรุกมี 10¹²⁰ positions ที่เป็นไปได้ — มากกว่าจำนวนอะตอมในจักรวาล ไม่มีทางเขียน if-else ครอบคลุมได้หมด

ยิ่งชัดขึ้นกับ spam filter — เมื่อ rule บล็อกคำว่า “ฟรี” spam ก็เขียนว่า “fr33” หรือ “f.r.e.e.” ระบบ rule-based วิ่งตามไม่ทัน ก็สะสม rule หลายพันข้อที่ conflict กันเองและ maintain ไม่ได้

Machine Learning แก้ตรงนี้โดยไม่ได้ให้ระบบเรียนรู้ rule ที่เราเขียน แต่ให้เรียนรู้ representation จากข้อมูล — ชั้นแรกของ Neural Network เรียนรู้ pattern เล็กๆ เช่น ความสัมพันธ์ระหว่างคำ ชั้นถัดไปเรียนรู้ pattern ที่ซับซ้อนขึ้น จนชั้นสุดท้ายเข้าใจ concept ได้

2. เข้าใจคำว่า “Generative” มันต่างจาก AI ยุคก่อนอย่างไร?

คุณบีและพี่หมูได้อธิบายความแตกต่างที่ชัดเจนเพื่อให้เห็นภาพตามได้ง่ายๆ:

Predictive AI (AI ยุคเดิม): เน้นการ “ทำนาย” หรือ “จำแนก” เช่น ดูรูปแล้วบอกได้ว่าเป็นรูปแมว หรือทำนายว่ายอดขายเดือนหน้าจะเป็นอย่างไร

Generative AI (AI ยุคใหม่): คือการ “สร้างสรรค์” สิ่งใหม่ขึ้นมา (Generate) ไม่ว่าจะเป็น ข้อความ, รูปภาพ, หรือแม้แต่ Code โปรแกรม โดยอาศัยการเรียนรู้จากข้อมูลมหาศาลเพื่อเดาว่า “สิ่งที่ควรจะเกิดขึ้นต่อไปคืออะไร”

เปรียบให้เห็นภาพชัดขึ้น: Predictive AI คือ นักวิจารณ์เพลง ที่บอกได้ว่าเพลงไหนดีหรือไม่ดี — Generative AI คือ นักแต่งเพลง ที่เขียนเพลงใหม่ขึ้นมาได้เอง ทั้งคู่ต้องเรียนรู้จากเพลงจำนวนมากเท่ากัน แต่สิ่งที่ทำได้นั้นต่างกันโดยสิ้นเชิง

แทนที่จะเรียนรู้ว่า input แต่ละอันอยู่ใน category ไหน Generative AI เรียนรู้ distribution ของข้อมูลทั้งหมด จากนั้น sample จาก distribution นั้นเพื่อสร้างสิ่งใหม่ที่ไม่เคยมีมาก่อน

3. Large Language Model (LLM): สมองเบื้องหลังความฉลาด

TechCut Knowledge Layer — LLM เรียนรู้จาก knowledge หลายชั้น: จาก raw text สู่ semantic understanding สู่ contextual reasoning

หัวใจสำคัญที่ทำให้ Generative AI อย่าง ChatGPT เก่งจนน่าตกใจคือสิ่งที่เรียกว่า LLM หรือ Large Language Model

มันคือการเอาข้อมูลจากโลกอินเทอร์เน็ตเกือบทั้งหมดมาให้ AI อ่าน เพื่อให้มันเข้าใจ “บริบทของภาษา” และ “ความสัมพันธ์ของคำ”
ความมหัศจรรย์ของ Context: LLM ไม่ได้แค่จำคำศัพท์ แต่มันเข้าใจว่าเมื่อเราพูดคำว่า “ธนาคาร” ในประโยคที่เกี่ยวกับ “ปลา” มันควรจะหมายถึงสถานที่หรืออย่างอื่นกันแน่ (Semantic Meaning)

สิ่งที่ทำให้ LLM เข้าใจ context ได้ดีขนาดนี้คือสิ่งที่เรียกว่า Transformer + Self-Attention ซึ่งถูกเสนอในงานวิจัยชื่อ “Attention is All You Need” เมื่อปี 2017 — แทนที่จะอ่านทีละคำแบบ AI รุ่นก่อน Transformer “มอง” ทุกคำในประโยคพร้อมกัน และเรียนรู้ว่าคำไหนสำคัญต่อคำไหน

เมื่อ process คำว่า “มัน” ในประโยค “แมวกินปลา เพราะมันหิว” — Transformer เรียนรู้ที่จะ attend ไปยัง “แมว” ไม่ใช่ “ปลา” และสิ่งนี้เกิดขึ้นสำหรับทุกคำพร้อมกัน ทำให้เข้าใจ context ลึกกว่าระบบเดิมมาก

จากนั้น Scale นำมาซึ่ง Emergent Capabilities ที่นักวิจัยไม่ได้คาดไว้: GPT-2 เขียนต่อเนื่องได้พอใช้ → GPT-3 เริ่มทำ few-shot learning → GPT-4 อธิบาย code ผิดพลาดได้ เขียน legal document ได้ วิเคราะห์รูปภาพได้ — ไม่มีใครออกแบบให้ทำสิ่งเหล่านี้โดยตรง มันเกิดจาก scale ล้วนๆ

4. ทำไมเรื่องนี้ถึงสำคัญกับธุรกิจในวันนี้?

CH3+ User Journey — technology ต้องออกแบบให้ตาม journey ของผู้ใช้จริง และใช้ AI ตรงจุดที่มันได้ผลจริง

ที่ Muze เรามองว่าการเข้าใจศัพท์เหล่านี้ไม่ใช่แค่เรื่องของโปรแกรมเมอร์ แต่คืออาวุธสำคัญของนักธุรกิจยุคใหม่

Prompt Engineering: เมื่อเราเข้าใจว่า AI เรียนรู้แบบไหน เราจะสามารถ “สั่งการ” (Prompt) ได้อย่างแม่นยำ เพื่อให้ได้ผลลัพธ์ที่มีประสิทธิภาพสูงสุด

Efficiency: การนำ AI เข้ามาช่วยในกระบวนการทำงาน ไม่ใช่การแทนที่คน แต่คือการเพิ่มขีดความสามารถ (Augmented Intelligence) ให้มนุษย์ทำงานที่ซับซ้อนได้เร็วขึ้นหลายเท่าตัว

ตัวอย่างที่เห็นชัดจากงาน Muze คือ KTC search intelligence — ระบบค้นหาสินค้าและ promotion ที่ใช้ Elasticsearch เพื่อให้เข้าใจ intent ไม่ใช่แค่ keyword matching แบบเดิม: keyword search บล็อกคำว่า “บัตรกดเงิน” จะไม่เจอ “สินเชื่อส่วนบุคคล” แม้จะเป็นสิ่งเดียวกัน — แต่ semantic search เข้าใจความสัมพันธ์ระหว่าง concept ทำให้ผู้ใช้เจอสิ่งที่ต้องการจริงๆ แม้ใช้คำต่างกัน

ความเข้าใจ foundation ยังช่วยในการ ประเมิน AI vendor ได้จริง ทีมที่รู้ว่า Transformer ต้องการข้อมูลเยอะแค่ไหนถึงจะทำงานได้ดี จะตั้งคำถามที่ถูกต้องกับ vendor ที่บอกว่า “เรามี AI” แต่ไม่ได้อธิบายว่า train ด้วยอะไร กับ data ขนาดไหน

ทีมที่เข้าใจ mechanics ของ AI จะเลือก vendor ได้ดีขึ้น ตั้ง expectation ได้ถูกต้องมากขึ้น และออกแบบ solution ที่ใช้ AI ตรงจุดมากขึ้น — ไม่ใช่แค่ซื้อ AI แล้วหวังว่ามันจะทำงานได้เอง

บทสรุปจาก Muze

การทำความเข้าใจรากฐานของ AI ในยุคแรกเริ่ม จะช่วยให้เรามองเห็นภาพรวมและทิศทางที่เทคโนโลยีนี้กำลังจะมุ่งไปในอนาคต ที่ Muze เราไม่หยุดเพียงแค่การติดตามกระแส แต่เราเจาะลึกถึงแก่นของเทคโนโลยีเพื่อนำมาปรับใช้ให้เกิดประโยชน์สูงสุดกับลูกค้าและพาร์ทเนอร์ของเรา

ไม่ว่าเทคโนโลยีจะเปลี่ยนไปแค่ไหน หัวใจสำคัญคือการนำมันมาใช้แก้ปัญหาให้ถูกจุด — เข้าใจว่า AI เหมาะกับงานแบบไหน ต้องการข้อมูลแบบไหน และควรตั้ง expectation ไว้ที่ระดับใด

อ่านเพิ่มเติม: วิธีที่ Muze ออกแบบ AI Workflow จริงในองค์กร →

คุยกับทีม Muze →

ถอดบทเรียนจากรายการ TechCut EP.1 — “ก่อนจะกลายเป็น Generative AI ที่เรารู้จักทุกวันนี้ เขาเรียกว่าอะไร? ศัพท์ AI ตอนที่ 1”

จาก Code สู่ความคิด: เจาะลึกรากฐาน AI ก่อนจะมาเป็นยุค Generative AI ในปัจจุบัน

1. จุดกำเนิด: เมื่อคอมพิวเตอร์เริ่ม “เรียนรู้” ได้เอง

2. เข้าใจคำว่า “Generative” มันต่างจาก AI ยุคก่อนอย่างไร?

3. Large Language Model (LLM): สมองเบื้องหลังความฉลาด

4. ทำไมเรื่องนี้ถึงสำคัญกับธุรกิจในวันนี้?

บทสรุปจาก Muze

บทความที่เกี่ยวข้อง

Human Expertise, AI-Accelerated: AI Process ที่ทำงานได้จริง ฉบับ Muze

Human คือ Source of Truth, AI คือ Publisher: บทบาทใหม่ในการสร้าง B2B Content

อนาคตของ AI: จากจุดเริ่มต้นสู่เทคโนโลยีที่เปลี่ยนโลก