AI ด้านการมองเห็นสมัยใหม่และความเข้าใจแบบพหุโมดอล
เรียนรู้วิธีที่ AI ตีความรูปภาพและข้อความร่วมกัน โดยใช้การประมวลผลสัญญาณพื้นฐานและสถาปัตยกรรมพหุโมดอลที่ทันสมัย
เกี่ยวกับคอร์สนี้
ในยุคที่ปัญญาประดิษฐ์ต้องนำทางในโลกที่มีทั้งภาพและคำพูด การทำความเข้าใจว่าเครื่องจักรประมวลผลข้อมูลประเภทต่างๆ อย่างไรจึงเป็นสิ่งสำคัญ หลักสูตรนี้จะนำเสนอเส้นทางที่ชัดเจนสู่กลไกของปัญญาด้านการมองเห็นและพหุโมดอล โดยอธิบายว่าระบบเชื่อมช่องว่างระหว่างพิกเซลและภาษาได้อย่างไร คุณจะได้เรียนรู้ตั้งแต่รากฐานทางคณิตศาสตร์ของการประมวลผลสัญญาณ ไปจนถึงโมเดลที่ซับซ้อนซึ่งขับเคลื่อนแอปพลิเคชัน AI ที่เป็นที่รู้จักมากที่สุดในปัจจุบัน
เมื่อจบคอร์สนี้ คุณจะเข้าใจตรรกะพื้นฐานของระบบการมองเห็นสมัยใหม่ และวิธีที่ระบบเหล่านี้รวมข้อมูลหลายรูปแบบเข้าด้วยกันเพื่อแก้ไขงานที่ซับซ้อน ด้วยคำอธิบายที่เป็นลายลักษณ์อักษรและตัวอย่างเชิงปฏิบัติ คุณจะได้รับความเข้าใจทั้งในเชิงแนวคิดและเชิงเทคนิคว่า AI 'มองเห็น' และ 'เข้าใจ' โลกได้อย่างไร
สิ่งที่คุณจะได้เรียนรู้:
- ทำความเข้าใจการประมวลผลสัญญาณพื้นฐานและบทบาทของ Fourier transforms ในข้อมูลภาพ
- เรียนรู้กลไกของ Nonlinear Support Vector Machines (NSVMs) สำหรับการจำแนกข้อมูลที่ซับซ้อน
- สำรวจสถาปัตยกรรมของ Vision Transformers (ViT) และวิธีที่พวกมันปฏิวัติการวิเคราะห์ภาพ
- ประยุกต์ใช้แนวคิดพหุโมดอล เช่น CLIP เพื่อเชื่อมโยงข้อมูลภาพเข้ากับภาษามนุษย์
- ทำความเข้าใจ vector embeddings และวิธีที่พวกมันช่วยให้การดึงข้อมูลข้ามโมดอลมีประสิทธิภาพ
- ฝึกฝนการตีความสถาปัตยกรรมโมเดลสมัยใหม่ผ่านการวิเคราะห์ที่เป็นลายลักษณ์อักษรและแบบฝึกหัดเชิงแนวคิด
หลักสูตรนี้เริ่มต้นด้วยคำศัพท์ที่จำเป็นและพื้นฐานทางคณิตศาสตร์ของการประมวลผลสัญญาณ ก่อนที่จะก้าวไปสู่โครงสร้างการเรียนรู้เชิงลึกและการบูรณาการพหุโมดอล หลักสูตรนี้ออกแบบมาสำหรับผู้เริ่มต้นและผู้เรียนที่อยากรู้อยากเห็นที่ต้องการทำความเข้าใจ 'วิธีการ' เบื้องหลัง AI ด้านการมองเห็นสมัยใหม่ โดยไม่จำเป็นต้องมีประสบการณ์มาก่อนในสาขานี้ เริ่มต้นการเดินทางของคุณสู่อนาคตของปัญญาพหุโมดอลได้แล้ววันนี้
สิ่งที่คุณจะได้รับ
-
📜
ใบประกาศนียบัตร
เพิ่มในโปรไฟล์ LinkedIn ของคุณ -
🎧
รวมเวอร์ชันเสียง
เรียนได้ทุกที่ ไม่ต้องดูจอ -
♾️
เข้าถึงตลอดชีพ
กลับมาเรียนได้ตลอด ไม่มีหมดอายุ -
📱
โทรศัพท์หรือคอมพิวเตอร์
ใช้งานได้ทุกที่ ทุกอุปกรณ์ -
💸
คืนเงิน 30 วัน
ไม่ต้องอธิบาย -
⚡
กระชับและตรงประเด็น
30 นาที เนื้อหาเชิงปฏิบัติ
รีวิว
ยังไม่มีรีวิว — เป็นคนแรกที่แชร์ประสบการณ์
ผู้เรียนคนอื่นเรียน
เตรียมความพร้อมให้คุณเพื่อทำความเข้าใจ สร้าง และประเมินโมเดล deep learning สำหรับงานจำแนกรูปภาพที่หลากหลาย ตั้งแต่พื้นฐาน
$4.99$9.99
เรียนรู้การสร้างโมเดลคอมพิวเตอร์วิทัศน์เพื่อตรวจจับความผิดปกติในภาพ ติดป้ายกำกับโดยอัตโนมัติ และสร้างข้อมูลสังเคราะห์สำหรับฝึกสอนแม้จะมีชุดข้อมูลที่จำกัด
$4.99$9.99
เรียนรู้พื้นฐานของการมองเห็นด้วยคอมพิวเตอร์ และเรียนรู้การสร้าง ระบบประสาทที่สามารถวิเคราะห์และจดจำภาพได้
$4.99$9.99
ทำความเข้าใจหลักการทางวิทยาศาสตร์พื้นฐานเบื้องหลัง diffusion models สมัยใหม่ และเรียนรู้วิธีที่ระบบ text-to-image สร้างสรรค์ภาพที่มีคุณภาพสูง
$4.99$9.99
คำถามที่พบบ่อย
ฉันต้องใช้อะไรในการเรียนคอร์สนี้? +
แค่โทรศัพท์หรือคอมพิวเตอร์ที่มีอินเทอร์เน็ต ไม่ต้องติดตั้งหรือใช้อุปกรณ์พิเศษ
ฉันชำระเงินอย่างไร? +
ผ่านบัตรด้วย Stripe หรือคริปโต เราไม่เก็บข้อมูลบัตร — Stripe จัดการอย่างปลอดภัย
ฉันขอคืนเงินได้ไหม? +
ใช่ — คืนเงินเต็มจำนวนใน 30 วัน ไม่ต้องอธิบาย
ฉันมีสิทธิ์เข้าถึงนานเท่าไร? +
ตลอดไป เมื่อซื้อแล้วคอร์สเป็นของคุณ กลับมาเรียนได้ตลอด
ฉันจะได้ใบประกาศนียบัตรไหม? +
ได้ เมื่อเรียนจบจะได้รับใบประกาศนียบัตรที่เพิ่มในโปรไฟล์ LinkedIn ได้
ออกแบบสำหรับผู้เรียนใน
เทคโนโลยี
ดีไซน์
การเงิน
การตลาด
สาธารณสุข
การศึกษา
ธุรกิจการบริการ
อุตสาหกรรม