AI ด้านการมองเห็นสมัยใหม่และความเข้าใจแบบพหุโมดอล

เรียนรู้วิธีที่ AI ตีความรูปภาพและข้อความร่วมกัน โดยใช้การประมวลผลสัญญาณพื้นฐานและสถาปัตยกรรมพหุโมดอลที่ทันสมัย

4.4 (30) ⏱ 30 นาที 📚 11 บทเรียน 🎧 เวอร์ชันเสียง

เกี่ยวกับคอร์สนี้

ในยุคที่ปัญญาประดิษฐ์ต้องนำทางในโลกที่มีทั้งภาพและคำพูด การทำความเข้าใจว่าเครื่องจักรประมวลผลข้อมูลประเภทต่างๆ อย่างไรจึงเป็นสิ่งสำคัญ หลักสูตรนี้จะนำเสนอเส้นทางที่ชัดเจนสู่กลไกของปัญญาด้านการมองเห็นและพหุโมดอล โดยอธิบายว่าระบบเชื่อมช่องว่างระหว่างพิกเซลและภาษาได้อย่างไร คุณจะได้เรียนรู้ตั้งแต่รากฐานทางคณิตศาสตร์ของการประมวลผลสัญญาณ ไปจนถึงโมเดลที่ซับซ้อนซึ่งขับเคลื่อนแอปพลิเคชัน AI ที่เป็นที่รู้จักมากที่สุดในปัจจุบัน เมื่อจบคอร์สนี้ คุณจะเข้าใจตรรกะพื้นฐานของระบบการมองเห็นสมัยใหม่ และวิธีที่ระบบเหล่านี้รวมข้อมูลหลายรูปแบบเข้าด้วยกันเพื่อแก้ไขงานที่ซับซ้อน ด้วยคำอธิบายที่เป็นลายลักษณ์อักษรและตัวอย่างเชิงปฏิบัติ คุณจะได้รับความเข้าใจทั้งในเชิงแนวคิดและเชิงเทคนิคว่า AI 'มองเห็น' และ 'เข้าใจ' โลกได้อย่างไร สิ่งที่คุณจะได้เรียนรู้: - ทำความเข้าใจการประมวลผลสัญญาณพื้นฐานและบทบาทของ Fourier transforms ในข้อมูลภาพ - เรียนรู้กลไกของ Nonlinear Support Vector Machines (NSVMs) สำหรับการจำแนกข้อมูลที่ซับซ้อน - สำรวจสถาปัตยกรรมของ Vision Transformers (ViT) และวิธีที่พวกมันปฏิวัติการวิเคราะห์ภาพ - ประยุกต์ใช้แนวคิดพหุโมดอล เช่น CLIP เพื่อเชื่อมโยงข้อมูลภาพเข้ากับภาษามนุษย์ - ทำความเข้าใจ vector embeddings และวิธีที่พวกมันช่วยให้การดึงข้อมูลข้ามโมดอลมีประสิทธิภาพ - ฝึกฝนการตีความสถาปัตยกรรมโมเดลสมัยใหม่ผ่านการวิเคราะห์ที่เป็นลายลักษณ์อักษรและแบบฝึกหัดเชิงแนวคิด หลักสูตรนี้เริ่มต้นด้วยคำศัพท์ที่จำเป็นและพื้นฐานทางคณิตศาสตร์ของการประมวลผลสัญญาณ ก่อนที่จะก้าวไปสู่โครงสร้างการเรียนรู้เชิงลึกและการบูรณาการพหุโมดอล หลักสูตรนี้ออกแบบมาสำหรับผู้เริ่มต้นและผู้เรียนที่อยากรู้อยากเห็นที่ต้องการทำความเข้าใจ 'วิธีการ' เบื้องหลัง AI ด้านการมองเห็นสมัยใหม่ โดยไม่จำเป็นต้องมีประสบการณ์มาก่อนในสาขานี้ เริ่มต้นการเดินทางของคุณสู่อนาคตของปัญญาพหุโมดอลได้แล้ววันนี้

สิ่งที่คุณจะได้รับ

  • 📜 ใบประกาศนียบัตร
    เพิ่มในโปรไฟล์ LinkedIn ของคุณ
  • 💬 Personal AI tutor
    Stuck on a lesson? Ask your built-in tutor anything, any time.
  • 🎧 รวมเวอร์ชันเสียง
    เรียนได้ทุกที่ ไม่ต้องดูจอ
  • ♾️ เข้าถึงตลอดชีพ
    กลับมาเรียนได้ตลอด ไม่มีหมดอายุ
  • 📱 โทรศัพท์หรือคอมพิวเตอร์
    ใช้งานได้ทุกที่ ทุกอุปกรณ์
  • 💸 คืนเงิน 30 วัน
    ไม่ต้องอธิบาย
  • กระชับและตรงประเด็น
    30 นาที เนื้อหาเชิงปฏิบัติ

รีวิว

ยังไม่มีรีวิว — เป็นคนแรกที่แชร์ประสบการณ์

เขียนรีวิว

หลังจากส่ง เราจะขอให้คุณเข้าสู่ระบบ — ฉบับร่างของคุณถูกบันทึก

ผู้เรียนคนอื่นเรียน

คู่มือสำหรับผู้เริ่มต้น Deep Learning สำหรับการจำแนกรูปภาพ

เตรียมความพร้อมให้คุณเพื่อทำความเข้าใจ สร้าง และประเมินโมเดล deep learning สำหรับงานจำแนกรูปภาพที่หลากหลาย ตั้งแต่พื้นฐาน
★ 4.9 (19)
$4.99

การเรียนรู้เชิงลึกสำหรับคอมพิวเตอร์วิทัศน์: การตรวจจับความผิดปกติและการสังเคราะห์ข้อมูล

เรียนรู้การสร้างโมเดลคอมพิวเตอร์วิทัศน์เพื่อตรวจจับความผิดปกติในภาพ ติดป้ายกำกับโดยอัตโนมัติ และสร้างข้อมูลสังเคราะห์สำหรับฝึกสอนแม้จะมีชุดข้อมูลที่จำกัด
★ 4.9 (15)
$4.99

เครือข่ายประสาทแบบคอนวอลเลชั่นสำหรับผู้เริ่มต้น

เรียนรู้พื้นฐานของการมองเห็นด้วยคอมพิวเตอร์ และเรียนรู้การสร้าง ระบบประสาทที่สามารถวิเคราะห์และจดจำภาพได้
★ 4.9 (1,473)
$4.99

ความรู้เบื้องต้นเกี่ยวกับการสร้างภาพด้วย AI และ Diffusion Models

ทำความเข้าใจหลักการทางวิทยาศาสตร์พื้นฐานเบื้องหลัง diffusion models สมัยใหม่ และเรียนรู้วิธีที่ระบบ text-to-image สร้างสรรค์ภาพที่มีคุณภาพสูง
★ 4.8 (16)
$4.99

คำถามที่พบบ่อย

ฉันต้องใช้อะไรในการเรียนคอร์สนี้? +

แค่โทรศัพท์หรือคอมพิวเตอร์ที่มีอินเทอร์เน็ต ไม่ต้องติดตั้งหรือใช้อุปกรณ์พิเศษ

ฉันชำระเงินอย่างไร? +

ผ่านบัตรด้วย Stripe หรือคริปโต เราไม่เก็บข้อมูลบัตร — Stripe จัดการอย่างปลอดภัย

ฉันขอคืนเงินได้ไหม? +

ใช่ — คืนเงินเต็มจำนวนใน 30 วัน ไม่ต้องอธิบาย

ฉันมีสิทธิ์เข้าถึงนานเท่าไร? +

ตลอดไป เมื่อซื้อแล้วคอร์สเป็นของคุณ กลับมาเรียนได้ตลอด

ฉันจะได้ใบประกาศนียบัตรไหม? +

ได้ เมื่อเรียนจบจะได้รับใบประกาศนียบัตรที่เพิ่มในโปรไฟล์ LinkedIn ได้

ออกแบบสำหรับผู้เรียนใน
เทคโนโลยี ดีไซน์ การเงิน การตลาด สาธารณสุข การศึกษา ธุรกิจการบริการ อุตสาหกรรม