★ 4.0 (3) ⏱ 2 jam 42 mnt 📚 27 pelajaran 🎧 Versi audio

Building Multimodal Generative AI Applications

Name: Building Multimodal Generative AI Applications
Price: 159000 IDR
Availability: InStock
Rating: 4.0 (3 reviews)

Learn to combine text, speech, and images using modern AI models like Whisper and Granite to build intelligent, multi-sensory applications.

💬 Instruktur AI
Tanyakan apa pun tentang pelajaran dan dapatkan jawaban jelas seketika, kapan saja.
🕐 Mulai kapan saja
Tanpa jadwal atau tenggat — belajar dengan kecepatan sendiri, kapan pun Anda mau.
🌐 Dalam bahasa Indonesia
Pelajaran, tugas, dan sertifikat — semuanya sepenuhnya dalam bahasa Anda.

Tentang kursus ini

AI is no longer limited to just reading and writing text. Modern applications must process speech, images, and video simultaneously to deliver truly intelligent, real-world experiences.

In this course, you will learn how to connect different data types—text, audio, and visual inputs—to build cohesive, multimodal generative AI systems. You will understand how these models communicate, align different media formats, and work together to solve complex problems. By focusing on practical written design patterns and structural concepts, you will gain the confidence to architect applications that can hear, see, and speak.

What you'll learn:
- Understand the core concepts of multimodal AI, including how models process text, image, and audio inputs simultaneously.
- Apply speech-to-text models like Whisper to transcribe and analyze audio data.
- Explore image and video generation concepts using modern generative models like Granite.
- Implement multimodal prompt engineering techniques to guide models across different media types.
- Manage multimodal embeddings and vector databases to store and retrieve cross-media information.
- Design basic orchestration workflows to connect language models with vision and speech tools.

The journey begins with foundational definitions of multimodal architectures before moving into step-by-step written guides on audio processing, computer vision integration, and cross-modal orchestration. You will practice these concepts through written code walkthroughs and conceptual design exercises.

This course is designed for beginner developers, technical product managers, and AI enthusiasts who want to understand the next generation of AI systems, requiring only basic programming familiarity.

Start reading today to unlock the potential of multi-sensory artificial intelligence.

Apa yang Anda dapatkan

📜 Sertifikat penyelesaian
Tambahkan ke profil LinkedIn Anda
💬 Tutor AI pribadi
Bingung di tengah pelajaran? Tanya tutor bawaan kamu apa saja, kapan saja.
🎧 Termasuk versi audio
Belajar di mana saja — tanpa layar
♾️ Akses seumur hidup
Kembali kapan saja, tanpa kedaluwarsa
📱 Ponsel atau komputer
Berfungsi di mana saja, perangkat apa saja
💸 Pengembalian 14 hari
Tanpa pertanyaan
⚡ Singkat dan fokus
2 jam 42 mnt konten praktis

Sertifikat penyelesaian

Setiap kursus yang Anda selesaikan di PickAClass menerbitkan kredensial seperti ini — orisinal, dengan kodenya sendiri, dapat diverifikasi via URL, dan rinci tentang yang benar-benar ditunjukkan.

PickAClass

Profil keterampilan · terverifikasi

Dokumen

Sertifikat Penguasaan

Ini menyatakan bahwa

Nama Lengkap

telah berhasil menunjukkan penguasaan

Building Multimodal Generative AI Applications

Keterampilan yang ditunjukkan

✓

Analisis pola perilaku

Dasar

1.2 jam

✓

Kerangka arsitektur keputusan

Mahir

1.4 jam

✓

Desain uji A/B

Mahir

1.7 jam

✓

Copywriting perilaku

Lanjutan

1.9 jam

PickAClass — Nama Lengkap

Building Multimodal Generative AI Applications

Halaman 2 dari 2

Detail kinerja

Ringkasan tugas kursus

Pelajaran selesai 14 / 14

Soal latihan 26 / 28

Tugas dikirim 4 (rata 4,5 / 5)

Proyek capstone Ditinjau — 4,6 / 5

Total latihan 6.2 jam

Tolok ukur kinerja

Peringkat kohort 12% teratas dari 1,625

Waktu penyelesaian 11 hari (median: 22)

Skor penguasaan 91 / 100

Skor soal latihan 94%

Verifikasi keterampilan Jalur Keterampilan terverifikasi

Lihat contoh sertifikat →

Ulasan (3)

Orhan Sönmez TR

★ 5 · 13.07.2026

Sangat menikmati materi. Contohnya tepat dan membantu menguatkan konsep.

Ethan Klein LU Pelajar terverifikasi

★ 3 · 07.06.2026

Sangat senang aku mengambil kursus ini. aplikasi praktis yang ditunjukkan sangat membantu, dan struktur keseluruhan adalah kelas atas.

زينب بنت حمد الكواري QA

★ 4 · 30.05.2026

Sangat menikmati aliran ini. aplikasi praktis yang dibahas tepat sasaran. kursus yang hebat!

Pelajar lain juga mengambil

🔥 Populer 🎓 Dengan sertifikat

Pertanyaan umum

Apa yang saya butuhkan untuk mengikuti kursus ini? +

Cukup ponsel atau komputer dengan internet. Tidak ada instalasi atau perangkat khusus.

Bagaimana cara membayar? +

Dengan kartu via Stripe. Kami tidak menyimpan detail kartu — Stripe menanganinya dengan aman.

Bisakah saya mendapat refund? +

Ya — refund penuh dalam 14 hari, tanpa pertanyaan.

Berapa lama saya akan punya akses? +

Selamanya. Setelah membeli, kursus jadi milik Anda untuk dikunjungi lagi kapan saja.

Apakah saya akan mendapat sertifikat? +

Ya. Setelah selesai, Anda akan menerima sertifikat yang bisa ditambahkan ke profil LinkedIn.

Dibuat untuk pelajar di

Teknologi Desain Keuangan Pemasaran Kesehatan Pendidikan Perhotelan Manufaktur

⭐ Pilihan siswa 🎓 Dengan sertifikat

Rp 159.000

✓ Harga tetap Rp 159.000 — kursus apa pun, selamanya. Tanpa kedaluwarsa.

Beli sekarang →

atau

Dapatkan seharga Rp 0 dengan keanggotaan

10 kursus tiap bulan · Rp 790.000/bln · Batalkan kapan saja

✓ Sertifikat penyelesaian
✓ Termasuk versi audio
✓ Akses seumur hidup
✓ Pembayaran sekali · tanpa perpanjangan otomatis
✓ Jaminan uang kembali 14 hari
✓ Ponsel atau komputer

Pembayaran aman via Stripe

Building Multimodal Generative AI Applications

Tentang kursus ini

Apa yang Anda dapatkan

Sertifikat penyelesaian

Ulasan (3)

Tulis ulasan

Pelajar lain juga mengambil

Generative AI untuk Seniman Tato: Desain dan Penempatan

AI Voice Cloning: Bangun Suara Digital Pribadi Anda

AI untuk Pengajar ESL: Pelajaran, Teks, dan Tes

Fondasi LLMOps: Mendeploy, Melakukan Versi, dan Memantau LLM

Pertanyaan umum