เป็นการแนะนำที่ดีค่ะ ชอบขั้นตอนที่ชัดเจน แม้ว่าโมดูลหลังๆ น่าจะมีตัวอย่างมากกว่านี้อีกหน่อย
แนะนำการสกัดข้อมูลเว็บด้วยภาษาไพธอน
เรียนรู้การดึงข้อมูลจากเว็บไซต์แบบไดนามิกสมัยใหม่ โดยใช้ Scrapy, Selenium และไลบรารีภาษาไพธอนอื่น ๆ
เกี่ยวกับคอร์สนี้
คุณต้องการจะรวบรวมข้อมูลจากเว็บไซต์ แต่พบว่า กระบวนการคัดลอกข้อมูลด้วยมือนั้นช้าและไร้ประสิทธิภาพหรือไม่? การสกัดข้อมูลจากเว็บจะทำการอัตโนมัติกระบวนการนี้ ทำให้คุณสามารถรวบรวมข้อมูลจำนวนมากได้อย่างรวดเร็วและแม่นยำ
หลักสูตรนี้จะสอนพื้นฐานการแยกข้อมูลจากเว็บด้วยภาษาไพธอน โดยใช้ข้อความเป็นฐาน โดยจะเริ่มจากการทำความเข้าใจพื้นฐานของหน้าเว็บ จนถึงการสร้างเครื่องมือค้นหาข้อมูลที่แข็งแกร่ง ที่จะสามารถจัดการกับเว็บไซต์ที่ใช้จาวาสคริปต์ที่ซับซ้อนได้ เมื่อจบหลักสูตรแล้ว คุณจะสามารถเขียนสคริปต์เพื่อดึงข้อมูลที่ต้องการได้ด้วยความมั่นใจ
คุณจะเรียนรู้อะไร
- เรียนรู้พื้นฐานของการสแกนเวป รวมถึงคำร้องขอ HTTP โครงสร้าง HTML และจริยธรรมที่ดีที่สุด
- ฝึกดึงข้อมูลจากเว็บไซต์แบบสถิต โดยใช้ไลบรารีพื้นฐาน เช่น Requests และ BeautifulSoup
- สร้างเครื่องมือค้นหาข้อมูลบนเว็บที่สามารถปรับขนาดได้และมีประสิทธิภาพ ตั้งแต่พื้นฐานขึ้นไป โดยใช้กรอบ Scrapy ที่ทรงพลัง
- ใช้ตัวเลือก CSS และ XPath เพื่อเลือกและดึงข้อมูลที่ต้องการจากหน้าเว็บได้อย่างถูกต้อง
- เรียนรู้เทคนิคการแยกข้อมูลจากเว็บไซต์ที่ใช้ JavaScript ใช้โปรแกรมอัตโนมัติกับ Selenium
- ใช้สแครปปี้ในการประมวลผล ทำความสะอาด และบันทึกข้อมูลที่ดึงออกมาเป็นรูปแบบเช่น CSV และ JSON
- เข้าใจวิธีการจัดการกับปัญหาทั่วไป เช่น การจัดการหน้าต่าง, ตั้งค่าตัวแทนผู้ใช้, และหลีกเลี่ยงบล็อก
หลักสูตรนี้เริ่มต้นด้วยแนวคิดพื้นฐานและคำศัพท์ เพื่อให้แน่ใจว่าคุณมีความเข้าใจที่มั่นคงก่อนที่จะเริ่มโครงการสแครปในทางปฏิบัติ ทุกส่วนจะสร้างขึ้นจากส่วนก่อนหน้า โดยนำคุณไปสู่การร้องขอหน้าเว็บแบบง่าย ๆ ไปจนถึงโปรแกรมสแครปที่ซับซ้อน
หลักสูตรนี้ถูกออกแบบมาสำหรับผู้เริ่มต้น โดยไม่ต้องมีประสบการณ์ในการแยกข้อมูลจากเว็บมาก่อน อย่างไรก็ตาม การมีความรู้พื้นฐานเกี่ยวกับไวยากรณ์ของภาษาไพธอนจะช่วยได้มาก
เริ่มเรียนรู้วิธีแปลงเวบ เป็นแหล่งข้อมูลที่มีโครงสร้างของคุณเองวันนี้
สิ่งที่คุณจะได้รับ
-
📜
ใบประกาศนียบัตร
เพิ่มในโปรไฟล์ LinkedIn ของคุณ -
💬
Personal AI tutor
Stuck on a lesson? Ask your built-in tutor anything, any time. -
♾️
เข้าถึงตลอดชีพ
กลับมาเรียนได้ตลอด ไม่มีหมดอายุ -
📱
โทรศัพท์หรือคอมพิวเตอร์
ใช้งานได้ทุกที่ ทุกอุปกรณ์ -
💸
คืนเงิน 30 วัน
ไม่ต้องอธิบาย -
⚡
กระชับและตรงประเด็น
1 ชม. 31 นาที เนื้อหาเชิงปฏิบัติ
รีวิว (1)
ผู้เรียนคนอื่นเรียน
เรียนรู้การประมวลผลข้อความอย่างมีประสิทธิภาพและจัดการชุดข้อมูลโดยใช้ลิสต์, ทูเพิล และสตริงพื้นฐานของ Python
$4.99
เรียนรู้ที่จะจัดระเบียบ จัดเก็บ และจัดการข้อมูลอย่างมีประสิทธิภาพโดยใช้คอลเลกชัน Python ในตัวสำหรับการประมวลผลข้อมูลในโลกแห่งความเป็นจริง
$4.99
ค้นพบวิธีการจำแนกข้อความและสร้างเวิร์กโฟลว์การประมวลผลภาษาธรรมชาติเบื้องต้นโดยใช้ไลบรารี Python สมัยใหม่
$4.99
เรียนรู้พื้นฐานของ NLP ในภาษาไพธอน เพื่อสร้างการจัดหมวดหมู่ข้อความของคุณเอง การวิเคราะห์ความรู้สึก และแบบจำลองการประมวลผลภาษา
$4.99
คำถามที่พบบ่อย
ฉันต้องใช้อะไรในการเรียนคอร์สนี้? +
แค่โทรศัพท์หรือคอมพิวเตอร์ที่มีอินเทอร์เน็ต ไม่ต้องติดตั้งหรือใช้อุปกรณ์พิเศษ
ฉันชำระเงินอย่างไร? +
ผ่านบัตรด้วย Stripe หรือคริปโต เราไม่เก็บข้อมูลบัตร — Stripe จัดการอย่างปลอดภัย
ฉันขอคืนเงินได้ไหม? +
ใช่ — คืนเงินเต็มจำนวนใน 30 วัน ไม่ต้องอธิบาย
ฉันมีสิทธิ์เข้าถึงนานเท่าไร? +
ตลอดไป เมื่อซื้อแล้วคอร์สเป็นของคุณ กลับมาเรียนได้ตลอด
ฉันจะได้ใบประกาศนียบัตรไหม? +
ได้ เมื่อเรียนจบจะได้รับใบประกาศนียบัตรที่เพิ่มในโปรไฟล์ LinkedIn ได้
ออกแบบสำหรับผู้เรียนใน
เทคโนโลยี
ดีไซน์
การเงิน
การตลาด
สาธารณสุข
การศึกษา
ธุรกิจการบริการ
อุตสาหกรรม
×2
Top up once, pay half
Add $100 → get 200 credits. Every class becomes $2.50 instead of $4.99. Credits never expire.
$100
200 credits
$2.50 / class
Best value
$250
550 credits
$2.27 / class
$500
1200 credits
$2.08 / class
No subscription. Credits apply to any class and never expire.