top of page
ค้นหา
รูปภาพนักเขียนData Investigator Team

การวิเคราะห์ข้อมูลถดถอยเชิงเส้น (Linear Regression) คืออะไร

อัปเดตเมื่อ 13 มิ.ย.


What is Linear Regression Analysis?
What is Linear Regression Analysis?

การวิเคราะห์ข้อมูลถดถอยเชิงเส้น (Linear Regression) คืออะไร


การวิเคราะห์ข้อมูลถดถอยเชิงเส้นหรือ Linear Regression คือวิธีการวิเคราะห์ข้อมูลเพื่อหา ความสัมพันธ์ระหว่างตัวแปรต้น (หนึ่งตัวแปรหรือมากกว่า) และตัวแปรตาม โดย Simple Linear Regression หรือการวิเคราะห์ข้อมูลถดถอยเชิงเส้นอย่างง่ายเป็นการวิเคราะห์ข้อมูลเมื่อมีตัวแปรต้นเพียง 1 ตัวแปร และ Multiple Linear Regression หรือการวิเคราะห์ข้อมูลถดถอยเชิงเส้นพหุคูณเป็นการวิเคราะห์ข้อมูลเมื่อมีตัวแปรต้นหลายตัว ในบทความนี้เราจะมาดูกันว่าการวิเคราะห์ข้อมูลถดถอยเชิงเส้นแบบง่าย และการวิเคราะห์ข้อมูลถดถอยพหุคูณเชิงเส้น คืออะไร สามารถนำไปใช้ในกรณีใดได้บ้าง และมีข้อจำกัดอย่างไร


1. การวิเคราะห์ข้อมูลถดถอยเชิงเส้นแบบง่าย (Simple Linear Regression)


1.1 การวิเคราะห์ข้อมูลถดถอยเชิงเส้นแบบง่ายคืออะไร


การวิเคราะห์ข้อมูลถดกอยเชิงเส้นแบบง่ายคือ การวิเคราะห์ความสัมพันธ์เชิงเส้นระหว่างตัวแปรต้น (แทนด้วย x) และตัวแปรตาม (แทนด้วย y) โดยมีตัวแปรต้นเพียง 1 ตัว ซึ่งมีความสัมพันธ์เชิงเส้นต่อกัน โดยจุดมุ่งหมายของการวิเคราะห์ข้อมูลคือการสร้างสมการเส้นตรงแบบถดถอยเชิงเส้นที่ สามารถอธิบายความสัมพันธ์ของทั้งสองตัวแปรได้ดีที่สุด


1.2 เมื่อใดที่ควรใช้การวิเคราะห์ข้อมูลถดถอยเชิงเส้นแบบง่าย (Simple Linear Regression)


การวิเคราะห์ข้อมูลถดถอยเชิงเส้นแบบง่ายมักจะใช้กันเมื่อผู้วิจัยต้องการศึกษาผลกระทบของ ตัวแปรต้นที่มีต่อตัวแปรตาม โดยมากแล้วจะใช้ในการวิจัยที่เกี่ยวข้องกับธุรกิจหรือเศรษฐศาสตร์ ยกตัวอย่างเช่นผลกระทบของงบโฆษณาที่มีต่อยอดขาย นอกจากนี้ยังใช้โดยมากในงานวิจัยทาง วิทยาศาสตร์หรือการแพทย์ เพื่อหาว่าปัจจัยใดมีผลกระทบต่อปัจจัยใดและผลกระทบนั้นมีนัยสำคัญทางเศรษฐกิจหรือไม่


1.3 ตัวอย่างสมมติฐานการวิจัยที่ใช้การวิเคราะห์ข้อมูลถดถอยเชิงเส้นแบบง่าย (Simple Linear Regression)


การวิเคราะฆ์ข้อมูลถดถอยเชิงเส้นแบบง่ายสามารถใช้เพื่อทดสอบสมมติฐานได้หลากหลาย อาทิ ในมุมธุรกิจ สมมติฐานอาจจะเป็นการเพิ่มขึ้นของงบโฆษณามีผลทำให้เกิดการเพิ่มขึ้นของการรับรู้แบรนด์หริือ การเพิ่มขึ้นของจำนวนปีในการทำงานส่งผลให้เกิดการเปลี่ยนแปลงในระดับเงินเดือน หรือการนำไปใช้ในการวิจัยเพื่อวิทยาศาสตร์หรือการแพทย์ อย่างการเพิ่มขึ้นของ BMI หรือ Body Mass Index ส่งผลให้เกิดความเปลี่ยนแปลงในระดับความดันโลหิตในทางบวกอย่างมีนัยสำคัญ ทางสถิติ


1.4 ข้อจำกัดของการนำการวิเคราะห์ข้อมูลถดถอยเชิงเส้นแบบง่ายไปใช้


การวิเคราะห์ข้อมูลถดถอยเชิงเส้นแบบง่ายมีข้อจำกัดของการนำไปใช้ที่ผู้วิจัยควรทราบซึ่งจะส่งผล ต่อการนำผลการวิเคราะห์ข้อมูลไปใช้ได้เช่นกัน โดยข้อจำกัดแรกคือการมีข้อกำหนดในเบื้องต้นว่าตัวแปรต้นและตัวแปรตามจะต้องมีความสัมพันธ์เชิงเส้นต่อกัน ถ้าหากว่าสองปัจจัยไม่มีความสัมพันธ์แบบเส้นตรงจะไม่เหมาะกับการวิเคราะห์ข้อมูลด้วยวิธีนี้ อีกข้อจำกัดหนึ่งของการวิเคราะห์ข้อมูลการถดถอยเชิงเส้นแบบง่ายคือข้อมูลควรจะมีการกระจายตัวแบบปกติ อย่างไรก็ตามถ้าหากมีการเก็บข้อมูลที่มากพอก็จะมีส่วนช่วยให้ข้อมูลกระจายตัวอย่างเป็นปกติมากขึ้นได้


2. การวิเคราะห์ข้อมูลถดถอยพหุคูณเชิงเส้น (Multiple Linear Regression)


2.1 การวิเคราะห์ข้อมูลถดถอยพหุคูณเชิงเส้น (Multiple Linear Regression) คืออะไร


การวิเคราะห์ข้อมูลถดถอยพหุคูณเชิงเส้น คือการวิเคราะห์ข้อมูลเพื่อหาความสัมพันธ์ระหว่าง ตัวแปรต้นที่มีมากกว่า 1 ตัวแปร (แทนด้วย X1, X2, X3,…Xn) ที่มีต่อตัวแปรตาม (แทนด้วย y) ซึ่งมีการหาความสัมพันธ์เชิงเส้นระหว่างตัวแปรต้นและตัวแปรตาม การวิเคราะห์ถดถอยพหุคูณมีจุดประสงค์เพื่อต้องการทราบสมการถดถอยพหุคูณที่จะนำไปพัฒนาหรือตอบโจทย์ของการวิจัย


2.2 เมื่อใดที่ควรใช้การวิเคราะห์ข้อมูลถดถอยพหุคูณเชิงเส้น (Multiple Linear Regression)


การวิเคราะห์ข้อมูลถดถอยพหุคูณจะใช้เมื่อผู้วิจัยมีความสงสัยหรือมีโจทย์ว่า ตัวแปรต้นที่มีมากกว่า 1 ตัวมีผลกระทบหรืออิทธิพลต่อตัวแปรตาม โดยมากแล้วใช้กันอย่างแพร่หลายในการวิจัยเพื่อธุรกิจ หรือเศรษฐศาสตร์เพื่อหาผลกระทบหรือ อิทธิพลของตัวแปรต้นที่มีต่อตัวแปรตาม นอกจากนี้ยังมีการใช้เพื่องานวิจัยเชิงวิทยาศาสตร์และการแพทย์อีกด้วย


2.3 ตัวอย่างสมมติฐานการวิจัยที่ใช้การวิเคราะห์ข้อมูลถดถอยพหุคูณเชิงเส้น (Multiple Linear Regression)


การวิเคราะห์ข้อมูลถดถอยพหุคูณสามารถใช้เพื่อทดสอบสมมติฐานการวิจัยได้หลากหลายรูปแบบ ยกตัวอย่างเช่น การเพิ่มขึ้นของงบประมาณการโฆษณาและการลดลงของราคามีอิทธิพลต่อการเพิ่มขึ้นของยอดขายอย่างมีนัยสำคัญทางสถิติหรือการเพิ่มขึ้นของงบการโฆษณา การเพิ่มขึ้นของจำนวนผู้เข้าชมเว็บไซต์และการมีส่วนร่วมในช่องทางโซเชียลมีเดีย มีอิทธิพลต่อการเพิ่มขึ้นของยอดขายอย่างมีนัสำคัญทางสถิติเป็นต้น


2.4 ข้อจำกัดของการนำ การวิเคราะห์ข้อมูลถดถอยพหุคูณเชิงเส้น (Multiple Linear Regression) ไปใช้

ข้อจำกัดของการนำการวิเคราะห์ข้อมูลถดถอยพหุคูณเชิงเส้นไปใช้ จะมีความคล้ายกันกับข้อจำกัดของการวิเคราะห์ข้อมูลถดถอยเชิงเส้นแบบง่าย คือ การมีข้อกำหนดเรื่องความสัมพันธ์เชิงเส้นต่อ กันระหว่างตัวแปรต้นและตัวแปรตาม และการมีการกระจายของข้อมูลแบบปกติ นอกจากนี้ การวิเคราะห์ข้อมูลถดถอยพหุคูณเชิงเส้นยังมีอีกข้อจำกัดหนึ่งคือ Multicollinearity หรือ ภาวะร่วมเส้นตรงหลายตัวแปร หรือการที่ตัวแปรต้นมีความสัมพันธ์กันเองในระดับมากแต่ไม่สมบูรณ์ซึ่ง อาจส่งผลต่อการนำผลการวิเคราะห์ข้อมูลไปใช้


สอบถามข้อมูลเพิ่มเติมกรุณาติดต่อ:

  • ไลน์: @datainvestigatorth

  • โทร: 063-969-7944

  • อีเมล์: info@datainvestigatorth.com








โพสต์ล่าสุด

ดูทั้งหมด

Comments


bottom of page