การวิเคราะห์ข้อมูลถดถอยเชิงเส้น (Linear Regression) คืออะไร
การวิเคราะห์ข้อมูลถดถอยเชิงเส้นหรือ Linear Regression คือวิธีการวิเคราะห์ข้อมูลเพื่อหา ความสัมพันธ์ระหว่างตัวแปรต้น (หนึ่งตัวแปรหรือมากกว่า) และตัวแปรตาม โดย Simple Linear Regression หรือการวิเคราะห์ข้อมูลถดถอยเชิงเส้นอย่างง่ายเป็นการวิเคราะห์ข้อมูลเมื่อมีตัวแปรต้นเพียง 1 ตัวแปร และ Multiple Linear Regression หรือการวิเคราะห์ข้อมูลถดถอยเชิงเส้นพหุคูณเป็นการวิเคราะห์ข้อมูลเมื่อมีตัวแปรต้นหลายตัว ในบทความนี้เราจะมาดูกันว่าการวิเคราะห์ข้อมูลถดถอยเชิงเส้นแบบง่าย และการวิเคราะห์ข้อมูลถดถอยพหุคูณเชิงเส้น คืออะไร สามารถนำไปใช้ในกรณีใดได้บ้าง และมีข้อจำกัดอย่างไร
1. การวิเคราะห์ข้อมูลถดถอยเชิงเส้นแบบง่าย (Simple Linear Regression)
1.1 การวิเคราะห์ข้อมูลถดถอยเชิงเส้นแบบง่ายคืออะไร
การวิเคราะห์ข้อมูลถดกอยเชิงเส้นแบบง่ายคือ การวิเคราะห์ความสัมพันธ์เชิงเส้นระหว่างตัวแปรต้น (แทนด้วย x) และตัวแปรตาม (แทนด้วย y) โดยมีตัวแปรต้นเพียง 1 ตัว ซึ่งมีความสัมพันธ์เชิงเส้นต่อกัน โดยจุดมุ่งหมายของการวิเคราะห์ข้อมูลคือการสร้างสมการเส้นตรงแบบถดถอยเชิงเส้นที่ สามารถอธิบายความสัมพันธ์ของทั้งสองตัวแปรได้ดีที่สุด
1.2 เมื่อใดที่ควรใช้การวิเคราะห์ข้อมูลถดถอยเชิงเส้นแบบง่าย (Simple Linear Regression)
การวิเคราะห์ข้อมูลถดถอยเชิงเส้นแบบง่ายมักจะใช้กันเมื่อผู้วิจัยต้องการศึกษาผลกระทบของ ตัวแปรต้นที่มีต่อตัวแปรตาม โดยมากแล้วจะใช้ในการวิจัยที่เกี่ยวข้องกับธุรกิจหรือเศรษฐศาสตร์ ยกตัวอย่างเช่นผลกระทบของงบโฆษณาที่มีต่อยอดขาย นอกจากนี้ยังใช้โดยมากในงานวิจัยทาง วิทยาศาสตร์หรือการแพทย์ เพื่อหาว่าปัจจัยใดมีผลกระทบต่อปัจจัยใดและผลกระทบนั้นมีนัยสำคัญทางเศรษฐกิจหรือไม่
1.3 ตัวอย่างสมมติฐานการวิจัยที่ใช้การวิเคราะห์ข้อมูลถดถอยเชิงเส้นแบบง่าย (Simple Linear Regression)
การวิเคราะฆ์ข้อมูลถดถอยเชิงเส้นแบบง่ายสามารถใช้เพื่อทดสอบสมมติฐานได้หลากหลาย อาทิ ในมุมธุรกิจ สมมติฐานอาจจะเป็นการเพิ่มขึ้นของงบโฆษณามีผลทำให้เกิดการเพิ่มขึ้นของการรับรู้แบรนด์หริือ การเพิ่มขึ้นของจำนวนปีในการทำงานส่งผลให้เกิดการเปลี่ยนแปลงในระดับเงินเดือน หรือการนำไปใช้ในการวิจัยเพื่อวิทยาศาสตร์หรือการแพทย์ อย่างการเพิ่มขึ้นของ BMI หรือ Body Mass Index ส่งผลให้เกิดความเปลี่ยนแปลงในระดับความดันโลหิตในทางบวกอย่างมีนัยสำคัญ ทางสถิติ
1.4 ข้อจำกัดของการนำการวิเคราะห์ข้อมูลถดถอยเชิงเส้นแบบง่ายไปใช้
การวิเคราะห์ข้อมูลถดถอยเชิงเส้นแบบง่ายมีข้อจำกัดของการนำไปใช้ที่ผู้วิจัยควรทราบซึ่งจะส่งผล ต่อการนำผลการวิเคราะห์ข้อมูลไปใช้ได้เช่นกัน โดยข้อจำกัดแรกคือการมีข้อกำหนดในเบื้องต้นว่าตัวแปรต้นและตัวแปรตามจะต้องมีความสัมพันธ์เชิงเส้นต่อกัน ถ้าหากว่าสองปัจจัยไม่มีความสัมพันธ์แบบเส้นตรงจะไม่เหมาะกับการวิเคราะห์ข้อมูลด้วยวิธีนี้ อีกข้อจำกัดหนึ่งของการวิเคราะห์ข้อมูลการถดถอยเชิงเส้นแบบง่ายคือข้อมูลควรจะมีการกระจายตัวแบบปกติ อย่างไรก็ตามถ้าหากมีการเก็บข้อมูลที่มากพอก็จะมีส่วนช่วยให้ข้อมูลกระจายตัวอย่างเป็นปกติมากขึ้นได้
2. การวิเคราะห์ข้อมูลถดถอยพหุคูณเชิงเส้น (Multiple Linear Regression)
2.1 การวิเคราะห์ข้อมูลถดถอยพหุคูณเชิงเส้น (Multiple Linear Regression) คืออะไร
การวิเคราะห์ข้อมูลถดถอยพหุคูณเชิงเส้น คือการวิเคราะห์ข้อมูลเพื่อหาความสัมพันธ์ระหว่าง ตัวแปรต้นที่มีมากกว่า 1 ตัวแปร (แทนด้วย X1, X2, X3,…Xn) ที่มีต่อตัวแปรตาม (แทนด้วย y) ซึ่งมีการหาความสัมพันธ์เชิงเส้นระหว่างตัวแปรต้นและตัวแปรตาม การวิเคราะห์ถดถอยพหุคูณมีจุดประสงค์เพื่อต้องการทราบสมการถดถอยพหุคูณที่จะนำไปพัฒนาหรือตอบโจทย์ของการวิจัย
2.2 เมื่อใดที่ควรใช้การวิเคราะห์ข้อมูลถดถอยพหุคูณเชิงเส้น (Multiple Linear Regression)
การวิเคราะห์ข้อมูลถดถอยพหุคูณจะใช้เมื่อผู้วิจัยมีความสงสัยหรือมีโจทย์ว่า ตัวแปรต้นที่มีมากกว่า 1 ตัวมีผลกระทบหรืออิทธิพลต่อตัวแปรตาม โดยมากแล้วใช้กันอย่างแพร่หลายในการวิจัยเพื่อธุรกิจ หรือเศรษฐศาสตร์เพื่อหาผลกระทบหรือ อิทธิพลของตัวแปรต้นที่มีต่อตัวแปรตาม นอกจากนี้ยังมีการใช้เพื่องานวิจัยเชิงวิทยาศาสตร์และการแพทย์อีกด้วย
2.3 ตัวอย่างสมมติฐานการวิจัยที่ใช้การวิเคราะห์ข้อมูลถดถอยพหุคูณเชิงเส้น (Multiple Linear Regression)
การวิเคราะห์ข้อมูลถดถอยพหุคูณสามารถใช้เพื่อทดสอบสมมติฐานการวิจัยได้หลากหลายรูปแบบ ยกตัวอย่างเช่น การเพิ่มขึ้นของงบประมาณการโฆษณาและการลดลงของราคามีอิทธิพลต่อการเพิ่มขึ้นของยอดขายอย่างมีนัยสำคัญทางสถิติหรือการเพิ่มขึ้นของงบการโฆษณา การเพิ่มขึ้นของจำนวนผู้เข้าชมเว็บไซต์และการมีส่วนร่วมในช่องทางโซเชียลมีเดีย มีอิทธิพลต่อการเพิ่มขึ้นของยอดขายอย่างมีนัสำคัญทางสถิติเป็นต้น
2.4 ข้อจำกัดของการนำ การวิเคราะห์ข้อมูลถดถอยพหุคูณเชิงเส้น (Multiple Linear Regression) ไปใช้
ข้อจำกัดของการนำการวิเคราะห์ข้อมูลถดถอยพหุคูณเชิงเส้นไปใช้ จะมีความคล้ายกันกับข้อจำกัดของการวิเคราะห์ข้อมูลถดถอยเชิงเส้นแบบง่าย คือ การมีข้อกำหนดเรื่องความสัมพันธ์เชิงเส้นต่อ กันระหว่างตัวแปรต้นและตัวแปรตาม และการมีการกระจายของข้อมูลแบบปกติ นอกจากนี้ การวิเคราะห์ข้อมูลถดถอยพหุคูณเชิงเส้นยังมีอีกข้อจำกัดหนึ่งคือ Multicollinearity หรือ ภาวะร่วมเส้นตรงหลายตัวแปร หรือการที่ตัวแปรต้นมีความสัมพันธ์กันเองในระดับมากแต่ไม่สมบูรณ์ซึ่ง อาจส่งผลต่อการนำผลการวิเคราะห์ข้อมูลไปใช้
สอบถามข้อมูลเพิ่มเติมกรุณาติดต่อ:
ไลน์: @datainvestigatorth
โทร: 063-969-7944
อีเมล์: info@datainvestigatorth.com
Comments