
Statistics: Multivariate Data Analysis จาก Fast Forward Statistics 30/4/2561
Cr: Fast Forward Statistics
https://pantip.com/topic/37617102
April 27 at 9:37am ·
ว่าด้วย - การวิเคราะห์ด้วย Multivariate Data Analysis
https://www.facebook.com/FastForwardStat/posts/163220881015590:0
.
เวลาเราพูดกันถึงการวิเคราะห์ด้วยสถิติ Multivariate, Bivariate หรือ Univariate เราทราบความแตกต่างหรือไม่ครับ?
.
พูดแบบเข้าใจง่ายๆ คือว่า Multivariate method เป็นวิธีการวิเคราะห์ความสัมพันธ์ของตัวแปรหลายตัวหรือมีรูปแบบของความสัมพันธ์ที่มากกว่า 1 อัน ในการวิเคราะห์นั้นๆ เช่น การวิเคราะห์ Multiple measurement ที่มีตัวแปรแฝง (Latent Construct) ประกอบขึ้นจากหลายๆ Items หรือ การวิเคราะห์ที่มีตัวแปรในการวิเคราะห์หลายๆ ดัวแปร เป็นต้น ข้อดีของการวิเคราะห์แบบนี้ คือ สามารถวิเคราะห์โจทย์วิจัยที่มีความซับซ้อนได้ ทำให้สามารถวิเคราะห์ข้อมูลของงานวิจัยที่จะมีความลึกซึ้งมากขึ้น
.
ถ้าเป็น Univariate ก็จะเกี่ยวข้องกับตัวแปรเดียว เช่น การวิเคราะห์ค่าเฉลี่ยหรือ Standard Error ของตัวแปรนั้น ถ้าเป็น Bivariate ก็จะเป็นการวิเคราะห์ที่เกี่ยวข้องกับ 2 ตัวแปร เช่นการวิเคราะห์ Correlation เป็นต้น
.
ความสำคัญของที่กล่าวมาอยู่ตรงนี้ คือ นักวิจัยจะต้องรู้ว่าควรจะเลือกใช้วิธีทางสถิติแบบใด เมื่อไหร่ เมื่อจะทำการวิเคราะห์ทางสถิติ ต้องพิจารณาคำถามวิจัยที่ต้องการหาคำตอบ คำถามวิจัยดังกล่าวต้องสอดคล้องกับวิธีการเก็บข้อมูลและลักษณะข้อมูลด้วย ที่เรามักเรียกว่า 'การออกแบบการวิจัย'
.
คำถามที่มักถูกถามเสมอ คือ วิธีการวิเคราะห์ที่จะใช้ควรใช้อันไหน? หรือ วัตถุประสงค์ของวิธีวิเคราะห์แต่ละตัว คืออะไร? ลองมาหาคำตอบกันสำหรับ Multivariate Method
.
1. Principle Component Analysis (PCA): เป็นวิธีการที่ต้องการจัดกลุ่มตัวแปรให้เป็น Component ที่มีเป้าหมายในการอธิบาย Variance ของตัวแปร (Item) ที่ถูกนำมาจัดกลุ่ม PCA เป็น Linear combination ของตัวแปร
.
2. Factor Analysis (FA): ใช้เมื่อต้องการจัดกลุ่มตัวแปร เพื่อให้กลายเป็น Factor โดยมีพื้นฐานมาจากค่า Correlation ของ Item ที่เกี่ยวข้องกัน มักจะใช้เมื่อต้องการสร้าง Multi-item measurement scale
.
(วิธี FA นี้จะคล้ายๆกับ PCA จะแตกต่างกันตรงที่ PCA จะสนใจกับการสร้าง Component ที่อธิบาย Variance ของตัวแปร (Items) แต่ FA เน้นที่การสร้าง Factor ที่มาจาก Measurement model โดยการอธิบาย item's covariance)
.
3. Multiple Regression: ใช้เมื่อนักวิจัยต้องการอธิบาย Variance (พฤติกรรมของตัวแปร) ของตัวแปรที่ถูกอธิบาย (ตัวแปรตาม) ที่ส่งผลมาจากตัวแปรอิสระ (มากกว่า 1 ตัวได้) ที่ใช้นำมาอธิบายตัวแปรตาม
.
4. Analysis of Variance (ANOVA): .ใช้เพื่อเปรียบเทียบค่าเฉลี่ยของกลุ่มของตัวแปรตามที่เป็นแบบ Metric โดยการจัดกลุ่มจะถูกแบ่งโดย Categorical factor ที่เป็นตัวแปรต้น
.
5. Multivariate Analysis of Variance (MANOVA): คล้ายๆ ANOVA มีวัตถุประสงค์เหมือนกัน แต่มีตัวแปรตามที่เป็นแบบ Metric มากกว่า 1 ตัว
.
6. Logistic Regression: เป็นกรณีเฉพาะของ Regression ที่มีวัตถุประสงค์เพื่อแบ่งกลุ่มตัวอย่างที่ต้องการวิเคราะห์ (ก็ คือ Respondents) โดยดูจากค่าของตัวแปรอิสระ มักใช้กับในกรณีที่เกี่ยวข้องกับความน่าจะเป็น เพราะว่าเป็นการพยากรณ์ค่าของช่วงตั้งแต่ 0 ถึง 1
.
7. Discriminant Analysis: วัตถุประสงค์เพื่อแยกกลุ่มตัวอย่างออกเป็นกลุ่ม (ที่สามารถมากกว่า 2 กลุ่ม) โดยจะมีการหาตัวแปรที่สามารถนำมาแบ่งกลุ่มได้ดีที่สุด อีกนัยหนึ่ง ต้องการดูว่าตัวแปรใดที่มีค่าความแตกต่างของค่าเฉลี่ยที่มากที่สุดระหว่างกลุ่ม
.
8. Cluster Analysis: ใช้เมื่อต้องการจัดกลุ่มของตัวอย่างที่มีความคล้ายกัน เช่น การจัดกลุ่มของบุคคลที่มีความคล้ายคลึงกัน โดยพิจารณาจากตัวแปรที่นำมาวิเคราะห์
.
9. Conjoint Analysis: ใช้เพื่อดู Relative Importance ของคุณลักษณะ (Attributes) ที่แตกต่างกันในแต่ละระดับ เช่น การศึกษาความแตกต่างกันของลักษณะสินค้า เป้นต้น ความแตกต่างที่สำคัญของวิธีนี้เมื่อเทียบกับ MANOVA คือ Conjoint analysis จะสามารถทำในระดับ Individual-level coefficient มากกว่าแค่เพียงในระดับ Group-level เพียงเท่านั้น
.
10. Structural Equation Modeling (SEM): ใช้เมื่อต้องการศึกษาว่า Constructs มีความสัมพันธ์ (ส่งผล) ต่อกันหรือไม่ โดยสามารถวิเคราะ์ Multi-item measurement scale ของ Construct ที่เป็นโมเดลการวัดของตัวแปรในเวลาเดียวกันได้ หมายถึงว่า เป็นการรวมกันของทั้ง Factor Analysis และ Regression analysis เข้าด้วยกันในการวิเคราะห์
..
โดยสรุป เราในฐานะนักวิจัยจะต้องเข้าใจประเภทของ Multivariate Analysis Method และรู้ว่าวัตถุประสงค์ของการใช้วิธีแต่ละแบบนั้น คือ อะไร สามารถตอบคำถามวิจัยที่ต้องการได้หรือไม่ ถ้าเลือกใช้วิธีผิด ยังไงก็ไม่สามารถตอบคำถามวิจัยนั้นได้แน่ๆ ในแต่ละวิธีก็จะมีรายละเอียดปลีกย่อย ข้อกำหนดลงไปอีก ค่อยๆ ศึกษากันไปทีละนิดครับ
..
แล้วพบกันอาทิตย์หน้าครับ
..
..
Reference:
McQuitty, S. (2018). The Purposes of Multivariate Data Analysis Methods: an Applied Commentary. Journal of African Business, 19(1), 124-142.
รูปจาก:
https://arstechnica.com
Statistics: Multivariate Data Analysis จาก Fast Forward Statistics 30/4/2561 สรายุทธ กันหลง
Statistics: Multivariate Data Analysis จาก Fast Forward Statistics 30/4/2561
Cr: Fast Forward Statistics
https://pantip.com/topic/37617102
April 27 at 9:37am ·
ว่าด้วย - การวิเคราะห์ด้วย Multivariate Data Analysis https://www.facebook.com/FastForwardStat/posts/163220881015590:0
.
เวลาเราพูดกันถึงการวิเคราะห์ด้วยสถิติ Multivariate, Bivariate หรือ Univariate เราทราบความแตกต่างหรือไม่ครับ?
.
พูดแบบเข้าใจง่ายๆ คือว่า Multivariate method เป็นวิธีการวิเคราะห์ความสัมพันธ์ของตัวแปรหลายตัวหรือมีรูปแบบของความสัมพันธ์ที่มากกว่า 1 อัน ในการวิเคราะห์นั้นๆ เช่น การวิเคราะห์ Multiple measurement ที่มีตัวแปรแฝง (Latent Construct) ประกอบขึ้นจากหลายๆ Items หรือ การวิเคราะห์ที่มีตัวแปรในการวิเคราะห์หลายๆ ดัวแปร เป็นต้น ข้อดีของการวิเคราะห์แบบนี้ คือ สามารถวิเคราะห์โจทย์วิจัยที่มีความซับซ้อนได้ ทำให้สามารถวิเคราะห์ข้อมูลของงานวิจัยที่จะมีความลึกซึ้งมากขึ้น
.
ถ้าเป็น Univariate ก็จะเกี่ยวข้องกับตัวแปรเดียว เช่น การวิเคราะห์ค่าเฉลี่ยหรือ Standard Error ของตัวแปรนั้น ถ้าเป็น Bivariate ก็จะเป็นการวิเคราะห์ที่เกี่ยวข้องกับ 2 ตัวแปร เช่นการวิเคราะห์ Correlation เป็นต้น
.
ความสำคัญของที่กล่าวมาอยู่ตรงนี้ คือ นักวิจัยจะต้องรู้ว่าควรจะเลือกใช้วิธีทางสถิติแบบใด เมื่อไหร่ เมื่อจะทำการวิเคราะห์ทางสถิติ ต้องพิจารณาคำถามวิจัยที่ต้องการหาคำตอบ คำถามวิจัยดังกล่าวต้องสอดคล้องกับวิธีการเก็บข้อมูลและลักษณะข้อมูลด้วย ที่เรามักเรียกว่า 'การออกแบบการวิจัย'
.
คำถามที่มักถูกถามเสมอ คือ วิธีการวิเคราะห์ที่จะใช้ควรใช้อันไหน? หรือ วัตถุประสงค์ของวิธีวิเคราะห์แต่ละตัว คืออะไร? ลองมาหาคำตอบกันสำหรับ Multivariate Method
.
1. Principle Component Analysis (PCA): เป็นวิธีการที่ต้องการจัดกลุ่มตัวแปรให้เป็น Component ที่มีเป้าหมายในการอธิบาย Variance ของตัวแปร (Item) ที่ถูกนำมาจัดกลุ่ม PCA เป็น Linear combination ของตัวแปร
.
2. Factor Analysis (FA): ใช้เมื่อต้องการจัดกลุ่มตัวแปร เพื่อให้กลายเป็น Factor โดยมีพื้นฐานมาจากค่า Correlation ของ Item ที่เกี่ยวข้องกัน มักจะใช้เมื่อต้องการสร้าง Multi-item measurement scale
.
(วิธี FA นี้จะคล้ายๆกับ PCA จะแตกต่างกันตรงที่ PCA จะสนใจกับการสร้าง Component ที่อธิบาย Variance ของตัวแปร (Items) แต่ FA เน้นที่การสร้าง Factor ที่มาจาก Measurement model โดยการอธิบาย item's covariance)
.
3. Multiple Regression: ใช้เมื่อนักวิจัยต้องการอธิบาย Variance (พฤติกรรมของตัวแปร) ของตัวแปรที่ถูกอธิบาย (ตัวแปรตาม) ที่ส่งผลมาจากตัวแปรอิสระ (มากกว่า 1 ตัวได้) ที่ใช้นำมาอธิบายตัวแปรตาม
.
4. Analysis of Variance (ANOVA): .ใช้เพื่อเปรียบเทียบค่าเฉลี่ยของกลุ่มของตัวแปรตามที่เป็นแบบ Metric โดยการจัดกลุ่มจะถูกแบ่งโดย Categorical factor ที่เป็นตัวแปรต้น
.
5. Multivariate Analysis of Variance (MANOVA): คล้ายๆ ANOVA มีวัตถุประสงค์เหมือนกัน แต่มีตัวแปรตามที่เป็นแบบ Metric มากกว่า 1 ตัว
.
6. Logistic Regression: เป็นกรณีเฉพาะของ Regression ที่มีวัตถุประสงค์เพื่อแบ่งกลุ่มตัวอย่างที่ต้องการวิเคราะห์ (ก็ คือ Respondents) โดยดูจากค่าของตัวแปรอิสระ มักใช้กับในกรณีที่เกี่ยวข้องกับความน่าจะเป็น เพราะว่าเป็นการพยากรณ์ค่าของช่วงตั้งแต่ 0 ถึง 1
.
7. Discriminant Analysis: วัตถุประสงค์เพื่อแยกกลุ่มตัวอย่างออกเป็นกลุ่ม (ที่สามารถมากกว่า 2 กลุ่ม) โดยจะมีการหาตัวแปรที่สามารถนำมาแบ่งกลุ่มได้ดีที่สุด อีกนัยหนึ่ง ต้องการดูว่าตัวแปรใดที่มีค่าความแตกต่างของค่าเฉลี่ยที่มากที่สุดระหว่างกลุ่ม
.
8. Cluster Analysis: ใช้เมื่อต้องการจัดกลุ่มของตัวอย่างที่มีความคล้ายกัน เช่น การจัดกลุ่มของบุคคลที่มีความคล้ายคลึงกัน โดยพิจารณาจากตัวแปรที่นำมาวิเคราะห์
.
9. Conjoint Analysis: ใช้เพื่อดู Relative Importance ของคุณลักษณะ (Attributes) ที่แตกต่างกันในแต่ละระดับ เช่น การศึกษาความแตกต่างกันของลักษณะสินค้า เป้นต้น ความแตกต่างที่สำคัญของวิธีนี้เมื่อเทียบกับ MANOVA คือ Conjoint analysis จะสามารถทำในระดับ Individual-level coefficient มากกว่าแค่เพียงในระดับ Group-level เพียงเท่านั้น
.
10. Structural Equation Modeling (SEM): ใช้เมื่อต้องการศึกษาว่า Constructs มีความสัมพันธ์ (ส่งผล) ต่อกันหรือไม่ โดยสามารถวิเคราะ์ Multi-item measurement scale ของ Construct ที่เป็นโมเดลการวัดของตัวแปรในเวลาเดียวกันได้ หมายถึงว่า เป็นการรวมกันของทั้ง Factor Analysis และ Regression analysis เข้าด้วยกันในการวิเคราะห์
..
โดยสรุป เราในฐานะนักวิจัยจะต้องเข้าใจประเภทของ Multivariate Analysis Method และรู้ว่าวัตถุประสงค์ของการใช้วิธีแต่ละแบบนั้น คือ อะไร สามารถตอบคำถามวิจัยที่ต้องการได้หรือไม่ ถ้าเลือกใช้วิธีผิด ยังไงก็ไม่สามารถตอบคำถามวิจัยนั้นได้แน่ๆ ในแต่ละวิธีก็จะมีรายละเอียดปลีกย่อย ข้อกำหนดลงไปอีก ค่อยๆ ศึกษากันไปทีละนิดครับ
..
แล้วพบกันอาทิตย์หน้าครับ
..
..
Reference:
McQuitty, S. (2018). The Purposes of Multivariate Data Analysis Methods: an Applied Commentary. Journal of African Business, 19(1), 124-142.
รูปจาก: https://arstechnica.com