มีงานของผมเป็นการนำสถิติมาใช้ หา model ของงานที่ไปเก็บข้อมูลมา แล้วหานัยสำคัญทางสถิติของ model โดย Hypothesis test โดยส่วนตัวไม่เคยเรียนสถิติมาก่อนเลย ที่นี่ทำตามคำแนะนำในหนังสือดังนี้ โดยตั้งให้ null hypotesis บอกว่า model นี้ไม่มีจริง และตั้ง alternative hypothesis บอกว่า model นี้มีจริง
และทำ t test โดยหาค่าสัมบูรณ์ของ t critical ในตาราง ที่มีค่าอัลฟ่า ตามที่เราต้องการ และ degree of freedom ที่ขึ้นกับจำนวนข้อมูลที่เก็บมา น้อยกว่าค่าสัมบูรณ์ t ที่เราคำนวณมาได้ ถ้าหาได้แสดงว่า reject null hypothesis และยอมรับ alernative hypothesis ที่นัยสำคัญทางสถิติเท่ากับค่าอัลฟ่า และเรียกว่า p value ตอนแสดงผลของ model สงสัยว่า
1 ค่าอัลฟ่าที่เลือก เป็น p value โดยอัตโนมัติใช่ไหมครับ หรือจะต้องเป็นค่าอัลฟ่าสูงสุดที่สามารถหาได้เพราะถ้ามีนัยสำคัญสูงๆได้ก็ยิ่งดีจึงจะเป็น p value หรือจะต้องทำการแปลงหรือเปรียบเทียบอะไรอีกค่าอัลฟ่าถึงกลายเป็น p value
2 ในหนังสือบอกว่าค่า p value ที่ได้เป็น Type I error คือ ความน่าจะเป็นที่ model มีจริง given ที่จริงไม่มี แต่สำหรับ Type II error คือความน่าจะเป็นที่ model ไม่มีจริง given ที่จริงมี ในหนังสือบอกว่าโดยทั่วไปเป็นไปไม่ได้ที่จะหา เลยหาเฉพาะ Type I เลยงงว่าเป็นไปไม่ได้ที่จะหาค่ายังไง
สงสัยการทำ Hypotesis test ของสถิติ
และทำ t test โดยหาค่าสัมบูรณ์ของ t critical ในตาราง ที่มีค่าอัลฟ่า ตามที่เราต้องการ และ degree of freedom ที่ขึ้นกับจำนวนข้อมูลที่เก็บมา น้อยกว่าค่าสัมบูรณ์ t ที่เราคำนวณมาได้ ถ้าหาได้แสดงว่า reject null hypothesis และยอมรับ alernative hypothesis ที่นัยสำคัญทางสถิติเท่ากับค่าอัลฟ่า และเรียกว่า p value ตอนแสดงผลของ model สงสัยว่า
1 ค่าอัลฟ่าที่เลือก เป็น p value โดยอัตโนมัติใช่ไหมครับ หรือจะต้องเป็นค่าอัลฟ่าสูงสุดที่สามารถหาได้เพราะถ้ามีนัยสำคัญสูงๆได้ก็ยิ่งดีจึงจะเป็น p value หรือจะต้องทำการแปลงหรือเปรียบเทียบอะไรอีกค่าอัลฟ่าถึงกลายเป็น p value
2 ในหนังสือบอกว่าค่า p value ที่ได้เป็น Type I error คือ ความน่าจะเป็นที่ model มีจริง given ที่จริงไม่มี แต่สำหรับ Type II error คือความน่าจะเป็นที่ model ไม่มีจริง given ที่จริงมี ในหนังสือบอกว่าโดยทั่วไปเป็นไปไม่ได้ที่จะหา เลยหาเฉพาะ Type I เลยงงว่าเป็นไปไม่ได้ที่จะหาค่ายังไง