ช่วยด้วยค่ะ !!!!! รบกวนถามเกี่ยวกับสูตรหาค่า Z (สถิติ)

ไม่ค่อยเข้าใจอ่ะค่ะ ว่าตอนคำนวณหาค่า Z เพื่อเปิดตารางหาค่าพื้นที่ใต้ normal curve ยังใช้สูตร Z= X-มิว/ซิกม่า แล้วทำไมพอจะมาทดสอบสมมติฐาน สูตร Z มันกลายเป็น [X (บาร์) - มิว] / [ซิกม่า/รากที่สองของ n] อ่ะคะ ?? สงสัยว่า ทำไมถึงต้องหารรากที่สองของ n เพิ่มขึ้นด้วยคะ มันมีที่มายังไงหรือคะ ???
         ปล. ขอโทษด้วยที่ต้องพิมพ์สูตรอย่างนี้ ไม่รู้จะแทรกสัญลักษณ์พวกนี้จากตรงไหน  T_T

คำตอบที่ได้รับเลือกจากเจ้าของกระทู้
ความคิดเห็นที่ 2
สุตร z =  (x-μ)/σ มันเป็นสูตรที่ใช้หาค่า z ของการแจกแจงแบบปกติ คือ ข้อมูล x ใดๆ มันต้องเป็นการแจกแจงแบบปกติ คุณอยากจะหาความน่าจำเป็นในแบบการแจกแจงปกติของค่า x นั้นๆ คุณก็แทนสูตรลงไปก็จะรู้ค่าความน่าจำเป็นแบบแจกแจงปกติ z แล้วเอาค่าที่ได้ไปเปิดตารางก็จะได้ความน่าจำเป็นสะสมของกราฟระฆังคว่ำ ..เช่น

คุณอยากจะรู้ว่าในช่วงของข้อมูลตั้งแต่ 11 ไปถึง 13.6 มีความน่าจำเป็นแบบปกติ (z) เท่าไหร่ ก็เอาไปแทนสูตรจะได้ค่า z ออกมา 2 ค่าตั้งแต่ช่วง P(0.5 ≤ z ≤ 1.8) = 0.9641 - 0.6915 = 0.2726 ซึ่งค่านี้ก็จะเป็นพื้นที่ใต้กราฟระฆังคว่ำที่เป็นกราฟแจกแจงปกติทั่วไป ...

แต่ทีนี้ ไอ้ความเป็นจริงของข้อมูล เวลาเราเก็บหรือทำการทดลองใดๆ เราจะพยายามให้มันเป็นการแจกแจงแบบปกติให้ได้ (ไม่งั้นมันก็จะเริ่มเป็น Bias) เช่น หลายครั้งที่แบบสำรวจต้องเก็บจำนวน "ตัวอย่าง" หลายร้อยหลายพันตัวอย่าง เพื่อเป็นตัวแทนประชากรทั้งหมด ใครจะบ้าไปไล่ถามข้อมูลน้ำหนักวัยรุ่นไทยในช่วงอายุ 18 ปีมันทั้งประเทศ เก็บเอาแค่เป็นตัวอย่างจนสามารถเรียกได้ว่า มีจำนวนตัวอย่างมากพอและต้อง "สุ่ม" เพื่อให้มันเป็นตัวแทนที่เป็นการแจกแจงปกติ เป็นต้น ...
ทีนี้เนี่ยแหละ ปัญหามันบังเกิด เนื่องด้วยแต่ละตัวอย่างข้อมูลมันเป็นอิสระต่อกัน เพราะงั้น มันก็จะมีความแปรปรวน (σ2) ของใครของมันเหมือนกัน ..แต่พอเราต้องเก็บข้อมูลพวกนี้มาทำค่าเฉลี่ย ไอ้ความแปรปรวนของแต่ละตัวพอ "เอามารวมกัน" มันจะอยู่ในรูปของ nσ2 ...นึกภาพตาม แต่ละตัวอย่างคือ X1, X2, X3,..., Xn เวลาทำค่าเฉลี่ยก็ต้องจับมัดรวมกันหารด้วย n ส่งผลให้ "ค่าเฉลี่ยความแปรปรวน" ก็ต้องรวมกันหาร n ไปด้วยเหมือนกับที่พ่วงมากับข้อมูล X ใดๆ รวมกัน ...

ความแปรปรวนจาก "ผลรวมค่า X" = nσ2 ของ X1 + X2 + X3,..., + Xn
ค่าเฉลี่ยจาก "ผลรวมความแปรปรวนของค่า X"  = nσ2/n ของ (X1 + X2 + X3,..., + Xn)/n
และถ้าอยากหาค่าความแปรปรวนตัวเดียวโดดๆ ของค่า X = (nσ2/n)/n ของ X เฉลี่ย

เพราะงั้น ถ้าจะถามเป็นส่วนเบี่ยงเบนมาตรฐานของค่าเฉลี่ยข้อมูล = σ/(√n) ซึ่งเรียกกันว่า Standard error of mean (mean ที่ว่านี้คือมันพูดถึงค่าเฉลี่ย X)

...จริงๆ มันต้องพิสูจน์ไปถึงการ Unbiased ด้วยนะ ...แต่เอานี่ https://en.wikipedia.org/wiki/Unbiased_estimation_of_standard_deviation ไปแกะต่อเองละกัน ...

สรุปคร่าวๆ แค่ว่า ถ้าคุณจะหาค่า z ที่เกิดจากการสุ่มตัวอย่างประชากร เราจะไม่หยิบแค่ X ซ้กตัว แต่เราจะเอา X ทั้งหมดมาทำเป็นค่าเฉลี่ยของข้อมูลตัวอย่างที่จะเอามาคำนวณ (อย่าลืม ...ทุก X ต้องเป็นอิสระต่อกันและมีการแจกแจงปกติ)  แทนเข้าไปในสูตรเดิม...

X -->  ̅X
σ --> σ/(√n)

เพราะงั้น  z =  (X-μ)/σ -->  z =  ( ̅X-μ)/σ/(√n)

.... คร่อกฟี้

ตรงไหนบกพร่อง ก็รบกวนท่านอื่นๆ แก้ไขเพิ่มเติมให้ด้วยฮะ ... เดี๋ยว จขกท. อาจจะงงที่ข้าเจ้าอธิบายแน่ๆ เลย ... เม่าเศร้า
แสดงความคิดเห็น
โปรดศึกษาและยอมรับนโยบายข้อมูลส่วนบุคคลก่อนเริ่มใช้งาน อ่านเพิ่มเติมได้ที่นี่