ตัวอย่างการคำนวณค่าเบี่ยงเบนมาตรฐาน ค่าเบี่ยงเบนมาตรฐานของสูตรใน Excel ข้อผิดพลาดในการสุ่มตัวอย่างจากการสังเกตสูงสุด ข้อผิดพลาดในการสุ่มตัวอย่างโดยเฉลี่ย ขั้นตอนการคำนวณ

บ้านส่วนเบี่ยงเบนมาตรฐาน (คำพ้องความหมาย:, ส่วนเบี่ยงเบนมาตรฐาน, ส่วนเบี่ยงเบนมาตรฐานส่วนเบี่ยงเบนกำลังสอง - คำที่เกี่ยวข้อง:, ส่วนเบี่ยงเบนมาตรฐานสเปรดมาตรฐาน

) - ในทฤษฎีความน่าจะเป็นและสถิติซึ่งเป็นตัวบ่งชี้ที่พบบ่อยที่สุดของการกระจายตัวของค่าของตัวแปรสุ่มที่สัมพันธ์กับความคาดหวังทางคณิตศาสตร์ ด้วยอาร์เรย์ที่จำกัดของตัวอย่างค่า แทนที่จะใช้ความคาดหวังทางคณิตศาสตร์ จะใช้ค่าเฉลี่ยเลขคณิตของชุดตัวอย่าง

  • 1 / 5

    YouTube สารานุกรม

    ค่าเบี่ยงเบนมาตรฐานวัดเป็นหน่วยการวัดของตัวแปรสุ่ม และใช้ในการคำนวณค่าคลาดเคลื่อนมาตรฐานของค่าเฉลี่ยเลขคณิต เมื่อสร้างช่วงความเชื่อมั่น เมื่อทดสอบสมมติฐานทางสถิติ เมื่อวัดความสัมพันธ์เชิงเส้นระหว่างตัวแปรสุ่ม กำหนดให้เป็นรากที่สองของความแปรปรวนของตัวแปรสุ่ม

    ส่วนเบี่ยงเบนมาตรฐาน:
    • s = n n − 1 σ 2 = 1 n − 1 ∑ i = 1 n (x i − x mac) 2 ;

    (\displaystyle s=(\sqrt ((\frac (n)(n-1))\sigma ^(2)))=(\sqrt ((\frac (1)(n-1))\sum _( i=1)^(n)\left(x_(i)-(\bar (x))\right)^(2)));)หมายเหตุ: บ่อยครั้งมากที่มีความคลาดเคลื่อนในชื่อของ MSD (Root Mean Square Deviation) และ STD (Standard Deviation) ด้วยสูตรของพวกเขา ตัวอย่างเช่น ในโมดูล numPy ของภาษาการเขียนโปรแกรม Python ฟังก์ชัน std() จะถูกอธิบายว่าเป็น “ค่าเบี่ยงเบนมาตรฐาน” ในขณะที่สูตรสะท้อนถึงค่าเบี่ยงเบนมาตรฐาน (หารด้วยรากของตัวอย่าง) ใน Excel ฟังก์ชัน STANDARDDEVAL() จะแตกต่างกัน (หารด้วยรากของ n-1) ส่วนเบี่ยงเบนมาตรฐาน(การประมาณค่าเบี่ยงเบนมาตรฐานของตัวแปรสุ่ม x:

    สัมพันธ์กับความคาดหวังทางคณิตศาสตร์โดยอิงจากการประมาณค่าความแปรปรวนที่เป็นกลาง)

    s (\displaystyle s) σ = 1 n ∑ i = 1 n (x i − x Â) 2(\displaystyle \sigma =(\sqrt ((\frac (1)(n))\sum _(i=1)^(n)\left(x_(i)-(\bar (x))\right) ^(2))).) ที่ไหน - σ 2 (\displaystyle \sigma ^(2))- การกระจายตัว; x ฉัน (\displaystyle x_(i))ฉัน

    x mac = 1 n ∑ i = 1 n x i = 1 n (x 1 + … + x n)

    (\displaystyle (\bar (x))=(\frac (1)(n))\sum _(i=1)^(n)x_(i)=(\frac (1)(n))(x_ (1)+\ldots +x_(n)).)

    ควรสังเกตว่าการประมาณการทั้งสองมีความลำเอียง ในกรณีทั่วไป ไม่สามารถสร้างการประมาณการที่เป็นกลางได้ อย่างไรก็ตาม การประมาณการตามการประมาณค่าความแปรปรวนที่เป็นกลางมีความสอดคล้องกัน

    ตาม GOST R 8.736-2011 ค่าเบี่ยงเบนมาตรฐานคำนวณโดยใช้สูตรที่สองของส่วนนี้ กรุณาตรวจสอบผลลัพธ์

    ตาม GOST R 8.736-2011 ค่าเบี่ยงเบนมาตรฐานคำนวณโดยใช้สูตรที่สองของส่วนนี้ กรุณาตรวจสอบผลลัพธ์ (กฎสามซิกมา 3 σ (\displaystyle 3\sigma ) ) - ค่าเกือบทั้งหมดของตัวแปรสุ่มแบบกระจายปกติจะอยู่ในช่วงเวลา(x − 3 σ ; x เลเยอร์ + 3 σ) (\displaystyle \left((\bar (x))-3\sigma ;(\bar (x))+3\sigma \right)) - เข้มงวดมากขึ้น - ด้วยความน่าจะเป็นประมาณ 0.9973 ค่าของตัวแปรสุ่มแบบกระจายปกติจะอยู่ในช่วงเวลาที่ระบุ (โดยมีเงื่อนไขว่าค่า x  (\displaystyle (\bar (x)))

    จริง และไม่ได้รับจากการประมวลผลตัวอย่าง) - เข้มงวดมากขึ้น - ด้วยความน่าจะเป็นประมาณ 0.9973 ค่าของตัวแปรสุ่มแบบกระจายปกติจะอยู่ในช่วงเวลาที่ระบุ (โดยมีเงื่อนไขว่าค่าถ้าเห็นคุณค่าที่แท้จริง ไม่เป็นที่รู้จักแล้วคุณไม่ควรใช้σ (\displaystyle \sigma ) , ก, ก .

    - ดังนั้นกฎสามซิกมาจึงเปลี่ยนเป็นกฎสามซิกมา

    การตีความค่าส่วนเบี่ยงเบนมาตรฐาน

    ค่าเบี่ยงเบนมาตรฐานที่มากขึ้นจะแสดงค่าสเปรดที่มากขึ้นในชุดที่นำเสนอพร้อมกับค่าเฉลี่ยของชุด ค่าที่น้อยกว่าแสดงว่าค่าในชุดถูกจัดกลุ่มตามค่าเฉลี่ย ตัวอย่างเช่น เรามีสามอันชุดตัวเลข : (0, 0, 14, 14), (0, 6, 8, 14) และ (6, 6, 8, 8) ทั้งสามชุดมีค่าเฉลี่ยเท่ากับ 7 และส่วนเบี่ยงเบนมาตรฐานเท่ากับ 7, 5 และ 1 ตามลำดับ ชุดสุดท้ายมีค่าเบี่ยงเบนมาตรฐานเล็กน้อยเนื่องจากค่าในชุดถูกจัดกลุ่มตามค่าเฉลี่ย ชุดแรกมีมากที่สุดคุ้มค่ามาก

    โดยทั่วไปแล้ว ค่าเบี่ยงเบนมาตรฐานถือได้ว่าเป็นการวัดความไม่แน่นอน ตัวอย่างเช่น ในวิชาฟิสิกส์ ค่าเบี่ยงเบนมาตรฐานใช้ในการระบุข้อผิดพลาดของชุดการวัดปริมาณบางค่าที่ต่อเนื่องกัน ค่านี้มีความสำคัญมากในการพิจารณาความน่าเชื่อถือของปรากฏการณ์ภายใต้การศึกษาเมื่อเปรียบเทียบกับค่าที่ทำนายโดยทฤษฎี: หากค่าเฉลี่ยของการวัดแตกต่างอย่างมากจากค่าที่ทำนายโดยทฤษฎี (ส่วนเบี่ยงเบนมาตรฐานขนาดใหญ่) ดังนั้นควรตรวจสอบค่าที่ได้รับหรือวิธีการรับอีกครั้ง ระบุด้วยความเสี่ยงของพอร์ตการลงทุน

    ภูมิอากาศ

    สมมติว่ามีสองเมืองที่มีอุณหภูมิสูงสุดเฉลี่ยต่อวันเท่ากัน แต่เมืองหนึ่งตั้งอยู่บนชายฝั่งและอีกเมืองหนึ่งอยู่บนที่ราบ เป็นที่ทราบกันดีว่าเมืองต่างๆ ที่ตั้งอยู่บนชายฝั่งมีอุณหภูมิสูงสุดในเวลากลางวันที่แตกต่างกันหลายประการ ซึ่งต่ำกว่าเมืองที่ตั้งอยู่ในแผ่นดิน ดังนั้น ค่าเบี่ยงเบนมาตรฐานของอุณหภูมิสูงสุดรายวันสำหรับเมืองชายฝั่งทะเลจะน้อยกว่าเมืองที่สอง แม้ว่าค่าเฉลี่ยจะเท่ากันก็ตาม ซึ่งในทางปฏิบัติหมายความว่าความน่าจะเป็นที่ อุณหภูมิสูงสุดอากาศในแต่ละวันของปีจะแตกต่างอย่างมากจากค่าเฉลี่ย ซึ่งสูงกว่าสำหรับเมืองที่ตั้งอยู่ในทวีป

    กีฬา

    สมมติว่ามีทีมฟุตบอลหลายทีมที่จัดอันดับตามพารามิเตอร์บางชุด เช่น จำนวนประตูที่ทำได้และเสียโอกาสทำประตู เป็นต้น มีแนวโน้มว่าทีมที่ดีที่สุดในกลุ่มนี้จะมีมูลค่าดีที่สุด สำหรับ มากกว่าพารามิเตอร์ ยิ่งค่าเบี่ยงเบนมาตรฐานของทีมสำหรับแต่ละพารามิเตอร์ที่นำเสนอน้อยเท่าไร ผลลัพธ์ของทีมก็จะยิ่งสมดุลมากขึ้นเท่านั้น ในทางกลับกันทีมที่มี คุ้มค่ามากส่วนเบี่ยงเบนมาตรฐานเป็นเรื่องยากที่จะคาดเดาผลลัพธ์ได้ ซึ่งในทางกลับกัน อธิบายได้ด้วยความไม่สมดุล เช่น การป้องกันที่แข็งแกร่งแต่เป็นการโจมตีที่อ่อนแอ

    การใช้ค่าเบี่ยงเบนมาตรฐานของพารามิเตอร์ทีมทำให้สามารถทำนายผลการแข่งขันระหว่างสองทีมได้ในระดับหนึ่งหรืออย่างอื่น ประเมินจุดแข็งและ จุดอ่อนคำสั่งและดังนั้นวิธีการต่อสู้ที่เลือก

    บ้าน ((คำพ้องความหมาย:, ส่วนเบี่ยงเบนมาตรฐาน, ส่วนเบี่ยงเบนมาตรฐาน, - คำที่เกี่ยวข้อง:, ส่วนเบี่ยงเบนมาตรฐาน) - ในทฤษฎีความน่าจะเป็นและสถิติ ตัวบ่งชี้ที่พบบ่อยที่สุดของการกระจายตัวของค่าของตัวแปรสุ่มที่สัมพันธ์กับความคาดหวังทางคณิตศาสตร์ โดยปกติแล้วคำเหล่านี้หมายถึงรากที่สองของความแปรปรวนของตัวแปรสุ่ม แต่บางครั้งคำเหล่านี้อาจหมายถึงการประมาณค่านี้รูปแบบใดรูปแบบหนึ่งก็ได้

    ในวรรณคดีมักแสดงด้วยอักษรกรีก ไม่เป็นที่รู้จักแล้วคุณไม่ควรใช้(ซิกมา).

    พื้นฐาน

    ค่าเบี่ยงเบนมาตรฐานถูกกำหนดให้เป็นรากที่สองของความแปรปรวนของตัวแปรสุ่ม: σ = D [ X ] (\displaystyle \sigma =(\sqrt (D[X]))).

    ค่าเบี่ยงเบนมาตรฐานวัดเป็นหน่วยของตัวแปรสุ่ม และใช้ในการคำนวณค่าคลาดเคลื่อนมาตรฐานของค่าเฉลี่ยเลขคณิต เมื่อสร้างช่วงความเชื่อมั่น เมื่อทดสอบสมมติฐานทางสถิติ เมื่อวัดความสัมพันธ์เชิงเส้นระหว่างตัวแปรสุ่ม

    ในทางปฏิบัติ เมื่อแทนที่จะแจกแจงที่แน่นอนของตัวแปรสุ่ม มีเพียงตัวอย่างเท่านั้นที่ใช้ได้ ค่าเบี่ยงเบนมาตรฐาน เช่น ค่าคาดหวังทางคณิตศาสตร์ จะถูกประมาณ (ความแปรปรวนตัวอย่าง) และสิ่งนี้สามารถทำได้ ในรูปแบบที่แตกต่างกัน- มักใช้คำว่า "ส่วนเบี่ยงเบนมาตรฐาน" และ "ค่าเบี่ยงเบนกำลังสองเฉลี่ยราก" รากที่สองจากความแปรปรวนของตัวแปรสุ่ม (กำหนดผ่านการแจกแจงจริง) แต่บางครั้งก็ถึง ตัวเลือกต่างๆการประมาณค่านี้ขึ้นอยู่กับตัวอย่าง

    โดยเฉพาะถ้า ที่ไหน - σ 2 (\displaystyle \sigma ^(2))องค์ประกอบที่หนึ่งของการเลือก x ฉัน (\displaystyle x_(i))- ขนาดตัวอย่าง - เข้มงวดมากขึ้น - ด้วยความน่าจะเป็นประมาณ 0.9973 ค่าของตัวแปรสุ่มแบบกระจายปกติจะอยู่ในช่วงเวลาที่ระบุ (โดยมีเงื่อนไขว่าค่า- ค่าเฉลี่ยเลขคณิตของกลุ่มตัวอย่าง (ค่าเฉลี่ยตัวอย่าง - การประมาณค่าความคาดหวังทางคณิตศาสตร์ของค่า):

    x mac = 1 n ∑ i = 1 n x i = 1 n (x 1 + … + x n) , (\displaystyle (\bar (x))=(\frac (1)(n))\sum _(i=1 )^(n)x_(i)=(\frac (1)(n))(x_(1)+\ldots +x_(n)),)

    มีสองวิธีหลักในการประเมิน ส่วนเบี่ยงเบนมาตรฐานเขียนดังนี้

    การประมาณค่าส่วนเบี่ยงเบนมาตรฐานจากการประมาณค่าความแปรปรวนแบบเอนเอียง (บางครั้งเรียกง่ายๆ ว่าความแปรปรวนตัวอย่าง):

    S = 1 n ∑ i = 1 n (x i − x Â) 2

    (\displaystyle S=(\sqrt ((\frac (1)(n))\sum _(i=1)^(n)\left(x_(i)-(\bar (x))\right)^ (2))).)

    ตาม GOST R 8.736-2011 ค่าเบี่ยงเบนมาตรฐานคำนวณโดยใช้สูตรที่สองของส่วนนี้ กรุณาตรวจสอบผลลัพธ์

    ตาม GOST R 8.736-2011 ค่าเบี่ยงเบนมาตรฐานคำนวณโดยใช้สูตรที่สองของส่วนนี้ กรุณาตรวจสอบผลลัพธ์นอกจากนี้ ค่าเบี่ยงเบนมาตรฐานคือค่าคาดหวังทางคณิตศาสตร์ของผลต่างกำลังสองระหว่างค่าจริงของตัวแปรสุ่มกับการประมาณค่าของวิธีการประมาณค่าบางวิธี ถ้าค่าประมาณไม่เอนเอียง (ค่าเฉลี่ยตัวอย่างเป็นเพียงค่าประมาณที่ไม่เอนเอียงสำหรับตัวแปรสุ่ม) ค่านี้จะเท่ากับความแปรปรวนของการประมาณค่านี้ กฎสามซิกมา - () สถานะ: ความน่าจะเป็นที่ตัวแปรสุ่มใดๆ จะเบี่ยงเบนไปจากค่าเฉลี่ยของมันน้อยกว่า< 3 σ) ≥ 8 9 {\displaystyle P(|\xi -E\xi \mid <3\sigma)\geq {\frac {8}{9}}} .

    ภูมิอากาศ

    สมมติว่ามีสองเมืองที่มีอุณหภูมิสูงสุดเฉลี่ยต่อวันเท่ากัน แต่เมืองหนึ่งตั้งอยู่บนชายฝั่งและอีกเมืองหนึ่งอยู่บนที่ราบ เป็นที่ทราบกันดีว่าเมืองต่างๆ ที่ตั้งอยู่บนชายฝั่งมีอุณหภูมิสูงสุดในเวลากลางวันที่แตกต่างกันหลายประการ ซึ่งต่ำกว่าเมืองที่ตั้งอยู่ในแผ่นดิน ดังนั้น ค่าเบี่ยงเบนมาตรฐานของอุณหภูมิสูงสุดรายวันสำหรับเมืองชายฝั่งทะเลจะน้อยกว่าค่าเบี่ยงเบนมาตรฐานของเมืองที่สอง แม้ว่าค่าเฉลี่ยของค่านี้จะเท่ากันก็ตาม ซึ่งในทางปฏิบัติหมายความว่าความน่าจะเป็นที่อุณหภูมิอากาศสูงสุดบน วันใดวันหนึ่งของปีจะสูงกว่าแตกต่างจากค่าเฉลี่ย ซึ่งสูงกว่าสำหรับเมืองที่ตั้งอยู่ในแผ่นดิน

    กีฬา

    สมมติว่ามีทีมฟุตบอลหลายทีมที่จัดอันดับตามพารามิเตอร์บางชุด เช่น จำนวนประตูที่ทำได้และเสียโอกาสทำประตู เป็นต้น มีแนวโน้มว่าทีมที่ดีที่สุดในกลุ่มนี้จะมีมูลค่าที่ดีกว่า ​​ด้วยพารามิเตอร์จำนวนมากขึ้น ยิ่งค่าเบี่ยงเบนมาตรฐานของทีมสำหรับแต่ละพารามิเตอร์ที่นำเสนอน้อยเท่าไร ผลลัพธ์ของทีมก็จะยิ่งสมดุลมากขึ้นเท่านั้น ในทางกลับกัน ทีมที่มีค่าเบี่ยงเบนมาตรฐานสูงนั้นยากที่จะคาดเดาผลลัพธ์ ซึ่งในทางกลับกัน อธิบายได้จากความไม่สมดุล เช่น การป้องกันที่แข็งแกร่งแต่การโจมตีที่อ่อนแอ

    การใช้ค่าเบี่ยงเบนมาตรฐานของพารามิเตอร์ทีมทำให้สามารถทำนายผลการแข่งขันระหว่างสองทีมได้ในระดับหนึ่งหรืออย่างอื่น ประเมินจุดแข็งและจุดอ่อนของทีม และดังนั้นวิธีการต่อสู้ที่เลือก

    ตัวอย่างการคำนวณส่วนเบี่ยงเบนมาตรฐานของคะแนนนักเรียน

    สมมติว่ากลุ่มที่เราสนใจ (ประชากรทั่วไป) เป็นชั้นเรียนที่มีนักเรียน 8 คนซึ่งให้คะแนนตามระบบ 10 คะแนน เนื่องจากเรากำลังประมาณค่าทั้งกลุ่ม ไม่ใช่กลุ่มตัวอย่าง เราจึงใช้ค่าเบี่ยงเบนมาตรฐานจากการประมาณค่าความแปรปรวนแบบเอนเอียงได้ ในการทำเช่นนี้เราจะหารากที่สองของค่าเฉลี่ยเลขคณิตของกำลังสองของการเบี่ยงเบนของค่าจากค่าเฉลี่ย

    ให้เกรดของนักเรียนในชั้นเรียนเป็นดังนี้

    2 , 4 , 4 , 4 , 5 , 5 , 7 , 9. (\displaystyle 2,\ 4,\ 4,\ 4,\ 5,\ 5,\ 7,\ 9.)

    จากนั้นคะแนนเฉลี่ยคือ:

    μ = 2 + 4 + 4 + 4 + 5 + 5 + 7 + 9 8 = 5 (\displaystyle \mu =(\frac (2+4+4+4+5+5+7+9)(8)) =5)

    มาคำนวณค่าเบี่ยงเบนกำลังสองของเกรดของนักเรียนจากเกรดเฉลี่ยกัน

    ค่านิยมที่ได้รับจากประสบการณ์ย่อมมีข้อผิดพลาดอันเนื่องมาจากสาเหตุหลายประการอย่างหลีกเลี่ยงไม่ได้ ในหมู่พวกเขา เราควรแยกแยะระหว่างข้อผิดพลาดที่เป็นระบบและข้อผิดพลาดแบบสุ่ม ข้อผิดพลาดที่เป็นระบบเกิดจากเหตุผลที่กระทำในลักษณะที่เฉพาะเจาะจงมาก และสามารถกำจัดหรือนำมาพิจารณาได้อย่างแม่นยำเสมอ ข้อผิดพลาดแบบสุ่มมีสาเหตุจากสาเหตุจำนวนมากที่ไม่สามารถอธิบายได้อย่างแม่นยำและดำเนินการด้วยวิธีที่แตกต่างกันในการวัดแต่ละครั้ง ข้อผิดพลาดเหล่านี้ไม่สามารถยกเว้นได้ทั้งหมด สามารถนำมาพิจารณาได้โดยเฉลี่ยเท่านั้น ซึ่งจำเป็นต้องรู้กฎหมายที่ควบคุมข้อผิดพลาดแบบสุ่ม

    เราจะแสดงปริมาณที่วัดได้ด้วย A และข้อผิดพลาดแบบสุ่มในการวัด x เนื่องจากข้อผิดพลาด x อาจเกิดขึ้นกับค่าใดๆ ก็ได้ มันจึงเป็นตัวแปรสุ่มแบบต่อเนื่อง ซึ่งมีคุณลักษณะครบถ้วนตามกฎการกระจายตัวของมัน

    สิ่งที่เรียกว่าการสะท้อนความเป็นจริงที่ง่ายที่สุดและแม่นยำที่สุด (ในกรณีส่วนใหญ่) กฎหมายการกระจายข้อผิดพลาดปกติ:

    กฎหมายการกระจายนี้สามารถหาได้จากสถานที่ทางทฤษฎีต่างๆ โดยเฉพาะอย่างยิ่งจากข้อกำหนดที่ว่าค่าที่เป็นไปได้มากที่สุดของปริมาณที่ไม่รู้จักซึ่งได้รับชุดของค่าที่มีระดับความแม่นยำเท่ากันโดยการวัดโดยตรงคือค่าเฉลี่ยเลขคณิตของ ค่าเหล่านี้ จำนวนที่ 2 เรียกว่า การกระจายตัวของกฎปกตินี้

    ค่าเฉลี่ยเลขคณิต

    การหาค่าการกระจายตัวจากข้อมูลการทดลอง หากสำหรับค่า A ใด ๆ ค่า n i ได้มาโดยการวัดโดยตรงด้วยความแม่นยำระดับเดียวกันและหากข้อผิดพลาดของค่า A อยู่ภายใต้กฎการแจกแจงแบบปกติค่าที่น่าจะเป็นไปได้มากที่สุดของ A จะเป็น ค่าเฉลี่ยเลขคณิต:

    เอ - ค่าเฉลี่ยเลขคณิต

    ก - ค่าที่วัดได้ที่ขั้นตอนที่ i

    การเบี่ยงเบนของค่าที่สังเกตได้ (สำหรับการสังเกตแต่ละครั้ง) a i ของค่า A จาก ค่าเฉลี่ยเลขคณิต: ฉัน-ก.

    หากต้องการระบุความแปรปรวนของกฎการกระจายข้อผิดพลาดปกติในกรณีนี้ ให้ใช้สูตร:

    2 - การกระจายตัว
    เอ - ค่าเฉลี่ยเลขคณิต
    n - จำนวนการวัดพารามิเตอร์

    ส่วนเบี่ยงเบนมาตรฐาน

    ส่วนเบี่ยงเบนมาตรฐานแสดงความเบี่ยงเบนสัมบูรณ์ของค่าที่วัดได้จาก ค่าเฉลี่ยเลขคณิต- ตามสูตรการวัดความแม่นยำของผลรวมเชิงเส้น หมายถึงค่าคลาดเคลื่อนกำลังสองค่าเฉลี่ยเลขคณิตถูกกำหนดโดยสูตร:

    , ที่ไหน


    เอ - ค่าเฉลี่ยเลขคณิต
    n - จำนวนการวัดพารามิเตอร์
    ก - ค่าที่วัดได้ที่ขั้นตอนที่ i

    ค่าสัมประสิทธิ์ของการแปรผัน

    ค่าสัมประสิทธิ์ของการแปรผันแสดงลักษณะการวัดสัมพัทธ์ของการเบี่ยงเบนของค่าที่วัดได้จาก ค่าเฉลี่ยเลขคณิต:

    , ที่ไหน

    V - สัมประสิทธิ์การแปรผัน
    - ส่วนเบี่ยงเบนมาตรฐาน
    เอ - ค่าเฉลี่ยเลขคณิต

    ยิ่งมีค่ามากเท่าไร ค่าสัมประสิทธิ์ของการแปรผันยิ่งค่าที่ศึกษามีการกระจายค่อนข้างมากและความสม่ำเสมอน้อยลง ถ้า ค่าสัมประสิทธิ์ของการแปรผันน้อยกว่า 10% ดังนั้นความแปรปรวนของอนุกรมรูปแบบถือว่าไม่มีนัยสำคัญ จาก 10% ถึง 20% ถือเป็นค่าเฉลี่ย มากกว่า 20% และน้อยกว่า 33% ถือว่ามีนัยสำคัญ และหาก ค่าสัมประสิทธิ์ของการแปรผันเกิน 33% ซึ่งบ่งบอกถึงความหลากหลายของข้อมูลและความจำเป็นในการยกเว้นค่าที่ใหญ่ที่สุดและน้อยที่สุด

    ค่าเบี่ยงเบนเชิงเส้นเฉลี่ย

    หนึ่งในตัวชี้วัดขอบเขตและความรุนแรงของการแปรผันก็คือ ค่าเบี่ยงเบนเชิงเส้นเฉลี่ย(โมดูลส่วนเบี่ยงเบนเฉลี่ย) จากค่าเฉลี่ยเลขคณิต ค่าเบี่ยงเบนเชิงเส้นเฉลี่ยคำนวณโดยสูตร:

    , ที่ไหน

    _
    เอ - ส่วนเบี่ยงเบนเชิงเส้นเฉลี่ย
    เอ - ค่าเฉลี่ยเลขคณิต
    n - จำนวนการวัดพารามิเตอร์
    ก - ค่าที่วัดได้ที่ขั้นตอนที่ i

    เพื่อตรวจสอบความสอดคล้องของค่าที่ศึกษากับกฎการแจกแจงแบบปกติจะใช้ความสัมพันธ์ ตัวบ่งชี้ความไม่สมดุลถึงความผิดพลาดและทัศนคติของเขา ตัวบ่งชี้ความโด่งถึงความผิดพลาดของเขา

    ตัวบ่งชี้ความไม่สมมาตร

    ตัวบ่งชี้ความไม่สมมาตร(A) และข้อผิดพลาด (ma) คำนวณโดยใช้สูตรต่อไปนี้:

    , ที่ไหน

    เอ - ตัวบ่งชี้ความไม่สมมาตร
    - ส่วนเบี่ยงเบนมาตรฐาน
    เอ - ค่าเฉลี่ยเลขคณิต
    n - จำนวนการวัดพารามิเตอร์
    ก - ค่าที่วัดได้ที่ขั้นตอนที่ i

    ตัวบ่งชี้ Kurtosis

    ตัวบ่งชี้ Kurtosis(E) และข้อผิดพลาด (m e) คำนวณโดยใช้สูตรต่อไปนี้:

    , ที่ไหน

    ในการทดสอบสมมติฐานทางสถิติ เมื่อทำการวัดความสัมพันธ์เชิงเส้นระหว่างตัวแปรสุ่ม

    ค่าเบี่ยงเบนมาตรฐานวัดเป็นหน่วยการวัดของตัวแปรสุ่ม และใช้ในการคำนวณค่าคลาดเคลื่อนมาตรฐานของค่าเฉลี่ยเลขคณิต เมื่อสร้างช่วงความเชื่อมั่น เมื่อทดสอบสมมติฐานทางสถิติ เมื่อวัดความสัมพันธ์เชิงเส้นระหว่างตัวแปรสุ่ม กำหนดให้เป็นรากที่สองของความแปรปรวนของตัวแปรสุ่ม

    (\displaystyle s=(\sqrt ((\frac (n)(n-1))\sigma ^(2)))=(\sqrt ((\frac (1)(n-1))\sum _( i=1)^(n)\left(x_(i)-(\bar (x))\right)^(2)));)(ค่าประมาณค่าเบี่ยงเบนมาตรฐานของตัวแปรสุ่ม พื้น ผนังรอบตัวเรา และเพดาน ส่วนเบี่ยงเบนมาตรฐานสัมพันธ์กับความคาดหวังทางคณิตศาสตร์โดยอิงจากการประมาณค่าความแปรปรวนที่เป็นกลาง):

    การกระจายตัวอยู่ที่ไหน - พื้น ผนังรอบตัวเรา และเพดาน σ 2 (\displaystyle \sigma ^(2))องค์ประกอบที่ 3 ของการเลือก - ขนาดตัวอย่าง - ค่าเฉลี่ยเลขคณิตของกลุ่มตัวอย่าง:

    ควรสังเกตว่าการประมาณการทั้งสองมีความลำเอียง ในกรณีทั่วไป ไม่สามารถสร้างการประมาณการที่เป็นกลางได้ อย่างไรก็ตาม การประมาณการตามการประมาณค่าความแปรปรวนที่เป็นกลางมีความสอดคล้องกัน

    ตาม GOST R 8.736-2011 ค่าเบี่ยงเบนมาตรฐานคำนวณโดยใช้สูตรที่สองของส่วนนี้ กรุณาตรวจสอบผลลัพธ์

    ตาม GOST R 8.736-2011 ค่าเบี่ยงเบนมาตรฐานคำนวณโดยใช้สูตรที่สองของส่วนนี้ กรุณาตรวจสอบผลลัพธ์() - ค่าเกือบทั้งหมดของตัวแปรสุ่มแบบกระจายปกติจะอยู่ในช่วงเวลา เข้มงวดมากขึ้น - ด้วยความเชื่อมั่นไม่ต่ำกว่า 99.7% ค่าของตัวแปรสุ่มแบบกระจายแบบปกติจะอยู่ในช่วงที่ระบุ (โดยมีเงื่อนไขว่าค่าเป็นจริงและไม่ได้รับจากการประมวลผลตัวอย่าง)

    หากไม่ทราบมูลค่าที่แท้จริง เราก็ไม่ควรใช้ แต่พื้น ผนังรอบตัวเรา และเพดาน , ก- ดังนั้น กฎสามซิกมาจึงเปลี่ยนเป็นกฎสามชั้น ผนังรอบตัวเรา และเพดาน , ก .

    - ดังนั้นกฎสามซิกมาจึงเปลี่ยนเป็นกฎสามซิกมา

    ค่าเบี่ยงเบนมาตรฐานขนาดใหญ่แสดงค่าสเปรดขนาดใหญ่ในชุดที่นำเสนอพร้อมกับค่าเฉลี่ยของชุด ค่าเล็กน้อยแสดงว่าค่าในชุดจัดกลุ่มตามค่าเฉลี่ย

    ตัวอย่างเช่น เรามีชุดตัวเลขสามชุด: (0, 0, 14, 14), (0, 6, 8, 14) และ (6, 6, 8, 8) ทั้งสามชุดมีค่าเฉลี่ยเท่ากับ 7 และส่วนเบี่ยงเบนมาตรฐานเท่ากับ 7, 5 และ 1 ตามลำดับ ชุดสุดท้ายมีค่าเบี่ยงเบนมาตรฐานเล็กน้อยเนื่องจากค่าในชุดถูกจัดกลุ่มตามค่าเฉลี่ย ชุดแรกมีค่าเบี่ยงเบนมาตรฐานที่ใหญ่ที่สุด - ค่าภายในชุดแตกต่างจากค่าเฉลี่ยอย่างมาก

    โดยทั่วไปแล้ว ค่าเบี่ยงเบนมาตรฐานถือได้ว่าเป็นการวัดความไม่แน่นอน ตัวอย่างเช่น ในวิชาฟิสิกส์ ค่าเบี่ยงเบนมาตรฐานใช้ในการระบุข้อผิดพลาดของชุดการวัดปริมาณบางค่าที่ต่อเนื่องกัน ค่านี้มีความสำคัญมากในการพิจารณาความน่าเชื่อถือของปรากฏการณ์ภายใต้การศึกษาเมื่อเปรียบเทียบกับค่าที่ทำนายโดยทฤษฎี: หากค่าเฉลี่ยของการวัดแตกต่างอย่างมากจากค่าที่ทำนายโดยทฤษฎี (ส่วนเบี่ยงเบนมาตรฐานขนาดใหญ่) ดังนั้นควรตรวจสอบค่าที่ได้รับหรือวิธีการรับอีกครั้ง

    การประยุกต์ใช้ในทางปฏิบัติ

    ในทางปฏิบัติ ค่าเบี่ยงเบนมาตรฐานช่วยให้คุณสามารถกำหนดได้ว่าค่าในชุดอาจแตกต่างจากค่าเฉลี่ยมากน้อยเพียงใด

    ภูมิอากาศ

    สมมติว่ามีสองเมืองที่มีอุณหภูมิสูงสุดเฉลี่ยต่อวันเท่ากัน แต่เมืองหนึ่งตั้งอยู่บนชายฝั่งและอีกเมืองหนึ่งอยู่บนบก เป็นที่ทราบกันดีว่าเมืองต่างๆ ที่ตั้งอยู่บนชายฝั่งมีอุณหภูมิสูงสุดในเวลากลางวันที่แตกต่างกันหลายประการ ซึ่งต่ำกว่าเมืองที่ตั้งอยู่ในแผ่นดิน ดังนั้น ค่าเบี่ยงเบนมาตรฐานของอุณหภูมิสูงสุดรายวันสำหรับเมืองชายฝั่งทะเลจะน้อยกว่าค่าเบี่ยงเบนมาตรฐานของเมืองที่สอง แม้ว่าค่าเฉลี่ยของค่านี้จะเท่ากันก็ตาม ซึ่งในทางปฏิบัติหมายความว่าความน่าจะเป็นที่อุณหภูมิอากาศสูงสุดบน วันใดวันหนึ่งของปีจะสูงกว่าแตกต่างจากค่าเฉลี่ย ซึ่งสูงกว่าสำหรับเมืองที่ตั้งอยู่ในแผ่นดิน

    กีฬา

    สมมติว่ามีทีมฟุตบอลหลายทีมที่จัดอันดับตามพารามิเตอร์บางชุด เช่น จำนวนประตูที่ทำได้และเสียโอกาสทำประตู เป็นต้น มีแนวโน้มว่าทีมที่ดีที่สุดในกลุ่มนี้จะมีมูลค่าที่ดีกว่า ​​ด้วยพารามิเตอร์จำนวนมากขึ้น ยิ่งค่าเบี่ยงเบนมาตรฐานของทีมสำหรับแต่ละพารามิเตอร์ที่นำเสนอน้อยเท่าไร ผลลัพธ์ของทีมก็จะยิ่งสมดุลมากขึ้นเท่านั้น ในทางกลับกัน ทีมที่มีค่าเบี่ยงเบนมาตรฐานสูงนั้นยากที่จะคาดเดาผลลัพธ์ ซึ่งในทางกลับกัน อธิบายได้จากความไม่สมดุล เช่น การป้องกันที่แข็งแกร่งแต่การโจมตีที่อ่อนแอ

    การใช้ค่าเบี่ยงเบนมาตรฐานของพารามิเตอร์ทีมทำให้สามารถทำนายผลการแข่งขันระหว่างสองทีมได้ในระดับหนึ่งหรืออย่างอื่น ประเมินจุดแข็งและจุดอ่อนของทีม และดังนั้นวิธีการต่อสู้ที่เลือก

    การวิเคราะห์ทางเทคนิค

    ดูเพิ่มเติม

    วรรณกรรม

    * โบโรวิคอฟ, วี.สถิติ. ศิลปะการวิเคราะห์ข้อมูลบนคอมพิวเตอร์: สำหรับมืออาชีพ / V. Borovikov - เซนต์ปีเตอร์สเบิร์ก : ปีเตอร์, 2546. - 688 น. - ไอ 5-272-00078-1.

    ค่าเฉลี่ยรากกำลังสองหรือส่วนเบี่ยงเบนมาตรฐานเป็นตัวบ่งชี้ทางสถิติที่ประเมินปริมาณความผันผวนของตัวอย่างตัวเลขที่อยู่รอบๆ ค่าเฉลี่ย เกือบทุกครั้งค่าส่วนใหญ่จะกระจายอยู่ภายในบวกหรือลบหนึ่งส่วนเบี่ยงเบนมาตรฐานจากค่าเฉลี่ย

    คำนิยาม

    ค่าเบี่ยงเบนมาตรฐานคือรากที่สองของค่าเฉลี่ยเลขคณิตของผลรวมของการเบี่ยงเบนกำลังสองจากค่าเฉลี่ย เข้มงวดและเป็นคณิตศาสตร์ แต่ไม่สามารถเข้าใจได้อย่างแน่นอน นี่เป็นคำอธิบายด้วยวาจาของสูตรในการคำนวณค่าเบี่ยงเบนมาตรฐาน แต่เพื่อให้เข้าใจความหมายของคำศัพท์ทางสถิตินี้ เรามาทำความเข้าใจทุกอย่างตามลำดับกัน

    ลองจินตนาการถึงสนามยิงปืน เป้าหมาย และลูกศร มือปืนยิงไปที่เป้าหมายมาตรฐาน โดยที่การยิงเข้าจุดศูนย์กลางจะได้ 10 คะแนน ขึ้นอยู่กับระยะห่างจากจุดศูนย์กลางจำนวนคะแนนจะลดลง และการยิงไปยังพื้นที่สุดขั้วจะได้เพียง 1 คะแนนเท่านั้น การยิงของนักกีฬาแต่ละคนจะเป็นค่าจำนวนเต็มสุ่มระหว่าง 1 ถึง 10 เป้าหมายที่เต็มไปด้วยกระสุนเป็นตัวอย่างที่สมบูรณ์แบบของการแจกแจงตัวแปรสุ่ม

    ความคาดหวัง

    นักยิงมือใหม่ของเราฝึกฝนการยิงมาเป็นเวลานานและสังเกตเห็นว่าเขามีโอกาสได้ค่าที่แตกต่างกันออกไป สมมติว่าจากการยิงจำนวนมาก เขาพบว่าเขายิงได้ 10 ครั้งโดยมีความน่าจะเป็น 15% ค่าที่เหลือได้รับความน่าจะเป็น:

    • 9 - 25 %;
    • 8 - 20 %;
    • 7 - 15 %;
    • 6 - 15 %;
    • 5 - 5 %;
    • 4 - 5 %.

    ตอนนี้เขากำลังเตรียมที่จะยิงอีกครั้ง เขามีแนวโน้มที่จะตีค่าใดมากที่สุด? ความคาดหวังทางคณิตศาสตร์จะช่วยเราตอบคำถามนี้ เมื่อรู้ถึงความน่าจะเป็นเหล่านี้แล้ว เราก็สามารถกำหนดผลลัพธ์ที่เป็นไปได้มากที่สุดของการยิงได้ สูตรการคำนวณความคาดหวังทางคณิตศาสตร์นั้นค่อนข้างง่าย ลองแสดงว่าค่าช็อตเป็น C และความน่าจะเป็นเป็น p ความคาดหวังทางคณิตศาสตร์จะเท่ากับผลรวมของผลิตภัณฑ์ของค่าที่สอดคล้องกันและความน่าจะเป็น:

    มากำหนดความคาดหวังสำหรับตัวอย่างของเรา:

    • M = 10 × 0.15 + 9 × 0.25 + 8 × 0.2 + 7 × 0.15 + 6 × 0.15 + 5 × 0.05 + 4 × 0.05
    • ม = 7.75

    ดังนั้นจึงมีแนวโน้มว่าผู้ยิงจะโดนโซน 7 แต้ม บริเวณนี้จะถูกยิงหนักที่สุด ซึ่งเป็นผลดีจากการถูกโจมตีบ่อยที่สุด สำหรับตัวแปรสุ่มใดๆ ค่าที่คาดหวังหมายถึงค่าที่พบมากที่สุดหรืออยู่ตรงกลางของค่าทั้งหมด

    การกระจายตัว

    การกระจายตัวเป็นตัวบ่งชี้ทางสถิติอีกตัวหนึ่งที่แสดงให้เห็นการแพร่กระจายของค่า เป้าหมายของเราเต็มไปด้วยกระสุนหนาแน่น และการกระจายทำให้เราสามารถแสดงพารามิเตอร์นี้เป็นตัวเลขได้ หากความคาดหวังทางคณิตศาสตร์แสดงจุดศูนย์กลางของช็อต แสดงว่าการกระจายตัวก็คือการแพร่กระจาย โดยพื้นฐานแล้วการกระจายหมายถึงความคาดหวังทางคณิตศาสตร์ของการเบี่ยงเบนของค่าจากค่าที่คาดหวังนั่นคือกำลังสองเฉลี่ยของการเบี่ยงเบน แต่ละค่าจะถูกยกกำลังสองเพื่อให้ค่าเบี่ยงเบนเป็นบวกเท่านั้น และจะไม่หักล้างกันในกรณีของตัวเลขที่เหมือนกันและมีเครื่องหมายตรงกันข้าม

    D[X] = M - (M[X]) 2

    มาคำนวณการแพร่กระจายของช็อตสำหรับกรณีของเรา:

    • M = 10 2 × 0.15 + 9 2 × 0.25 + 8 2 × 0.2 + 7 2 × 0.15 + 6 2 × 0.15 + 5 2 × 0.05 + 4 2 × 0.05
    • ม = 62.85
    • D[X] = M - (M[X]) 2 = 62.85 - (7.75) 2 = 2.78

    ค่าเบี่ยงเบนของเราคือ 2.78 หมายความว่าจากพื้นที่บนเป้าหมายที่มีค่า 7.75 รูกระสุนจะกระจายออกไป 2.78 จุด อย่างไรก็ตาม ในรูปแบบบริสุทธิ์ จะไม่ใช้ค่าความแปรปรวน ผลลัพธ์คือกำลังสองของค่า ในตัวอย่างของเรา นี่คือจุดกำลังสอง แต่ในกรณีอื่นๆ อาจเป็นตารางกิโลกรัมหรือตารางดอลลาร์ การกระจายตัวเป็นค่ากำลังสองไม่ใช่ข้อมูล ดังนั้นจึงเป็นตัวบ่งชี้ระดับกลางในการพิจารณาค่าเบี่ยงเบนมาตรฐาน - ฮีโร่ของบทความของเรา

    ส่วนเบี่ยงเบนมาตรฐาน

    ในการแปลงความแปรปรวนเป็นหน่วยกิโลกรัมหรือดอลลาร์ที่มีความหมาย เราจะใช้ค่าเบี่ยงเบนมาตรฐาน ซึ่งเป็นรากที่สองของความแปรปรวน ลองคำนวณตามตัวอย่างของเรา:

    S = ตร.ม.(D) = ตร.ต.(2.78) = 1.667

    เราได้รับคะแนนแล้วและตอนนี้ก็ใช้คะแนนเหล่านี้เพื่อเชื่อมโยงกับความคาดหวังทางคณิตศาสตร์ได้แล้ว ผลลัพธ์ที่เป็นไปได้มากที่สุดของการยิงในกรณีนี้จะแสดงเป็น 7.75 บวกหรือลบ 1.667 ก็พอตอบได้ แต่เราบอกได้เลยว่าเกือบจะแน่นอนว่ามือปืนจะเข้าพื้นที่เป้าหมายระหว่างเวลา 6.08 ถึง 9.41 น.

    ค่าเบี่ยงเบนมาตรฐานหรือซิกมาเป็นตัวบ่งชี้ข้อมูลที่แสดงให้เห็นการแพร่กระจายของค่าที่สัมพันธ์กับจุดศูนย์กลาง ยิ่งซิกม่ามีขนาดใหญ่เท่าใด ตัวอย่างก็จะยิ่งแสดงมากขึ้นเท่านั้น นี่เป็นค่าสัมประสิทธิ์ที่ได้รับการศึกษามาอย่างดี และกฎสามซิกม่าที่น่าสนใจนั้นขึ้นชื่อเรื่องการแจกแจงแบบปกติ เป็นที่ยอมรับว่า 99.7% ของค่าของปริมาณที่แจกแจงตามปกตินั้นอยู่ในช่วงบวกหรือลบสามซิกม่าจากค่าเฉลี่ยเลขคณิต

    ลองดูตัวอย่าง

    ความผันผวนของคู่สกุลเงิน

    เป็นที่ทราบกันดีว่าวิธีการทางสถิติทางคณิตศาสตร์มีการใช้กันอย่างแพร่หลายในตลาดแลกเปลี่ยนเงินตราต่างประเทศ เทอร์มินัลการซื้อขายหลายแห่งมีเครื่องมือในตัวสำหรับการคำนวณความผันผวนของสินทรัพย์ ซึ่งแสดงให้เห็นถึงการวัดความผันผวนของราคาของคู่สกุลเงิน แน่นอนว่า ตลาดการเงินมีความเฉพาะเจาะจงในการคำนวณความผันผวน เช่น ราคาเปิดและปิดของตลาดหลักทรัพย์ แต่ตามตัวอย่าง เราสามารถคำนวณซิกม่าของแท่งเทียนรายวัน 7 แท่งล่าสุด และประมาณความผันผวนรายสัปดาห์โดยประมาณได้

    คู่สกุลเงินปอนด์/เยนถือเป็นสินทรัพย์ที่มีความผันผวนมากที่สุดในตลาด Forex อย่างถูกต้อง สมมติว่าตามทฤษฎีในช่วงสัปดาห์ ราคาปิดของตลาดหลักทรัพย์โตเกียวจะมีค่าดังต่อไปนี้:

    145, 147, 146, 150, 152, 149, 148.

    มาป้อนข้อมูลนี้ลงในเครื่องคิดเลขแล้วคำนวณซิกมาเท่ากับ 2.23 ซึ่งหมายความว่าโดยเฉลี่ยแล้วเงินเยนของญี่ปุ่นเปลี่ยนแปลง 2.23 เยนทุกวัน หากทุกอย่างยอดเยี่ยมมาก เทรดเดอร์จะสร้างรายได้นับล้านจากการเคลื่อนไหวดังกล่าว

    บทสรุป

    ค่าเบี่ยงเบนมาตรฐานใช้ในการวิเคราะห์ทางสถิติของตัวอย่างตัวเลข นี่เป็นค่าสัมประสิทธิ์ที่เป็นประโยชน์ในการประเมินการแพร่กระจายของข้อมูล เนื่องจากสองชุดที่มีค่าเฉลี่ยเท่ากันอาจแตกต่างกันอย่างสิ้นเชิงในการแพร่กระจายของค่า ใช้เครื่องคิดเลขของเราเพื่อค้นหาซิกม่าตัวอย่างเล็กๆ



อ่านอะไรอีก.