การประยุกต์สถิติในชีวิตประจำวัน

การประยุกต์สถิติในชีวิตประจำวัน

ในชีวิตประจำวันเรามักเกี่ยวข้องกับสถิติ ตัวเลขต่าง ๆ มากมาย เราได้ยินการพูดถึงสถิติเรื่องต่าง ๆ เช่นประเทศไทยมีผู้ป่วยเป็นไข้เลือดออกเพิ่มขึ้นมาก และมีสถิติผู้ตายด้วยไข้เลือดออกเป็นจำนวนเปอร์เซนต์ของผู้ป่วยที่พบ เราดูทีวีก็พบสถิติการรายงานปริมาณน้ำฝนในที่ต่าง ๆ โดยเปรียบเทียบกับปีก่อน ๆ หรือบางปีบอกว่าฝนแล้งหรือมีปริมาณฝนน้อยที่สุดในรอบยี่สิบปี ครั้งเมื่อดูกีฬา เช่น กีฬาเอเซียนเกมที่ผ่านมา ก็พบว่านักกีฬาบางคนทำลายสถิติในหลายประเภท ประเภทกีฬาทางน้ำ และกรีฑา มีสถิติเป็นตัวเลขบอกไว ้มีการเปรียบเทียบกับสถิติ คำว่าสถิติจึงคุ้นหูเราอยู่เสมอ 

ขอบเขตของคำว่า “สถิติ” มีความหมายกว้างขวางยิ่งนัก สถิติเป็นศาสตร์ สาขาหนึ่งของวิชาคณิตศาสตร์ เป็นวิชาการที่เกี่ยวข้องโดยตรงกับทุกคน เพราะการดำรงชีวิตของเราอยู่ที่การเปรียบเทียบ การวัด การประมาณค่าตลอดจนการนำตัวเลขมาเป็นเกณฑ์มาตรฐานต่าง ๆ เช่น ประเทศไทยมีอัตราเงินเฟ้อ 4% สถิติยังเป็นเครื่องมือที่ใช้ในทางวิทยาศาสตร์ที่นักวิทยาศาสตร์ใช้สรุปผลการทดลองต่าง ๆ ได้อย่างมากมาย 

ภายในบ้าน พ่อบ้านแม่เรือน ก็อาจจะมีการบันทึกค่าใช้จ่ายรายเดือน มีการตรวตดูและควบคุมเพื่อให้รายรับและรายจ่ายพอเหมาะต่อการดำรงชีพของครอบครัวภายในองค์ฏรเช่นในบริษัทก็มีการจดบันทึกข้อมูลต่าง ๆ บันทึกการขาย มีการลงบัญชีเพื่อทำงบดุลต่าง ๆ มีการสร้างค่าสถิติตัวเลขให้ผู้บริหารได้รับทราบสภาพของกิจการ มีการเขียนในรูปกราฟหรือการนำเสนอข้อมูลเพื่อให้ดูได้ง่าย คำว่า “สถิติ” ที่หลายคนพบเห็นจึงเกี่ยวข้องกับตัวเลข จนทำให้เกิดความเข้าใจผิดคิดว่า วิชาการทางสถิติจะเกี่ยวข้องแต่ตัวเลขเท่านั้น หรือสถิติคงเกี่ยวกับการประมวลผลตัวเลขตามวิธีการทางสถิติ สถิติเป็นวิชาการที่เกี่ยวข้องกับข้อมูลละการประมวลผลข้อมูลในความหมายที่แท้จริง ยังรวมถึงระเบียบวิธีการทางสถิติที่เกี่ยวข้องกับวิธีการจัดเก็บและรวบรวมข้อมูล นำวิเคราะห์ข้อมูล การตีความหมายข้อมูลที่เก็บรวบรวมมา การนำเสนอข้อมูล รวมถึงการประมวลผลข้อมูลต่าง ๆ

วิชาทางด้านสถิติจึงได้รับการพัฒนามานานแล้ว จากหลักฐานทางประวัติศาสตร์ พบว่า นักคณิตศาสตร์ชาวจีน ชาวกรีกโบราณ รู้จัดการใช้สถิติ การเก็บรวบรวมข้อมูล โดยนำข้อมูลบางอย่างมาใช้ เช่น ผลผลิตทางด้านเกษตรกรรม การจัดเก็บภาษี 

เมื่อสังคมความเป็นอยู่ของมนุษย์เจริญขึ้น ปัญหาด้านต่าง ๆ ที่เกี่ยวข้องในชีวิตประจำวันยิ่งซับซ้อนขึ้น เช่นปัญหาการผลิตสินค้าจำนวนมากในระบบอุตสาหกรรม สถิติเข้าไปมีส่วนเกี่ยวข้องอยู่มาก การพัฒนาประเทศก็เป็นปัญหาที่ซับซ้อน สถิติช่วยในการบริหารงานของภาครัฐ ข้อมูลสถิติช่วยให้เห็นสภาพความเป็นไปของสังคม และได้เข้าใจและรู้จักกับสถานะภาพของสังคมได้ดีขึ้น สถิติจึงเป็นเครื่องมือที่ช่วยในการตัดสินใจ และกำหนดนโยบายต่าง ๆ เพื่อให้เป็นไปอย่างมีประสิทธิภาพ


ที่มา : รศ. ยืน ภู่วรวรรณ, สำนักบริการคอมพิวเตอร์ มหาวิทยาลัยเกษตรศาสตร์

ข้อมูลและการประมวลผลข้อมูล

ข้อมูลและการประมวลผลข้อมูล

ข้อมูล
ข้อมูลและสารสนเทศ
คุณสมบัติของข้อมูล
การทำข้อมูลให้เป็นสารสนเทศ
ในปัจจุบันการแข่งขันทางธุรกิจต้องอาศัยข้อมูลเป็นหลัก จึงมีการนำเทคโนโลยีมาช่วยจัดการข้อมูลอย่างมาก ดังจะเห็นได้จากการแข่งขันการให้บริการของธนาคารพาณิชย์ การใช้ข้อมูลในการตัดสินใจลงทุนซื้อขายหลักทรัพย์ ข้อมูลเป็นหัวใจของการดำเนินงานเป็นแหล่งความรู้ที่ใช้ประกอบการตัดสินใจ บริษัทหรือองค์การจึงดำเนินการอย่างจริงจังให้ได้มาซึ่งข้อมูล และปกป้องดูแลข้อมูลของตนเป็นอย่างดี เพราะข้อมูลเป็นสิ่งมีค่ามีราคา การโจรกรรมข้อมูลโดยใช้เทคโนโลยีใหม่ ๆ จึงเป็นปัญหาสำคัญที่เกิดขึ้น ดังที่ปรากฎเป็นข่าวทั้งในประเทศและต่างประเทศกระดานอิเล็คทรอนิกส์แสดงราคาหลักทรัพย์
กระดานอิเล็คทรอนิกส์แสดงราคาหลักทรัพย์ ข้อมูล (data) คือข้อเท็จจริง หรือเหตุการณ์ที่เกี่ยวข้องกับสิ่งต่าง ๆ เช่น คน สัตว์ สิ่งของ สถานที่ ฯลฯ ข้อมูลจึงเป็นเรื่องที่เกี่ยวกับเหตุการณ์ของสิ่งต่าง ๆ ที่เกิดขึ้นอย่างต่อเนื่อง มีการรวบรวมข้อมูลอย่างเป็นระบบและต่อเนื่อง ดังจะเห็นจากกระบวนการเลือกตั้งที่ผ่านมา หลายพรรคการเมืองมีการใช้เทคโนโลยีรวบรวมข้อมูล หาวิธีการที่จะให้ได้ข้อมูลอย่างรวดเร็ว และมื่อสถานการณ์บางอย่างเกิดผันแปรขึ้น การเตรียมการหรือการแก้สถานการณ์จะดำเนินการได้อย่างทันท่วงที 

กรรมวิธีการรวบรวมข้อมูลเป็นจุดเริ่มต้นของการดำเนินงาน การรวบรวมข้อมูลที่ดีจะได้ข้อมูลรวดเร็ว ถูกต้องแม่นยำ ครบถ้วน ดังนั้นผู้ดำเนินการต้องให้ความสำคัญที่จุดนี้ โดยเฉพาะความรวดเร็ว ความรวดเร็วของการเก็บข้อมูลจึงผูกพันกับเทคโนโลยีซึ่งมีหลายวิธี เช่น การใช้ไปรษณีย์อิเล็กทรอนิกส์ การเชื่อมต่อกับระบบปลายทางเพื่อรับข้อมูล การใช้โทรสาร การใช้ระบบอ่านข้อมูลอัตโนมัติ เช่น เครื่องกราดตรวจ (scanner) อ่าน ข้อมูลที่เป็นรหัสแท่ง (bar code)

ข้อมูล ข้อมูลและสารสนเทศ คุณสมบัติของข้อมูล การทำข้อมูลให้เป็นสารสนเทศ

ที่มา : รศ. ยืน ภู่วรวรรณ, สำนักบริการคอมพิวเตอร์ มหาวิทยาลัยเกษตรศาสตร์

ความน่าจะเป็นของเหตุการณ์

ความน่าจะเป็นของเหตุการณ์

 ในชีวิตประจำวันเราอยู่กับเหตุการณ์ต่าง ๆ และมีคำถามอยู่ในใจตลอดเวลา เช่น

                               – พรุ่งนี้ฝนจะตกหรือไม่
                               – บางทีเราต้องไปทำงานวันนี้
                               – นายกอาจลาออกและยุปสภาเร็ว ๆ นี้
                               – ทีมฟุตบอลทีมใดจะได้เป็นแชมป์โลก
                               – ใครชนะเลือกตั้งในสมัยหน้า
 

คำว่า “ความน่าจะเป็น” หรือ “probability” เป็นวิธีการวัดความไม่แน่นอนในรูปแบบคณิตศาสตร์ เช่น เมื่อโยนเหรียญ ความน่าจะเป็นของเหรียญที่จะออกหัวหรือก้อยเท่ากับ 0.5 

ดังนั้นเหตุการณ์ต่าง ๆ ที่เกิดขึ้นในอาณาคตเป็นสิ่งที่ยากจะคาดเดาได้ถูกต้องร้อยเปอร์เซนต์ นักอุตุนิยมวิทยาจึงใช้หลักการของความน่าจะเป็นเข้ามาทำนาย เช่น ความน่าจะเป็นของการเกิดฝนตกใน กรุงเทพมหานคร ในวันพรุ่งนี้มีค่าเท่ากับ 0.7
 ความน่าจะเป็น เป็นค่าที่อาจมีความหมายที่หลายคนเข้าใจได้ไม่ยาก ความน่าจะเป็น เป็นศาสตร์ที่มีความละเอียดอ่อนที่จะนำไปประยุกต์ใช้ โดยเฉพาะเหตุการณ์ในชีวิตประจำวันต่าง ๆ ความน่าจะเป็นมีการกำหนดค่าเป็นเศษส่วนหรือเป็นเปอร์เซนต์หรือให้มีค่าระหว่าง 0 ถึง 1 เช่น ถ้านำลูกเต๋า ทอยลงบนพื้น โอกาสที่จะปรากฎหน้า 1 มีค่าเท่ากับ 1/6 หรือ 16.6 เปอร์เซนต์ ถ้าโยนเหรียญหนึ่งเหรียญ และให้ตกบนพื้น (โยนแบบยุติธรรม) โอกาสที่จะปรากฏหัวเท่ากับ 1/2 หรือ 0.5

เราจะวัดหาค่าความน่าจะเป็นได้อย่างไร?

เราสามารถวัดหาค่าความน่าจะเป็นได้สองวิธี (บางทีเป็น 3 วิธี) ขึ้นกับสภาวะแวดล้อม

 


ที่มา : รศ. ยืน ภู่วรวรรณ, สำนักบริการคอมพิวเตอร์ มหาวิทยาลัยเกษตรศาสตร์

 

ไดอะแกรมเวน (Venn diagram)

ไดอะแกรมเวน (Venn diagram)ปัญหาบางอย่างมีความซับซ้อนขึ้น เช่น ในมหาวิทยาลัยแห่งหนึ่งนิสิตในคณะเศรษฐศาสตร์และบริหารธุรกิจจำนวน 1500 คน แบ่งเป็นเพศชาย และหญิง สาขาที่เรียนในคณะนี้มี 4 สาขา คือ สาขาบัญชี เศรษฐศาสตร์ การเงิน และคอมพิวเตอร์ธุรกิจ หากนิสิตเพศชายและเพศหญิง เลือกเรียนสาขาต่าง ๆ ดังนี้

บัญชี เศรษฐศาสตร์ การเงิน คอมพิวเตอร์ธุรกิจ
ชาย 330 360 90 120
หญิง 120 390 60 30

 

จากข้อมูลนี้ ถ้าเลือกนิสิตเรียนสาขาต่าง ๆ เป็นไปอย่างสุ่ม จงหา

1.    ความน่าจะเป็นของการเลือกเรียนสาขาเศรษฐศาสตร์
2.    ความน่าจะเป็นของนิสิตที่เป็นเพศชาย
3.    ความน่าจะเป็นที่ได้นิสิตที่เป็นเพศหญิงและเลือกเรียนเศรษฐศาสตร์และการเงิน

 

แนวคิดเช่นนี้ถือว่านิสิตแต่ละคน เลือกเรียนสาขาใดสาขาหนึ่งได้สาขาเดียว โดยนิสิตรวมทั้งหมดมี 1500 คน ดังนั้นเขียนความน่าจะเป็นของตารางได้เป็น

บัญชี เศรษฐศาสตร์ การเงิน คอมพิวเตอร์ธุรกิจ
ชาย 0.22 0.24 0.06 0.08
หญิง 0.08 0.26 0.04 0.02

 

ดังนั้น… 

1. ความน่าจะเป็นของนิสิตที่เรียนเศรษฐศาสตร์

 

P(เศรษฐศาสตร์)   =   P(นิสิตชายที่เรียนเศรษฐศาสตร์) + P(นิสิตหญิงที่เรียนเศรษฐศาสตร์)
  =   0.24 + 0.26
  =   0.5

 

2. ความน่าจะเป็นของนิสิตชาย

P(ชาย)   =   0.22 + 0.24 + 0.06 + 0.08
  =   0.6

 

3. ความน่าจะเป็นที่ได้นิสิตหญิงเรียนเศรษฐศาสตร์และเรียนการเงิน

P(นิสิตหญิงที่เรียนเศรษฐศาสตร์และการเงิน)   =   0.26 + 0.04
  =   0.3

 

เพื่อความเข้าใจง่ายเราเขียนไดอะแกรมแสดงได้

ไดอะแกรมเวนที่แทนนิสิตเพศชาย 

คราวนี้ลองดูตัวอย่างใหม่ ซึ่งถ้าใช้ไดอะแกรมเวนจะทำให้เข้าใจง่ายและคำนวณหาคำตอบได้ 

ในการสำรวจความนิยมของคน 100 คน ที่มีต่อนาย ก. นาย ข. และนาย ค. โดยทุกคนต้องแสดงความนิยมคนใดคนหนึ่งอย่างน้อยหนึ่งคน ปรากฏว่าผลสำรวจเป็นดังนี้

ผู้ลงคะแนนนิยมทั้งสามคน มี ร้อยละ 13
ผู้ลงคะแนนนิยมนาย ก. และนาย ข. มี ร้อยละ 20
ผู้ลงคะแนนนิยมนาย ข. และนาย ค. มี ร้อยละ 15
ผู้ลงคะแนนนิยมนาย ก. และนาย ค. มี ร้อยละ 12
ผู้ลงคะแนนนิยมนาย ค. อย่างเดียว มี ร้อยละ 9
ปรากฏว่านาย ก. ได้คะแนนนิยมมากกว่านาย ข. 6 คะแนน

 

จงหาคะแนนนิยมของแต่ละคน… 

จากกรณีนี้ถ้าเขียนไดอะแกรมเวน จะได้ดังรูปไดอะแก<br />
รมเวน” /></p>
<table width= สมมุติให้ผู้ลงคะแนนนาย ก. อย่างเดียว    x    คน              ผู้ลงคะแนนนาย ข. อย่างเดียว    y    คน จำนวนผู้ลงคะแนนทั้งหมด 100    คน
ดังนั้น

  x + y + 20 + 13 + 12 + 15 + 9 =    100    คน x + y =      31    คน      …..(1)  

  ผู้ลงคะแนนนาย ก. มากกว่านาย ข.     6    คน  

  (x + 20 + 13 + 12) – (y + 20 + 13 + 15) =       6    คน x – y =       9    คน      …..(2)         (1) + (2)     —>     2x =     40    คน x =     20    คน y =     11    คน
ดังนั้น

            คนที่เลือกนาย ก. มีทั้งหมด =      65    คน           คนที่เลือกนาย ข. มีทั้งหมด =      59    คน           คนที่เลือกนาย ค. มีทั้งหมด =      49    คน

 


ที่มา : รศ. ยืน ภู่วรวรรณ, สำนักบริการคอมพิวเตอร์ มหาวิทยาลัยเกษตรศาสตร์

 

 

 

 

 

ประชากรและตัวแทน

ประชากรและตัวแทน
ปัจจุบันเรามักได้ยินคำว่า“โพล”หรือการสำรวจความคิดเห็นของประชาชนด้านต่าง ๆ ลองนึกดูว่า ประชากรไทยมีทั้งสิ้น 60 ล้านคน ถ้าต้องสำรวจความคิดเห็นของคนทั้ง 60 ล้านคน โดยการสอบถามหรือส่งแบบสอบถามไป คงเป็นไปไม่ได้ แต่จะใช้วิธีการสุ่ม ซึ่งหลายต่อหลายครั้งเราจะเห็นว่า โพลแต่ละโพล สำรวจความคิดเห็นเพียงจำนวนร้อยและพัน ซึ่งสามารถสอบถามได้เร็ว สรุปผลได้ทันกับความต้องการ แต่ผลที่ได้จะมีความน่าเชื่อถือได้เพียงไร ใช้แทนประชากรทั้งกลุ่มได้หรือไม่ ปัญหานี้คงอยู่ในความคิด แต่ก็เห็นได้ว่า การดำเนินการในลักษณะนั้นสามารถนำมาใช้ประโยชน์ได้ในวิชาการทางสถิติ คำว่า ประชากร (population) เป็นคำที่เรานำมาใช้บ่อย เรามีการสุ่มข้อมูลเพื่อเป็น ตัวแทน (sample)ดังนั้น เราคงต้องทำความเข้าใจกับคำว่าประชากร และตัวแทนให้ชัดเจน เพราะในชีวิตประจำวันของเรา เราจะพบเห็นและนำมาใช้ประโยชน์ได้มาก  

ลองนึกดูว่า ประเทศไทยมีประชากร 60 ล้านคน คำว่าประชากรจึงหมายถึง สิ่งที่ครอบคลุมขอบเขตของข้อมูลทั้งหมด ค่าทุกค่าจากการที่อยู่ในประชากรจะมีคุณสมบัติเหมือนกัน เช่น มีค่าเฉลี่ย (mean) เหมือนกัน เช่น ประชากรไทยมีรายได้เฉลี่ย 40,000 บาทต่อปี ค่าวาเรียนซ์ (variance) ของประชากรก็จะเหมือนกัน ตัวแทน (sample)ตัวแทนจึงเป็นส่วนหนึ่งของประชากร บางครั้งอาจมีการสุ่มแบบร้อยเปอร์เซ็นต์ คือ ใช้ทั้งหมดของประชากร แต่การทำการทั่วไปใช้หลักการทางสถิติ จึงไม่จำเป็นต้องทำการสำรวจข้อมูลทั้งประชากร เพราะจะทำได้ยาก และเสียค่าใช้จ่ายสูง เสียเวลา การทดลองจึงกำหนดไว้ที่ตัวแทน เช่น การสำรวจความนิยมต่อรัฐบาลจะใช้ตัวแทน โดยเน้นให้เป็นตัวแทนของประชากรทั้งหมด เมื่อได้ผลการทดลองก็พอจะอนุโลมเอาไปใช้ประโยชน์ได้  

งานวิจัยและทดสอบหลายอย่าง เช่น การปลูกพืชโดยใช้ปุ๋ย โดยทดลองกับพืชที่ปลูกจำนวนจำกัด เช่น 100 ต้น เมื่อเสร็จสิ้นการทดลอง ก็จะสรุปผลและเผยแพร่ผลของปุ๋ยที่มีต่อพืชชนิดนี้ได้ ในการทดลองใด ๆ จึงต้องกล่าวถึงตัวแทนให้ชัดเจน และเน้นว่าเป็นตัวแทนของประชากรใด เพื่อว่าผลลัพธ์ที่ได้จะได้นำไปใช้กับประชากรนั้น เพราะหากนำตัวแทนไปใช้ต่างประชากรกันก็จะไม่ได้ผล


รศ. ยืน ภู่วรวรรณ, สำนักบริการคอมพิวเตอร์ มหาวิทยาลัยเกษตรศาสตร์

ตัวแทนสุ่ม (random sample)

ตัวแทนสุ่ม (random sample) ในการทดลองหรือต้องการหาตัวแทนต้องมีวิธีการได้มาของตัวแทน เช่นในชั้นเรียนชั้นมัธยมปีที่1 ของโรงเรียนหนึ่งที่มีนักเรียน 100 คน  เราจะทำได้ด้วยการเอารายชื่อของนักเรียนทั้ง 100 คนมาเขียนลงบนกระดานแล้วทำม้วนใส่ลงในภาชนะ เขย่าแล้วหยิบมา 10 ใบ นักเรียนที่ถูกเลือกมา 10 คนนี้ถือว่าเป็นตัวแปรสุ่มของประชากร

คอมพิวเตอร์มีการสร้างตัวแปรสุ่ม ซึ่งปกติก็เป็นตัวเลขที่มีคุณสมบัติในการกระจายหรือมีโอกาสเท่ากัน เช่นถ้ามีการสร้างตัวเลขสุ่มของตัวเลขจาก 1 ถึง 100 จำนวน 10 ตัวเลข ตัวเลขเลขสุ่มนี้อาจจะนำมาแทนหมายเลขนักเรียนที่ถูกเลือกมา การใช้ตัวเลขสุ่มจึงเอามาใช้แทนการเลือกได้ หลักการของตัวเลขสุ่มมีหลักที่ต้องให้โอกาสของตัวเลขทุกตัวมีความน่าจะเป็นเท่ากัน

ตัวแปร (Variable)

การทดลองหรือเก็บขอมูลจำเป็นต้องหาค่า ซึ่งอาจจะได้จากการสังเกต การตรวจวัด การสอบถาม เช่น การทดลองเกี่ยวกับการเจริญเติบโตของต้นถั่ว อาจจะต้องสังเกตและวัดความสูงของต้น การเก็บรวบรวมข้อมูลของแต่ละครั้ง เรียกว่าข้อมูล ข้อมูลมีลักษณะประจำ คือ มีความผันแปรกัน เช่น  ถ้าวัดความสูงของนักเรียน 10 คน ก็จะได้ตัวเลขข้อมูล 10 ข้อมูล 

หากพิจารณาตัวแปร X ซึ่งแทนความสูงของเด็กนักเรียนในชั้นมัธยมปีที่ 1 จะเขียนได้เป็น

X1 = 159 X2 = 160 X3 = 162 X4 = 155 X5 = 161
X6 = 164 X7 = 155 X8 = 163 X9 = 156 X10 = 166
เราเขียนแทนกลุ่มข้อมูล ดังนี้
( X1 , X2 , X3 , … Xn )
สมมุติว่า n = 10  ก็เขียนได้
(X1, X2, X3,..,X10)
ตัวแปรที่ใช้ยังแบ่งออกเป็นสองประเภท คือ ตัวแปรต่อเนื่อง
ตัวแปรไม่ต่อเนื่อง

ที่มา : รศ. ยืน ภู่วรวรรณ, สำนักบริการคอมพิวเตอร์ มหาวิทยาลัยเกษตรศาสตร์

 

ความกระจาย การแปรผันของข้อมูล

ความกระจาย การแปรผันของข้อมูลตัวแปรที่ใช้ในทางสถิติตัวหนึ่งย่อมมีค่า เช่น X1 คือความสูงของนักเรียนคนหนึ่ง มีค่าเท่ากับ 155 เซนติเมตร ถ้าค่าของความสูงของนักเรียนที่เป็นตัวแทน n คน ย่อมมีความแตกต่าง มีตั้งแต่เตี้ยสุดไปยังสูงสุด การกระจายข้อมูลของตัวแปรมีคุณลักษณะแตกต่างกัน ลักษณะการกระจายอาจเขียนเป็นรูปกราฟได้

การปรากฎมาก น้อย เรียกว่าความถี่ ในทางสถิติถือเป็นความน่าจะเป็นเช่นกัน เช่น ความสูงปานกลางของนักเรียนในชั้นมัธยมปีที่ 1 อยู่ที่ 160-165 เซนติเมตร ช่วงความสูงนี้มีทั้งสิ้น 30 คน จาก 100 คน จะเห็นว่าค่าที่เกิดขึ้นในเรื่องความถี่ คือ มีจำนวนคนที่มีค่าข้อมูลอยู่ในช่วงนี้มีกี่คน หรือ.ดูในรูปของความน่าจะเป็นได้ ค่าความสูงเฉลี่ยปานกลางอยู่ที่ 152 เซนติเมตร

เราใช้  แทนค่าเฉลี่ย      แต่ค่า นี้เป็นค่าเฉลี่ยที่ใช้สำหรับตัวแทน (sample)      แต่สำหรับประชากรแล้วเราใช้  (มิว) แทนค่าเฉลี่ยของประชากร

ดังนั้น  และ  จึงมีความหมายที่แตกต่างกัน


 

ตัวอย่าง เช่น เมื่อเราโยนลูกเต๋า โดยให้ลูกเต๋ามีค่าเป็น 1,2,3,4,5,6 ตามหน้าที่ออก หากพิจารณาค่าเฉลี่ยของตัวเลขที่เกิดจากการโยนลูกเต๋า โดยพิจารณาจากประชากรทั้งหมดซึ่งค่าเฉลี่ยนี้ คือ

 

แต่ถ้าเราโยนลูกเต๋าเองในลักษณะเพื่อการทดลองหรือทำเป็น sample ซึ่งก็คือตัวแทน โดยมีการโยน 5 ครั้งผลที่ได้ คือ 2,1,5,3,4,3 เมื่อนำมาหาค่าเฉลี่ยได้

จะเห็นว่า    ไม่เท่ากับ 

และจากข้อมูลความกระจายเราอาจได้ตัวเลข เช่นความเป็นไปได้ของนักเรียนที่มีความสุงเกิน 162 เซนติเมตรมี 0.5 เป็นต้น


ที่มา : รศ. ยืน ภู่วรวรรณ, สำนักบริการคอมพิวเตอร์ มหาวิทยาลัยเกษตรศาสตร์

การวัดแนวโน้มเข้าสู่ศูนย์กลาง (Central Tendency)

การวัดแนวโน้มเข้าสู่ศูนย์กลาง (Central Tendency)วิชาสถิติเป็นคณิตศาสตร์ที่ใช้ในการอธิบายข้อมูลซึ่งเป็นตัวแทนประชากร จากตัวอย่างที่ว่า ความสูงเฉลี่ยของนักเรียนในชั้นมัธยมปีที่ 1 มีค่าเท่ากับ 162 เซนติเมตร ในกรณีเช่นนี้ไม่ได้หมายความว่านักเรียนชั้นมัธยมปีที่ 1 ทุกคนสูง 192 เซนติเมตรหมด แต่บางคนอาจจะสูงกว่า  บางคนอาจจะเตี้ยกว่าในการศึกษาลักษณะสมบัติสิ่งต่างๆ  เราจึงต้องใช้ค่าที่ได้จากการสังเกต เช่น ผลผลิตข้าวโดยเฉลี่ยต่อไร่ เท่ากับ 80.5 ถัง เช่นเดียวกับ การกล่าวเช่นนี้  เป็นเพียงการบอกลักษณะสมบัติของข้าวโดยรวมไม่ใช่ทุกกรณี บางแปลงที่ชาวนาดูแลดี ก็จะได้มากกว่า 80.5 ถังก็ได้

การบอกด้วยค่าเฉลี่ย (mean) เป็นวิธีที่นิยมใช้กันมาก เพราะเข้าใจง่ายและรู้กันโดยทั่วไป      ค่าเฉลี่ยจึงหมายถึงค่าเฉลี่ยเลขคณิต (arithematic mean) ซึ่งคำนวณจากการรวมค่าของตัวแปรทั้งหมด    หารด้วยจำนวนตัวแปรที่นำเอามาคิด

สิ่งที่น่าสังเกตคือ ค่าความแตกต่างของตัวแปรกับค่าเฉลี่ยมีค่าหนึ่ง คือ (  Xi – ) ผลรวมของค่าความแตกต่างนี้ (   Xi – ) จะมีค่าเท่ากับ 0

ครั้งที่ทอย เลขหน้าที่ออก (   Xi – 










-1 
-2 
+2 

+1 
(   Xi –  0

นอกจากค่าเฉลี่ยเลขคณิตแล้วยังมีการวัดแวโน้มเข้าสู่ศูนย์กลางแบบอื่น เช่น  median    mode
 


ที่มา : รศ. ยืน ภู่วรวรรณ, สำนักบริการคอมพิวเตอร์ มหาวิทยาลัยเกษตรศาสตร์

ความเบี่ยงเบน

ความเบี่ยงเบน
ในชีวิตประจำวันเราใช้สถิติโดยที่เราไม่รู้ตัวอยู่มากมาย เช่น สงกรานต์ปีนี้มีคนขึ้นไปเที่ยวเชียงใหม่กันมาก ส่วนใหญ่มาจากกรุงเทพมหานคร ความหมายในที่นี้คือ กลุ่มคนที่มาเที่ยวเชียงใหม่มีกระจัดกระจายจากที่ต่าง ๆ แต่กลุ่มคนที่มามากที่สุดคือ มาจากกรุงเทพมหนคร คราวนี้ถ้าดูกันในแง่ของสถิติ เราต้องการดูความแปรปรวนของข้อมูล เช่น เรามีข้อมูลอยู่สองชุดคือ 

ข้อมูลชุดที่ 1    10, 12, 14ข้อมูลชุดที่ 2    30, 5, 1 

ข้อมูลทั้งสองชุดนี้ให้ค่าเฉลี่ยเท่ากันคือ 12 แต่หากพิจารณาที่พิสัย (range) จะพบว่า ขอบเขตของข้อมูลชุดที่สองมีการกระจายตัวกว้างกว่า คือ จาก 1 ถึง 30 เราจะเห็นว่า ชุดที่ 1 มีการรวมกลุ่มกัน กระจายตัวน้อยกว่า ทางสถิติเราคำนวณค่าความเบี่ยงเบนนี้ และเรียกว่า วาเรียนซ์ (varience)

ใช้สัญลักษณ์ 
(อ่านว่าซิกมา ยกกำลังสอง)
ใช้สัญลักษณ์ s2 ใช้สัญลักษณ์  และ s แทนวาเรียนซ์ของประชากร แทนวาเรียนซ์ของประชากร แทนส่วนเบี่ยงเบนมาตรฐานของประชากร แทนส่วนเบี่ยงเบนมาตรฐานของตัวแทน

  วาเรียนซ์คือ ผลบวกของกำลังสองของความแตกต่างระหว่างแต่ละค่า กับค่าเฉลี่ย หารด้วยจำนวนซึ่งน้อยกว่าจำนวนค่าทั้งหมดหนึ่ง 

ดังนั้น ถ้าประชากรมี x1, x2, . . ., xn และมี เป็นค่าเฉลี่ย วาเรียนซ์ที่ได้

= =

สำหรับวาเรียนซ์ของตัวแทน หาได้จาก  s = การหาค่าเฉลี่ยและวาเรียนซ์ทำให้เข้าใจลักษณะของข้อมูลการกระจายตัวของข้อมูลเช่น

ชุดข้อมูล A มีข้อมูล 0 48 49 51 52 100 ชุดข้อมูล B มีข้อมูล 47 48 49 51 52 53
ทั้งสองข้อมูลมีค่าเฉลี่ย เท่ากับ 50 เท่ากัน แต่พิสัยต่างกัน ความแปรปรวนของข้อมูลพิจารณาได้จากวาเรียนซ์
ข้อมูลชุด A ข้อมูลชุด B
ข้อมูล 0 -50 2500 48 -2 4 49 -1 1 51 1 1 52 2 4 100 50 2500 ผลรวม 5010
ข้อมูล 47 -3 9 48 -2 4 49 -1 1 51 1 1 52 2 4 53 3 9 ผลรวม 28
เมื่อนำมาหารด้วย s = 1002
วาเรียนซ์ของข้อมูลชุด A มีค่าเท่ากับ 1002
วาเรียนซ์ ของข้อมูลชุด A มีค่าเท่ากับ 28/5 ได้ 5.6
เห็นได้ชัดว่าข้อมูลสองชุดมีจำนวนข้อมูลเท่ากัน มีค่าเฉลี่ยเท่ากัน แต่การเปรียบเทียบข้อมูลยังมีความแตกต่างกัน ในเรื่องความปรวนแปร ข้อมูลชุด A มีความปรวนแปร หรือ มีวาเรียนซ์สูงกว่า ข้อมูลชุด B การใช้งานในชีวิตประจำวันอาจพบเห็นได้ เช่น เมื่อต้องการลงทุนในการซื้อหุ้นกิจการบริษัทในตลาดหลักทรัพย์ โดยพิจารณาจากบริษัทสามบริษัท คือ บริษัทรุ่งเรือง บริษัทค้าดี และบริษัทกิจการดี ข้อมูลที่เก็บย้อนหลังสิบปี โดยข้อมูลทั้งสิบปีประกอบด้วยข้อมูล การปันผล เมื่อนำเอาข้อมูลปันผลทั้งสิบปีมาคิดหาค่าสำคัญทางสถิติ ได้ผล ดังนี้

 

บริษัท ค่าเฉลี่ยการปันผล % ความเบี่ยงเบนมาตรฐาน % บริษัทรุ่งเจริญ
บริษัทค้าดี
บริษัทกิจการดี
855521

คำ

ถามมีอยู่ว่า เราจะเลือกลงทุนในกิจการบริษัทใดดี เพราะถ้าได้ปันผลเฉลี่ยสูง แต่มีความแปรปรวนสูง บางปีอาจได้ต่ำ บางปีอาจได้สูง หรือมีความเสี่ยงมาก 

 

 

เพื่อให้มีเงื่อนไขการตัดสินใจได้ง่ายขึ้น เรามีการวัด ค่าด้วยสัมประสิทธิ์ของความผันแปร (Coefficient of variation) ซึ่งค่านี้เป็นค่าส่วนความเบี่ยงเบนมาตรฐานคิดเป็นเปอร์เซนต์ของค่าเฉลี่ยcv = * 100 

ดังนั้น จากข้อมูลที่ได้มาจะเห็นว่าทั้งสามบริษัทมีค่า cv แตกต่างกัน 

 

cv ของบริษัทรุ่งเจริญ (5/8) * 100 = 62.5 % cv ของบริษัทค้าดี (2/5) * 100 = 40 % cv ของบริษัทกิจการดี (1/5) * 100 = 20 %
ข้อมูลนี้เป็นข้อมูลช่วยในการตัดสินใจ ถ้าเราต้องการความเสี่ยง โดยอาจได้ปันผลสูงในบางปี ก็ต้องเลือกบริษัทรุ่งเจริญ แต่ถ้าต้องการความแน่นอนก็ต้องเลือกบริษัทกิจการดี

ที่มา: รศ. ยืน ภู่วรวรรณ, สำนักบริการคอมพิวเตอร์ มหาวิทยาลัยเกษตรศาสตร์

 

การนำเสนอข้อมูล

การนำเสนอข้อมูลคอมพิวเตอร์ได้เข้ามามีบทบาทสำคัญต่อชีวิตประจำวัน พัฒนาการคอมพิวเตอร์ทำให้คอมพิวเตอร์มีขนาดเล็กลง มีขีดความสามารถสูงขึ้น คำนวณได้เร็ว และยังแสดงผลในแบบรูปภาพได้ดี ด้วยเหตุนี้จึงมีการพัฒนาโปรแกรมคอมพิวเตอร์สำหรับการใช้งานในระดับส่วนตัวมากมาย เช่น การสร้างเอกสาร สามารถจัดพิมพ์เอกสารที่มีความสวยงาม พิมพ์เอกสารที่เป็นตาราง รูปภาพ หรือการจัดรูปแบบเอกสาร เพื่อนำเสนอได้ดี ยังมีในรูปแบบตารางคำนวณที่เรียกว่า สเปรดชีต หรือ อิเล็กทรอนิกส์สเปรดชีต ตารางคำนวณมีขีดความสามารถเชิงคำนวณได้สูง คำนวณตามฟังก์ชันต่างๆ ผู้ใช้ใช้งานได้ง่ายโดยไม่ต้องเขียนโปรแกรม สามารถสร้างรูปกราฟแบบต่างๆ และนำเสนอผลจากตัวเลขในรูปแบบที่เป็นรูปกราฟเพื่อความเข้าใจที่ดีได้ 

 

นอกจากนี้ยังมีโปรแกรมกราฟิกส์ที่ใช้ในการนำเสนอผลงานโดยเฉพาะ เช่น โปรแกรมเพาเวอร์พอยต์ โปรแกรมนำเสนอผลงานสามารถเขียนกราฟและภาพกราฟิกส์ที่สวยงาม เพื่อใช้ในการแสดงผลได้ดี มีผู้นิยมใช้มากเพราะใช้งานได้ง่าย มีคุณภาพ ประกอบกับภาพแสดงผลในปัจจุบันสามารถเชื่อมต่อเข้ากับเครื่องฉายภาพ เพื่อนำเสนอในห้องประชุม หรือนำเสนอต่อบุคคลจำนวนมากได้ ในการนำเสนอผลงานจึงต้องมีหลักการ และการเลือกรูปภาพ ให้เหมาะสม เรามีรูปแบบของกราฟหลากหลายรูปแบบ

ฮิสโตแกรม กราฟแท่ง
การนำเสนอข้อมูลแบบอนุกรม กราฟวงกลม
กราฟ HI-LO กราฟ Scattering

 


ที่มา : รศ. ยืน ภู่วรวรรณ, สำนักบริการคอมพิวเตอร์ มหาวิทยาลัยเกษตรศาสตร์