200 likes | 558 Views
Probability & Statistics. 2301520 Fundamentals of AMCS. Probability Theory ( ทฤษฎีความน่าจะเป็น ). “ ความแน่นอนคือความไม่แน่นอน ” ทฤษฎีความน่าจะเป็น เป็นการนำคณิตศาสตร์มาใช้ในการอธิบายความไม่แน่นอน Sample Space the set of all outcomes of an experiment Event
E N D
Probability & Statistics 2301520 Fundamentals of AMCS
ProbabilityTheory (ทฤษฎีความน่าจะเป็น) • “ความแน่นอนคือความไม่แน่นอน” • ทฤษฎีความน่าจะเป็น เป็นการนำคณิตศาสตร์มาใช้ในการอธิบายความไม่แน่นอน • Sample Space • the set of all outcomes of an experiment • Event • a subset of of the sample space • ตัวอย่าง 1 ผลที่ได้จากการโยนลูกเต๋าหนึ่งลูก (discrete) • ตัวอย่าง 2 ช่วงเวลาที่หลอดไฟจะใช้งานได้จนกว่าจะเสีย (continuous)
ProbabilityFunction • ให้ S เป็น Sample space สมมุติว่าเซต B เป็นเซตของสับเซต(หรือ Event)ของ S ที่มีสมบัติต่อไปนี้ • ∈B • ถ้า A∈B แล้ว Ac∈B • ถ้า แล้ว (เรียก B ว่าเป็น sigma algebra ของ S) ฟังก์ชันความน่าจะเป็น P คือฟังก์ชันที่มีโดเมนเป็น B และสอดคล้องกับสมบัติต่อไปนี้ • P:B→ [0,1] • P(S)=1 • ถ้าเหตุการณ์ เป็นเหตุการณ์ไม่เกิดร่วม จะได้ว่า
ProbabilityFunction • หากมีการทดลองทำซ้ำเพื่อหาผลอะไรสักอย่างเป็นระยะเวลานานๆ P(A) บอกถึงสัดส่วนของเหตุการณ์ A ที่จะเกิดขึ้นเทียบกับผลที่เกิดขึ้นทั้งหมด
Random Variables • ตัวแปรสุ่ม (Random Variable) เป็นตัวแปรที่ใช้แทนค่าของเหตุการณ์ที่เกิดขึ้น โดยต้องมีค่าเป็นตัวเลข (ซึ่งอาจเป็นตัวเลขที่เป็นผลของเหตุการณ์โดยตรง หรือ ผลของเหตุการณ์สามารถแทนความหมายด้วยตัวเลขได้) • ตัวอย่าง 1 X เป็นตัวแปรสุ่มที่ใช้แทนหน้าที่เกิดจากการโยนลูกเต๋าหนึ่งลูก • ตัวอย่าง 2 X เป็นตัวแปรสุ่มที่ใช้แทนหน้าที่เกิดจากการโยนเหรียญหนึ่งเหรียญ • ตัวอย่าง 3 X เป็นตัวแปรสุ่มที่ใช้แทนช่วงเวลาที่หลอดไฟจะใช้งานได้จนกว่าจะเสีย
Probability Density Function(pdf) • ฟังก์ชันความหนาแน่นของความน่าจะเป็น • ถ้า X เป็นตัวแปรสุ่ม discrete จะเรียกว่า probability mass function (pmf) ซึ่งหมายถึง p(x) = P(X = x) • ถ้า X เป็นตัวแปรสุ่ม continuous pdfคือฟังก์ชัน f(x)≥0 ที่มีสมบัติว่า • ตัวอย่างตัวแปรสุ่มจากหน้าที่ 5
Cumulative Distribution Function (cdf) • ฟังก์ชันการแจกแจงสะสม • ถ้า X เป็นตัวแปรสุ่ม discrete และมี p(x) เป็น pdfแล้ว cdfคือ • ถ้า X เป็นตัวแปรสุ่ม continuous และมี f(x) เป็น pdfแล้ว cdfคือ • ตัวอย่างตัวแปรสุ่มจากหน้าที่ 5
Expectation • ค่าคาดหมาย (Expected Value) ของตัวแปรสุ่ม X แทนด้วย E[X] • ถ้า X เป็นตัวแปรสุ่ม discrete และมี p(x) เป็น pdfแล้ว • ถ้า X เป็นตัวแปรสุ่ม continuous และมี f(x) เป็น pdfแล้ว • ตัวอย่างตัวแปรสุ่มจากหน้าที่ 5
Variance • ความแปรปรวน (Variance) ของตัวแปรสุ่ม X แทนด้วย Var(X) นิยามเป็น • ในทางปฏิบัติ คำนวณจากสูตรต่อไปนี้จะง่ายกว่า • ตัวอย่างตัวแปรสุ่มจากหน้าที่ 5
Pmf/pdfที่ใช้บ่อย • Bernoulli: ตัวแปรสุ่ม X มีค่าสองค่าคือ 0 (Failure) และ 1(Success) parameter: p (ความน่าจะเป็น P(X=1)) pmf: ตัวอย่าง: ให้ X แทนผลลัพธ์ของการโยนเหรียญ 1 เหรียญ โดย X=1 หมายถึงออกหัว X=0หมายถึงออกก้อย ให้ความน่าจะเป็นของการออกหัวเป็น 1/3ดังนั้น เราจะได้ p(1) = , p(0) = , E[X]= , Var(X)=
Pmf/pdfที่ใช้บ่อย • Discrete Uniform • ตัวแปรสุ่ม X คือผลจากการทดลองที่มีทั้งหมด N แบบ โดยที่มีความน่าจะเป็นในการเกิดแต่ละแบบเท่าๆกัน parameter: N pmf: ตัวอย่าง: ให้ X แทนหน้าที่เกิดจากการโยนลูกเต๋าเที่ยงตรง 1 ลูก p(x) = , สำหรับ x=1,2,…,6
Pmf/pdfที่ใช้บ่อย • Binomial Distribution • ตัวแปรสุ่ม X คือจำนวนของการทดลองที่สำเร็จจากการทำการทดลองซ้ำทั้งหมด n ครั้ง parameters: n จำนวนของการทดลองทำซ้ำทั้งหมด p ความน่าจะเป็นที่การทดลองหนึ่งครั้งสำเร็จ pmf : • ตัวอย่าง: สมมุติว่าเราโยนเหรียญ 1 เหรียญทั้งหมด 10 ครั้ง ให้ X แทนจำนวนการโยนที่ให้ผลลัพธ์เป็น"หัว“ให้ความน่าจะเป็นของการออกหัวของเหรียญดังกล่าวเป็น 1/3 จงหาความน่าจะเป็นที่จะออกหัว 1) 5 ครั้งพอดี 2)ไม่เกิน 2ครั้ง
Pmf/pdfที่ใช้บ่อย • Geometric Distribution • ตัวแปรสุ่ม X คือจำนวนของการทดลองที่ทำซ้ำจนกว่าจะสำเร็จ parameters: p ความน่าจะเป็นที่การทดลองหนึ่งครั้งสำเร็จ pmf : • ตัวอย่าง: ให้ X แทนจำนวนการโยนการโยนเหรียญ 1 เหรียญจนกระทั่งได้ผลลัพธ์เป็น"หัว“ให้ความน่าจะเป็นของการออกหัวของเหรียญดังกล่าวเป็น 1/3 จงหาความน่าจะเป็นที่จะต้องโยนทั้งหมด • 1) 5 ครั้งพอดี 2)ไม่เกิน 2ครั้ง
Pmf/pdfที่ใช้บ่อย • Uniform • ตัวแปรสุ่ม X นิยมใช้แทนค่าจำนวนจริงที่อยู่ระหว่างช่วง [a,b] parameters: a,bค่าขอบล่างและบนของช่วง [a,b] pdf :
Pmf/pdfที่ใช้บ่อย • Normal Distribution • ตัวแปรสุ่ม X นิยมใช้อธิบายปรากฏการณ์หลายอย่างในชีวิตประจำวัน parameters: μค่าเฉลี่ย (mean) σคือค่าเบี่ยงเบนมาตรฐาน (standard deviation) pdf : • ถ้า μ=0, σ=1 เรียกการแจกแจงนี้ว่าเป็นการแจกแจงแบบปกติมาตรฐาน (Standard Normal Distribution) ค่าpdfมักจะใช้สัญลักษณ์ นั่นคือ และค่า cdfใช้
Central Limit Theorem (CLT) พิจารณาลำดับของตัวแปรสุ่มที่เป็นอิสระต่อกันและมีการแจกแจงเหมือนกัน (independent and identically distributed หรือ iid) โดยการแจกแจงดังกล่าวมีค่าเฉลี่ยและความแปรปรวนเป็นค่าจำกัด ผลรวมของตัวแปรสุ่มเหล่านั้นในจำนวนที่มากพอ จะมีการแจกแจงเข้าใกล้การแจกแจงแบบปกติ
Statistics • Tools for organizing and analyzing data. • Two branches • Descriptive Statistics • “describe” data, e.g. mean, mode, median, frequency • Inferential Statistics • make predictions or comparisons about a population using information from a smaller group (sample)
Population • ให้ N แทนขนาดของประชากร และ xiแทนค่าเชิงตัวเลขของประชากรที่ i • Population Mean: • Population Variance:
Sample • ให้ n แทนขนาดของกลุ่มตัวอย่าง และ yiแทนค่าเชิงตัวเลขของตัวอย่างที่ i • Sample Mean: • Sample Variance: • ทั้งคู่เป็น unbiased estimators ของ mean และ variance ของประชากร
Confidence Interval • ช่วงความเชื่อมั่น (Confidence Interval) ของ μ ที่มีระดับความเชื่อมั่นเปอร์เซ็นต์ หมายถึงว่า ความน่าจะเป็นที่ μ จะอยู่ในช่วงดังกล่าวคือประมาณ • จาก Central Limit Theorem ถ้าขนาดของกลุ่มตัวอย่างใหญ่พอช่วงดังกล่าวคำนวณได้จาก