นโยบายการจัดการความรู้ มหาวิทยาลัยสงขลานครินทร์ 1.ให้ใช้เครื่องมือการจัดการความรู้ผลักดัน คุณภาพคน และกระบวนทำงาน 2.ส่งเสริมการแลกเปลี่ยนประสบการณ์การทำงาน จากหน้างาน 3.ส่งเสริมให้มีเวทีเรียนรู้ร่วมกัน

Our Shangri-La
Ico64
Kittisakdi Choomalee

ภาควิชาเวชศาสตร์ชุมชน คณะแพทยศาสตร์ มหาวิทยาลัยสงขลานครินทร์
เครือข่าย
สมาชิก · ติดตาม: 0 · ผู้ติดตาม: 16

อ่าน: 1033
ความเห็น: 0

ระเริงคิด ๑๘: ก้าวย่างทางเดิน ลืมเลือนคืนวัน ดั้นด้นไป [C]

ระเริงคิด จิตรวมศูนย์: ทดสอบความแตกต่างระหว่างข้อมูลระหว่างกลุ่ม

คราวนี้เรามาดูกันว่า หากเราตั้งสมมติฐานของการทดลองเอาไว้ว่า ค่าทั้งหมดคือค่า % จริง ค่าที่วัดได้จากเครื่องมือ A และค่าที่วัดได้จากเครื่องมือ B ต่างกันหรือไม่

 

เราอาจจะใช้การทดสอบ t ทำการทดสอบทีละคู่ ในที่นี้คือทำการทดสอบ ๓ ครั้งคือ ค่าจริงกับค่าที่วัดได้จากเครื่องมือ A ค่าจริงกับค่าที่วัดได้จากเครื่องมือ B และคู่สุดท้ายคือค่าี่วัดได้จากเครื่องมือ A และค่าที่วัดได้จากเครื่องมือ B

 

แต่การทำเช่นนี้ไม่เป็นที่นิยมเนื่องจากไม่ได้เป็นการเปรียบเทียบค่าพร้อม ๆ กันทีเดียวและต้องทำการทดสอบทีละคู่หากมีจำนวนคู่มากก็จะเสียเวลา วิธีที่นิยมใช้สำหรับการทดสอบที่มีจำนวนกลุ่มของการทดสอบมากกว่า ๒ กลุ่มคือวิธีการวิเคราะห์ความแปรปรวน (ANOVA)

 

แต่ทั้งนี้ทั้งนั้นก็ต้องตรวจสอบว่าข้อมูลของเรานั้นเป็นไปตามข้อตกลงเบื้องต้น (assumptions) ของการทดสอบ ANOVA

 

สมมติว่าข้อมูลทั้ง ๓ ชุดของเราเป็นไปตามข้อตกลงเบื้องต้นของการทดสอบ ANOVA นะครับ

 

ในการทดสอบ ANOVA นั้นโดยทั่วไปแล้วข้อมูลที่เราจะนำมาทดสอบนั้นจะต้องอยู๋ในรูปของ long form หรือสมมการของการทดสอบจะเป็น y ~ x

 

แต่ข้อมูลตัวอย่างของเราอยู๋ในรูป wide form คือข้อมูลแต่ละชุดจะแยกเก็บอยู่คนละตัวแปรกัน ดังนั้นเราต้องจัดการให้ข้อมูลของเราเปลี่ยนจา wide form ให้เป็น long form เสียก่อนที่จะทำการวิเคราะห์ด้วยวิธี ANOVA

 

การเปลี่ยนรูปข้อมูลจาก wide form เป็น long form หรือเปลี่ยนจาก long form เป็น wide form นั้นเรียกว่าการ reshape ข้อมูล ซึ่งในโปรแกรมวิเคราะห์ข้อมูลทางสถิติบางโปรแกรมมีฟังก์ชันที่ช่วยทำงานนี้ให้ เช่นโปรแกรม stata จะมีคำสั่ง reshape ให้ หรือ R ก็จะมีคำสั่ง reshape ใน package reshape2

 

ในที่นี้ผมจะใช้ฟังก์ชันใน R อย่างง่ายเพื่อจัดการให้ข้อมูลเปลี่ยนจาก wide form เป็น long form

 

หน้าตาข้อมูลของเราที่เป็น wide form

 

 

ข้อมูลของเราแยกเก็บคนละตัวแปรกัน

 

ผมใช้บรรทัดคำสั่งของ R ๓ บรรทัดคำสั่งสำหรับจัดการข้อมูลจาก wide form ให้อยู่ในรูป long form โดยเก็บข้อมูลที่เป็น long form ไว้ในกรอบข้อมูล data2

 

> data2 <- data.frame(rep(c(1,2,3), each=50))
> names(data2) <- "data_source"
> data2$abc <- c(data1$conc_sam,data1$toola,data1$toolb)

 

ในกรอบข้อมูล data2 ประกอบด้วยตัวแปร ๒ ตัวแปรคือ data_source คือข้อมูลที่ระบุว่าเป็นข้อมูลชุดไหน 1 แทนข้อมูล % จริงของสาร abc 2 แทนข้อมูลที่วัดได้จากเครื่องมือ A และ  3 แทนข้อมูลที่ได้จากการวัดด้วยเครื่องมือ B

 

ตัวแปรตัวที่สองคือ abc เป็นค่า % ของสาร abc จากทั้ง ๓ ชุดโดยเรียงลำดับจาก % จริงของสาร abc ค่าที่วัดได้จากเครื่องมือ A และค่าที่วัดได้จากเครื่องมือ B ตามลำดับ โดยมีข้อมูลแต่ละชุดจำนวน ๕๐ ข้อมูล

 

ข้อมูล ๑๐ ระเบียนแรกของกรอบข้อมูล data2

> head(data2,10)
   data_source abc
1            1  99
2            1  98
3            1  96
4            1  94
5            1  92
6            1  90
7            1  88
8            1  86
9            1  84
10           1  82

 

ข้อมูล ๑๐ ระเบียนสุดท้ายของกรอบข้อมูล data2

> tail(data2,10)
    data_source   abc
141           3 23.86
142           3 23.16
143           3 20.54
144           3 18.84
145           3 15.88
146           3 10.32
147           3  8.44
148           3  7.04
149           3  5.44
150           3  1.98

 

ฟังก์ชันสำหรับการทดสอบความแปรปรวนทางเดียว (โดยเฉพาะ) ใน R คือฟังก์ชัน oneway.test()

 

> oneway.test(data2$abc ~ data2$data_source, var.equal=T)

        One-way analysis of means

data:  data2$abc and data2$data_source
F = 0.0987, num df = 2, denom df = 147, p-value = 0.9061

 

การทดสอบความแปรปรวน (ANOVA) จะใช้ F-test ในการทดสอบ ดังนั้นผลที่ได้จากการทดสอบ oneway ANOVA จึงให้ค่า F statistic ออกมาและค่า p-value เป็นค่า p-value จากการทดสอบ F-test

 

หลายคนอาจจะไม่พอใจกับผลลัพธ์จากการใช้ฟังก์ชัน oneway.test() ก็ได้ เนื่องจากไม่แสดงค่า Sum of Squares หรือค่า Mean of Squares หรือค่า Residuals ออกมาให้

 

ในความเป็นจริงแล้วสิ่งที่เราต้องการก็คือค่า p-value ที่ได้จากการทดสอบเท่านั้น ส่วนค่าอื่น ๆ นั้นเราไม่ได้นำไปใช้ประโยชน์ เนื่องจาก ค่า SS หรือ MS นั้นจะนำไปสู่การคำนวณค่า F Statistic ซึ่งสิ่งเหล่านี้ฟังก์ชัน oneway.test() ได้ดำเนินการเบื้องหลังให้แล้ว และรายงานออกมาเป็นค่า F Statistic และค่า p-value จาก F-test ให้เลย

 

และค่า p-value จากการทดสอบ F-test นั้นบอกสิ่งที่เราต้องการอยู่แล้ว

 

เมื่อดูผลการทดสอบจากค่า p-value ของ F-test ก็จะสรุปได้ว่า ค่าเฉลี่ยของข้อมูลทั้ง ๓ ชุดไม่แตกต่างกัน หรือค่าเฉลี่ยนของข้อมูลทั้ง ๓ ชุดแตกต่างกันอย่างไม่มีนัยสำคัญทางสถิติ

 

หรือ

  • ค่าเฉลี่ยของข้อมูลที่วัดได้จากเครื่องมือ A ไม่ต่างจากค่าเฉลี่ยของ % จริงของสาร abc
  • ค่าเฉลี่ยของข้อมูลที่วัดได้จากเครื่องมือ B ไม่ต่างจากค่าเฉลี่ยของ % จริงของสาร abc
  • ค่าเฉลี่ยของข้อมูลที่วัดได้จากเครื่องมือ A ไม่ต่างจากค่าเฉลี่ยของข้อมูลที่วัดได้จากเครื่องมือ B

 

อิอิอิ

 

เราเอง

 

เพลง: Beautiful Day
ศิลปิน: U2

U2 performing Beautiful Day (C) 2000 Universal-Island Records Limited.

U2VEVO Channel, Youtube

 

หมวดหมู่บันทึก: เรื่องทั่วไป
สัญญาอนุญาต: ซีซี: แสดงที่มา-ไม่ใช้เพื่อการค้า-อนุญาตแบบเดียวกัน Cc-by-nc-sa
สร้าง: 15 ตุลาคม 2557 12:57 แก้ไข: 28 เมษายน 2563 17:18 [ แจ้งไม่เหมาะสม ]
ดอกไม้
สมาชิกที่ให้กำลังใจ: Ico24 คนธรรมดา, Ico24 ทดแทน, และ 2 คนอื่น.
สมาชิกที่ให้กำลังใจ
 
Facebook
Twitter
Google

บันทึกอื่นๆ

ความเห็น

ไม่มีความเห็น
คุณต้องทำการเข้าระบบก่อนแสดงความเห็น