พอร์ทัลปรับปรุงห้องน้ำ เคล็ดลับที่เป็นประโยชน์

การทดสอบของ Binet Simon คือ การตรวจวินิจฉัยระดับการพัฒนาจิต A

การทดสอบ Binet-Simon เป็นวิธีที่ใช้กันทั่วไปในการวัดระดับการพัฒนาความสามารถ

ประวัติการปรากฏตัว

พัฒนาขึ้นในปี ค.ศ. 1905 โดย A. Binet และ T. Simon ตามคำสั่งของกระทรวงศึกษาธิการของฝรั่งเศส โดยมีวัตถุประสงค์เพื่อส่งเด็กที่ยังไม่ได้รับการพัฒนาเพียงพอสำหรับการเรียนในโรงเรียนมวลชน ในขั้นต้น การทดสอบมี 30 ปัญหา ซึ่งได้รับการคัดเลือกตามระดับของความยากลำบากเพื่อให้ 75% ของเด็กในวัยใดวัยหนึ่งซึ่งมีพัฒนาการทางจิตที่ถือว่าเป็นเรื่องปกติสามารถแก้ปัญหาได้ จำนวนของปัญหาที่แก้ไขได้อย่างถูกต้องนั้นบ่งบอกถึงอายุจิตที่เรียกว่า

ทดสอบการปรับเปลี่ยน

การดัดแปลงที่มีชื่อเสียงที่สุดได้รับการพัฒนาโดย L. Termen จาก Stanford University (USA); การทดสอบ Stanford-Binet ที่เรียกว่าซึ่งเขาสร้างขึ้นเป็นวิธีที่ได้รับการยอมรับมากที่สุดสำหรับการวินิจฉัยความฉลาด ความฉลาดทางสติปัญญาคำนวณจากพื้นฐานของมัน อย่างไรก็ตาม การใช้งานจริงของการทดสอบนี้ เหมือนกับส่วนใหญ่

เทคนิคดังกล่าวช่วยให้คุณวัดความแตกต่างของความสามารถทางจิตของแต่ละบุคคลโดยไม่ต้องเปิดเผยธรรมชาติและโอกาสในการพัฒนา ทำให้ยากต่อการใช้ผลการทดสอบในการวินิจฉัยทางจิตวิทยาและทำนายพัฒนาการทางสติปัญญา

  • Stanford-Binet Intelligence Scale เป็นมาตราส่วนสำหรับการประเมินความฉลาด พัฒนาขึ้นในปี 1916 การทดสอบใช้ตัวบ่งชี้ระดับสติปัญญาเพียงตัวเดียว - IQ IQ เท่ากับผลหารของอายุจิตของอาสาสมัครและอายุจริงของเขา คูณด้วย 100 อายุทั้งสองมีหน่วยเป็นเดือน

    ปัจจุบัน มาตราส่วน Stanford-Binet ถูกใช้เป็นหลักในประเทศตะวันตกเพื่อประเมินความพร้อมของโรงเรียน การกระจายตัวของนักเรียนไปยังโรงเรียนในระดับต่างๆ และเมื่อเข้าสู่มหาวิทยาลัย

แนวคิดที่เกี่ยวข้อง

การนับตาม Kraepelin เป็นวิธีการวิจัยทางพยาธิวิทยา ใช้สำหรับการประเมินประสิทธิภาพ การออกกำลังกาย และความเหนื่อยล้าในเชิงคุณภาพและเชิงปริมาณ วิธีนี้ใช้ในคลินิก สถานศึกษา และจิตเวชศาสตร์ระดับมืออาชีพ โดยเริ่มตั้งแต่วัยรุ่น เสนอโดยจิตแพทย์ชาวเยอรมัน Emil Kraepelin ในปี 1895 เริ่มแรกเทคนิคนี้เป็นตารางในคอลัมน์ขนาดใหญ่ที่มีการเขียนตัวเลขหลักเดียวแบบยาวซึ่งต้องรวมไว้ในหัว ในการปรับเปลี่ยน ...

ลาดพร้าว สกาลา - แลดเดอร์] เป็นการทดสอบสติปัญญาที่ออกแบบมาเพื่อวัดระดับการพัฒนาจิตใจ ตัวเลือกแรก S.-B. ที่. ร. ซ. ได้รับการพัฒนาโดย L.M. Termen ในปี 1916 และเป็นการดัดแปลงระดับการพัฒนาทางจิต Binet-Simon ในระหว่างการพัฒนา มีการเปลี่ยนแปลงจำนวนมากในวิธีการพื้นฐาน เมื่อเทียบกับมาตราส่วน Binet งานใหม่มากกว่าหนึ่งในสามถูกเพิ่มเข้ามา มีงานเก่าจำนวนหนึ่งที่ถูกทำซ้ำ หรือละทิ้งหรือเปลี่ยนเส้นทางไปยังกลุ่มอายุอื่น อันที่จริงแล้ว S.-B. รุ่นแรกแล้ว ที่. ร. ซ. เป็นการทดสอบใหม่ ในอนาคต การทดสอบได้รับการปรับปรุงอย่างมากหลายครั้ง ส.-บ. ที่. ร. ซ. รวมถึงการมอบหมายงานที่มุ่งสำรวจความสามารถที่หลากหลาย - ตั้งแต่การจัดการอย่างง่ายไปจนถึงการให้เหตุผลเชิงนามธรรม ในระดับอายุต้น การทดสอบส่วนใหญ่ต้องการการประสานมือและตา ความแตกต่างของการรับรู้ ความสามารถในการเข้าใจคำสั่ง (ในงานต่างๆ เช่น การพับลูกบาศก์ การร้อยลูกปัด การเลือกรูปทรงเรขาคณิต) ตลอดจนความสามารถในการจดจำวัตถุที่นำเสนอในรูปแบบของ โมเดลของเล่นหรือรูปภาพบนการ์ด ในระดับอายุสูงสุด การทดสอบที่ใช้เนื้อหาด้วยวาจาของงานจะถูกนำเสนอมากที่สุด ในหมู่พวกเขาการทดสอบคำศัพท์ (คำอธิบายความหมายของคำ) การเปรียบเทียบความสมบูรณ์ของประโยคคำจำกัดความของแนวคิดนามธรรมการตีความสุภาษิต การทดสอบบางอย่างมุ่งเป้าไปที่การกำหนดลักษณะของระดับความคล่องแคล่วและความคล่องแคล่วในการพูด (การตั้งชื่อคำที่ไม่เกี่ยวข้องอย่างรวดเร็ว การเลือกบทกวี การสร้างประโยคด้วยคำที่กำหนด) ในบรรดางานของแบตเตอรี่ การทดสอบความตระหนักทั่วไป ความรู้เกี่ยวกับบรรทัดฐานของชีวิตทางสังคม กฎของพฤติกรรม (การตอบคำถาม การตีความสถานการณ์ การตรวจจับความไม่สอดคล้องกันในภาพพล็อตหรือเรื่องราว) มาตราส่วนประกอบด้วยการทดสอบหน่วยความจำ การวางแนวเชิงพื้นที่ (การสร้างภาพจำลอง เขาวงกต การพับและตัดวัตถุกระดาษ ฯลฯ) ในระดับอายุที่สูงขึ้นจะมีการวิเคราะห์ระดับการดูดซึมของทักษะบางอย่างที่ได้รับจากโรงเรียน (ความสามารถในการอ่าน ความรู้เกี่ยวกับเลขคณิต) เมื่อตรวจสอบโดยใช้การทดสอบจำนวนหนึ่ง วิธีการช่วยให้สามารถรับข้อมูลเชิงคุณภาพในวงกว้างเกี่ยวกับวิธีการทำงานของผู้สอบ แนวทางในการแก้ปัญหา นอกจากนี้ยังมีโอกาสที่ดีในการสังเกตคุณสมบัติส่วนบุคคล: ระดับของกิจกรรมและแรงจูงใจ ความมั่นใจ ความอุตสาหะ สมาธิ ฯลฯ ขั้นตอนที่ซับซ้อนสำหรับการสำรวจและตีความผลลัพธ์ที่ได้รับ ความจำเป็นในการปฏิบัติตามมาตรฐานอย่างเคร่งครัดต้องมีคุณสมบัติและความรู้เบื้องต้นในระดับสูง การฝึกอบรมของผู้ทดลอง ตามส.-บ. ที่. ร. ซ. ประสบการณ์มากมายรวมทั้งหลักฐานและการตีความ ในแง่ของความกว้างในการใช้งาน เทคนิคนี้เป็นหนึ่งในสถานที่ชั้นนำในการทดสอบความฉลาดทางจิตวิทยาต่างประเทศ ระยะเวลาการใช้งานและความกว้างของการกระจายทำให้ระบบอ้างอิงของ S.-B. ที่. ร. ซ. มาตรฐานสำหรับการทดสอบไซโครเมทริกอื่นๆ การกระจายผลลัพธ์ของตัวบ่งชี้ไอคิวของเครื่องชั่ง Stanford-Binet เป็นพื้นฐานสำหรับการจำแนกระดับของความบกพร่องทางสติปัญญาซึ่งแพร่หลายในจิตวิเคราะห์ต่างประเทศ LF Burlach K. , S. M. Morozov

การทดสอบ Binet-Simon - เครื่องมือสำหรับวินิจฉัยการพัฒนาของหน่วยสืบราชการลับ เสนอในปี 1905 A. Binetและ ต. ไซม่อน.

ในตอนแรก การทดสอบประกอบด้วยงานทางวาจา การรับรู้ และการบิดเบือนจำนวน 30 งาน ซึ่งจัดเรียงตามเกณฑ์ของความยากที่เพิ่มขึ้นในกลุ่มอายุที่สอดคล้องกัน: งานแต่ละงานของกลุ่มอายุที่กำหนดจะต้องได้รับการแก้ไขโดย 75% ของเด็กในวัยนี้ ด้วยพัฒนาการทางปัญญาตามปกติ ตามจำนวนงานที่เด็กแก้ไขได้อย่างถูกต้องกำหนดอายุจิตของเขา แนวคิด " แห่งวัยจิต "ถูกใช้โดย A. Binet และ T. Simon ในปี 1908 เป็นตัวบ่งชี้เชิงปริมาณของการพัฒนาสติปัญญา นี่เป็นลักษณะของการพัฒนาทางปัญญาของแต่ละบุคคลโดยพิจารณาจากการเปรียบเทียบกับระดับความฉลาดของคนอื่นในวัยเดียวกัน โดยจะแสดงในเชิงปริมาณตามอายุที่ - ตามข้อมูลสถิติโดยเฉลี่ย - งานทดสอบที่มีให้สำหรับบุคคลที่กำหนดจะได้รับการแก้ไข ตาม Binet ระดับนี้ไม่ได้ขึ้นอยู่กับการฝึกอบรม แต่ถูกกำหนดโดยปัจจัยทางพันธุกรรมเท่านั้น

มาตราส่วนรุ่นที่สองคือปี 1908 มีความสัมพันธ์กับอายุตั้งแต่ 3 ปีจนถึงวัยผู้ใหญ่ และรุ่นที่สามคือปี 1911 ได้รับการแก้ไขและเพิ่มเติมเล็กน้อย

การทดสอบเวคสเลอร์ การทดสอบที่ได้รับความนิยมมากที่สุดสำหรับการวินิจฉัยความฉลาดในประเทศของเราคือการทดสอบของ D. Weksler (1939) Wechsler ละทิ้งแนวคิดเรื่องความฉลาดว่าเป็น "ยุคทางจิต" ซึ่งได้รับการแนะนำโดย A. Binet ผู้สร้างการทดสอบความสามารถทางจิตครั้งแรก เวคเลอร์เองได้นิยามความฉลาดว่าเป็นความสามารถระดับโลกที่ซับซ้อนของแต่ละบุคคลในการปฏิบัติตนอย่างมีจุดมุ่งหมาย คิดอย่างมีเหตุผลและโต้ตอบกับสภาพแวดล้อมภายนอกได้สำเร็จ

Veksler ระบุสององค์ประกอบในหน่วยสืบราชการลับ เช่นเดียวกับสองทรงกลมของการสำแดง: ความฉลาดทางวาจา และ ความฉลาดของการกระทำ ... Veksler แนะนำว่านอกจากความฉลาดทั่วไปแล้วยังมี วาจาและ ไม่ใช่คำพูดปัญญาที่ควรวัดด้วย

Veksler นำเสนอแนวคิดของ "บรรทัดฐานอายุ" ผู้รับการทดสอบได้รับคะแนนการทดสอบโดยพิจารณาจากการเปรียบเทียบผลลัพธ์กับผลเฉลี่ยของกลุ่มอายุที่เขาสังกัด IQ แสดงเป็นหน่วยของค่าเบี่ยงเบนมาตรฐาน

การทดสอบนี้มีวัตถุประสงค์เพื่อตรวจร่างกายผู้ป่วยในคลินิกจิตเวชอย่างครอบคลุม วัตถุประสงค์หลักของการทดสอบคือเพื่อวินิจฉัยความผิดปกติทางจิตในโรคต่างๆ (โรคจิต โรคประสาท ฯลฯ) ตลอดจนเพื่อกำหนดระดับของความบกพร่องทางสติปัญญาในผู้ที่มีพัฒนาการทางสติปัญญาแต่กำเนิดและภาวะสมองเสื่อมในวัยชรา

การทดสอบ Wechsler ทันทีหลังจากการปรากฏตัวของมันเริ่มถูกนำมาใช้กันอย่างแพร่หลายนอกคลินิก: สำหรับการคัดเลือกอย่างมืออาชีพสำหรับการประเมินระดับความฉลาดของ "ปกติ" นั่นคือผู้ใหญ่ที่มีสุขภาพจิตดีและเด็กและแม้กระทั่งสำหรับการประเมินระดับความสามารถทางปัญญา

เวอร์ชันของการทดสอบของ D. Weksler สำหรับผู้ใหญ่ประกอบด้วยการทดสอบย่อย 11 เวอร์ชัน เวอร์ชันสำหรับเด็ก - จาก 12 เวอร์ชัน เวอร์ชันทั้งหมดมี 2 ระดับ: ขนาดการกระทำและ ขนาดคำพูด... Veksler เชื่อว่าผลรวมของคะแนนที่ได้รับสำหรับรายการทดสอบทั้งหมดมีลักษณะเฉพาะ ทั่วไปสติปัญญา และผลรวมของแต่ละตาชั่งคือ ไม่ใช่คำพูดและ วาจาสติปัญญา

การทดสอบย่อย: 1)ความตระหนัก 2) ความเข้าใจ 3) เลขคณิต 4) ความคล้ายคลึงกัน 5) คำศัพท์ 6) การท่องจำตัวเลข 7) รายละเอียดที่ขาดหายไป 8) รูปภาพต่อเนื่อง 9) Cubes of Koos 10) การเพิ่มตัวเลข 11) การเข้ารหัส 12 ) เขาวงกต

ดังนั้น การทดสอบจึงต้องวัดความสามารถสามอย่าง อย่างไรก็ตาม การวิเคราะห์ปัจจัยผลการทดสอบโดยใช้แบบทดสอบ "ผู้ใหญ่" พบว่าการทดสอบวัดความสามารถจริง 4 ประการ ได้แก่ 1) ความฉลาดทั่วไป 2) ความเข้าใจด้วยวาจา 3) การรับรู้ขององค์กร 4) ความสามารถที่ส่งผลต่อการปฏิบัติงานของ การทดสอบย่อย "การท่องจำตัวเลข", "เลขคณิต", "การเข้ารหัส"

การทดสอบ "ภาพต่อเนื่อง" ซึ่งผู้เข้าร่วมต้องจัดเรียง "เรื่องการ์ตูน" นั้นถือว่ายาก: ความสำเร็จของการดำเนินการขึ้นอยู่กับทั้งการรับรู้และความเข้าใจด้วยวาจา

การทดสอบย่อยแต่ละครั้งต้องใช้ชุดของความสามารถ ดังนั้นควรวิเคราะห์ขั้นตอนการทดสอบย่อยแต่ละรายการอย่างละเอียด การวิเคราะห์โปรไฟล์มีความสำคัญอย่างยิ่ง โดยเฉพาะอย่างยิ่ง อัตราส่วนของความสำเร็จของการทดสอบย่อย การประเมินระดับความกระจัดกระจายของผลลัพธ์ที่สัมพันธ์กับระดับเฉลี่ยของแต่ละบุคคล (ระดับของ "ฟันเลื่อย" ของโปรไฟล์) เป็นต้น ดัชนีเพิ่มเติมแต่ละรายการมีความสำคัญ ค่าการวินิจฉัย.

เมทริกซ์โปรเกรสซีฟของ Raven - ชุดทดสอบที่พัฒนาโดยนักจิตวิทยาชาวอังกฤษ J. Raven ในปี 1938 เพื่อวินิจฉัยระดับสติปัญญา โดยอิงจากงานของการคิดด้วยภาพโดยการเปรียบเทียบ มี 2 ​​ตัวเลือก: 1) สำหรับผู้ใหญ่และวัยรุ่นอายุ 12 ปี และ 2) สำหรับเด็กอายุ 5-11 ปี

งานของการทดสอบแต่ละอย่างคือการแทนที่ช่องว่างที่มุมล่างขวาของรูปแบบหลัก ("เมทริกซ์") ซึ่งเป็นรูปแบบเรขาคณิต ในเวลาที่จำกัดสำหรับการทดสอบทั้งหมด ให้แทรกชิ้นส่วน 6 หรือ 8 ชิ้นใต้ส่วนหลัก ลวดลาย. การทดสอบมี 5 ชุด แต่ละชุดมี 12 เมทริกซ์ โดยการเพิ่มหมายเลขซีเรียล ความยากของงานจะเพิ่มขึ้น

เทคนิคของ Raven เป็นหนึ่งในเทคนิคที่ทรงพลังที่สุดสำหรับการศึกษาความฉลาดทางอวัจนภาษาของมนุษย์ ออกแบบมาเพื่อกำหนดระดับของการพัฒนาความคิดเชิงตรรกะของบุคคลการพัฒนาความสามารถในการระบุรูปแบบและสร้างวัตถุใหม่ตามพวกเขา

แบบทดสอบโครงสร้างความฉลาดของ Amtauer ... การทดสอบโครงสร้างทางปัญญาได้รับการพัฒนาโดย R. Amtauer ในปี 1953 เพื่อแยกความแตกต่างของผู้สมัครสำหรับการฝึกอบรมประเภทต่างๆ และกิจกรรมในการฝึกคัดเลือกมืออาชีพ

ความสนใจที่เพิ่มขึ้นของนักจิตวิทยาชาวรัสเซียในการทดสอบนี้อธิบายได้จากข้อดีหลายประการที่แยกแยะความแตกต่างจากวิธีการวิจัยความฉลาดของ Veksler, Raven และอื่น ๆ ที่เป็นที่รู้จักกันดี

ประการแรก การทดสอบโครงสร้างข่าวกรองของ Amtauer ไม่เหมาะสำหรับบุคคลเท่านั้น แต่ยังเหมาะสำหรับการวิจัยจำนวนมากด้วย ซึ่งมีความสำคัญอย่างยิ่งในบริบทของการตรวจสอบกลุ่มใหญ่ที่มีจิตวินิจฉัยในจำนวนจำกัด

ในเวลาเดียวกัน การทดสอบที่ระบุมีมาตราส่วนสำหรับการคำนวณคะแนนใหม่เป็นหน่วย IQ ปกติของการทดสอบ Wechsler ซึ่งทำให้สามารถเปรียบเทียบผลลัพธ์ที่ได้จากตัวอย่างที่คล้ายกันโดยใช้การทดสอบ Wechsler

การทดสอบโครงสร้างข่าวกรองรวบรวมโดย R. Amtauer ใน สามตัวเลือกซึ่งสองอย่างนี้เทียบเท่าและใช้ได้กับกลุ่มตัวอย่างของผู้ที่มีประสบการณ์ด้านอาชีพและชีวิตต่างกัน แบบทดสอบประกอบด้วยงาน 9 กลุ่ม (แบบทดสอบย่อย) เน้นศึกษาองค์ประกอบดังกล่าวของความฉลาดทางวาจาและอวัจนภาษา ได้แก่ คำศัพท์ ความสามารถในการสรุป ความสามารถในการสรุป ความสามารถทางคณิตศาสตร์ การคิดเชิงผสม เชิงพื้นที่ จินตนาการความสามารถในการท่องจำข้อมูลเชิงภาพในระยะสั้น

เมื่อกำหนดมาตรฐานตัวชี้วัดมาตรฐานเขาปฏิบัติตามเกณฑ์อายุ

การทดสอบย่อย:

1 - รวมงานที่เน้นการศึกษาคำศัพท์ของวิชา ("ความรู้สึกของภาษา" ตาม Amtauer)

2 - ความสามารถในการเป็นนามธรรม

3 - ความสามารถในการตัดสินและการอนุมาน

4 - ความสามารถในการสรุป

5 - ความสามารถทางคณิตศาสตร์

6 - ความสามารถทางคณิตศาสตร์ ("แถวของตัวเลข")

7 - การคิดแบบผสมผสาน ("รูปทรงเรขาคณิต")

8 - จินตนาการเชิงพื้นที่ ("Koos cubes")

9 - ความสามารถในการจดจำและทำซ้ำข้อมูลภาพ

Wechsler: มาตราส่วนสำหรับวัดระดับการพัฒนาทางปัญญา (WISC เวอร์ชันสำหรับเด็ก, WAIS เวอร์ชันสำหรับผู้ใหญ่) ประกอบด้วย 11 บทย่อยที่ประกอบขึ้นเป็นเกล็ดทางวาจา (1-6) และอนันต์ (7-11):

1) ความรู้ทั่วไป- ระดับความรู้ง่ายๆ

2) เข้าใจความหมายของนิพจน์- ความสามารถในการตัดสิน

3) เลขคณิต- ง่ายต่อการจัดการวัสดุที่เป็นตัวเลข

4) ค้นหาความคล้ายคลึงกัน- การคิดเชิงมโนทัศน์

5) ท่องจำตัวเลข- หน่วยความจำ

6) คำศัพท์- ประสบการณ์ทางวาจา ความสามารถในการกำหนดแนวคิด

7) การเข้ารหัส / ตัวเลข- ความเร็วของภาพมอเตอร์

8) ขาดรายละเอียด / เติมรูปภาพ- การสังเกตด้วยสายตา ความสามารถในการระบุสัญญาณที่จำเป็น

9) การก่อสร้างบล็อก- การประสานงานของมอเตอร์, การสังเคราะห์ภาพ

10) ภาพต่อเนื่อง- ความสามารถในการจัดระเบียบทั้งหมดจากส่วนต่าง ๆ เข้าใจสถานการณ์การอนุมาน

11) หุ่นพับ- ความสามารถในการสังเคราะห์ทั้งหมด

กำหนดโดย IQ-verbal, IQ-non-verbal, IQ-general

บรรทัดฐาน: 130 ขึ้นไป - สติปัญญาสูงมาก, 120-129 - สติปัญญาสูง, 110-119 - เป็นบรรทัดฐานที่ดี, 90-109 - ระดับเฉลี่ย, 80-89 - บรรทัดฐานที่ลดลง, 70-79 - ระดับแนวเขต, 69 และ ด้านล่าง - ข้อบกพร่องทางจิต ...

เท่ากัน: เมทริกซ์โปรเกรสซีฟ การวัดความฉลาดผ่านการระบุความสัมพันธ์ระหว่างตัวเลขที่เป็นนามธรรม มีสองตัวเลือก: สี (ง่ายกว่าสำหรับเด็กอายุ 5-11 ปีและผู้ใหญ่หลัง 65 ปี) - 12 เมทริกซ์ 3 ซีรีส์และขาวดำ - 60 เมทริกซ์ (องค์ประกอบ) สำหรับ 5 ซีรีส์; IQ มาตรฐานแสดงอัตราส่วนของผลลัพธ์ของบุคคลที่กำหนดต่อมูลค่าของการกระจายผลลัพธ์สำหรับอายุของเขา

Amtauer วัดความฉลาดในคนอายุ 13-61 ปี พัฒนาเป็นแบบทดสอบวินิจฉัยความถนัดทั่วไป ประกอบด้วยการทดสอบย่อย 9 รายการ:

1) การเลือกตรรกะ- การคิดแบบอุปนัย ความรู้สึกของภาษา

2) การกำหนดคุณสมบัติทั่วไป- ความสามารถในการเป็นนามธรรม ดำเนินการด้วยแนวคิดทางวาจา

3) ความคล้ายคลึง- ความสามารถผสมผสาน

4) การจำแนกประเภท- ความสามารถในการตัดสิน

5) ตรวจสอบ- ระดับการคิดเชิงคณิตศาสตร์เชิงปฏิบัติ

6) แถวของตัวเลข- การคิดแบบอุปนัย ความสามารถในการทำงานกับกฎทางคณิตศาสตร์

7) การเลือกตัวเลข- จินตนาการเชิงพื้นที่ ความสามารถผสมผสาน

8) ลูกบาศก์- การคิดเชิงพื้นที่

9) การท่องจำคำศัพท์- ความสามารถในการมีสมาธิความจำ

คะแนนจะถูกคำนวณสำหรับการทดสอบย่อยแต่ละครั้ง คะแนนจะถูกแปลงเป็นเกรดตามมาตราส่วน โปรไฟล์จะถูกวาดขึ้นซึ่งกำหนดความสามารถสำหรับกิจกรรมภาคปฏิบัติหรือเชิงทฤษฎี

Binet-Simon: มาตราส่วนการพัฒนาจิต เดิมที (พ.ศ. 2448) มีการทดสอบ 30 ชุดที่จัดเรียงตามความยากที่เพิ่มขึ้นในลักษณะที่ความน่าจะเป็นที่จะสำเร็จลุล่วงเพิ่มขึ้นตามอายุตามลำดับเวลา ระดับความยากถูกกำหนดโดยสังเกตจากข้อมูลในกลุ่มตัวอย่างเด็กปกติอายุ 3-11 ปี จำนวน 50 คน และผู้ป่วยทางจิตจำนวนไม่มีนัยสำคัญ ฉบับต่อไป (1908) ทำให้สามารถแยกแยะระดับต่างๆ ของพัฒนาการทางปัญญาของเด็กปกติได้ (ระดับ = "อายุทางจิต") รุ่นที่สาม (1911) ขยายมาตราส่วนไปถึงระดับผู้ใหญ่ แต่ยังไม่ได้ให้คำจำกัดความของไอคิว จากนั้นแปลงเป็นมาตราส่วน Stanford-Binet โดยที่ IQ ถูกป้อน:

อายุจิต

การแก้ไขในปัจจุบันของมาตราส่วนที่เป็นที่ยอมรับนี้เป็นผลจากการแก้ไขที่กว้างขวางที่สุด (Delaney, & Hopkins, 1987; Thorndike, Hagen, & Sattler, 1986a, 1986b) ในขณะที่ยังคงรักษาข้อได้เปรียบหลักของรุ่นก่อนหน้าในฐานะเครื่องมือทางคลินิกที่ใช้เฉพาะบุคคล เวอร์ชันนี้สะท้อนถึงการพัฒนาแนวคิดทั้งทางทฤษฎีของการทำงานทางปัญญาและวิธีการของการออกแบบการทดสอบ ความต่อเนื่องของการแก้ไขก่อนหน้านั้นรับประกันได้ส่วนหนึ่งโดยคงไว้ซึ่งงานหลายประเภทจากแบบฟอร์มก่อนหน้านี้ ที่สำคัญกว่านั้น เราสามารถรักษาขั้นตอนการทดสอบแบบปรับตัวได้ ต้องขอบคุณผู้สอบแต่ละคนที่ได้รับเฉพาะงานที่มีความยากสอดคล้องกับระดับประสิทธิภาพที่แสดงไว้เท่านั้น

ในเวลาเดียวกัน ขอบเขตของเนื้อหาก็ขยายออกไปอย่างมากเมื่อเปรียบเทียบกับการเน้นทางวาจาเป็นหลักในรูปแบบแรกเริ่ม เพื่อให้ครอบคลุมงานเกี่ยวกับการทำงานของตัวเลข ความสัมพันธ์เชิงพื้นที่ และข้อมูลของหน่วยความจำระยะสั้นที่เป็นตัวแทนมากขึ้น นอกจากนี้ มีการใช้งานแต่ละประเภทในช่วงอายุที่กว้างที่สุดเท่าที่จะเป็นไปได้ ซึ่งจะทำให้สามารถเปรียบเทียบเกรดในระดับอายุต่างๆ กันได้เกือบสมบูรณ์ มาตราส่วน Stanford-Binet ฉบับที่สี่มีไว้สำหรับใช้ในช่วงอายุตั้งแต่สองปีจนถึงวัยผู้ใหญ่

การทดสอบและการให้คะแนนชุดวัสดุทั่วไปที่จำเป็นสำหรับการทดสอบ Stanford-Binet แสดงไว้ในรูปที่ 8-1. ประกอบด้วยสมุดการ์ดที่พิมพ์แล้วสี่เล่มพร้อมภาพการทดสอบซึ่งเปลี่ยนโดยการพลิกหน้า เนื้อหาของการทดสอบ ได้แก่ ลูกบาศก์ กระดานรูปทรง (เรขาคณิต) ชุดลูกปัดที่มีสีและรูปร่างต่างกัน รวมถึงรูปภาพขนาดใหญ่ที่แสดงตุ๊กตาที่แยกไม่ออกตามเพศและเชื้อชาติ สมุดบันทึกโปรโตคอล สำหรับบันทึกการตอบสนองและคำแนะนำเกี่ยวกับวิธีการจัดการการทดสอบและประเมินผล

เช่นเดียวกับการทดสอบปัญญาส่วนบุคคลส่วนใหญ่ มาตราส่วน Stanford-Binet กำหนดให้เฉพาะผู้เชี่ยวชาญที่มีคุณสมบัติสูงเท่านั้นที่ใช้งานได้ การฝึกอบรมพิเศษและประสบการณ์เกี่ยวกับมาตราส่วนนี้เป็นสิ่งที่ขาดไม่ได้สำหรับการแก้ไข



ตอนที่ 3การทดสอบความสามารถ

ข้าว. 8-1. วัสดุที่ใช้ในการทดสอบด้วย Stanford-Binet IQ Scale (ฉบับที่ 4)

(ลิขสิทธิ์ © 1986 โดย Riverside Publishing Company. ทำซ้ำโดยได้รับอนุญาตจากผู้จัดพิมพ์)

การปฏิบัติที่ถูกต้อง การให้คะแนน และการตีความผลการทดสอบ ความไม่แน่นอนและความเกียจคร้านอาจเป็นอันตรายต่อสายสัมพันธ์ โดยเฉพาะอย่างยิ่งกับเด็กเล็ก การเปลี่ยนแปลงเล็กน้อยในการใช้ถ้อยคำด้วยวาจาที่ทำขึ้นโดยไม่ได้ตั้งใจ สามารถเปลี่ยนความยากของงานได้ ปัญหาเพิ่มเติมเกิดขึ้นจากความจริงที่ว่างานจะต้องได้รับการประเมินทันทีหลังจากเสร็จสิ้นเนื่องจากการทดสอบที่ตามมาขึ้นอยู่กับว่าอาสาสมัครจัดการกับงานในระดับก่อนหน้าอย่างไร

เป็นเวลาหลายทศวรรษที่แพทย์ได้ปฏิบัติกับ Stanford-Binet และเครื่องชั่งส่วนบุคคลที่คล้ายคลึงกัน ไม่เพียงแต่เป็นชุดของการทดสอบที่ได้มาตรฐานเท่านั้น แต่ยังรวมถึงการสัมภาษณ์ทางคลินิกด้วย คุณลักษณะเดียวกันที่ทำให้ยากต่อการใช้เครื่องชั่งดังกล่าว สร้างโอกาสที่ดีสำหรับการมีปฏิสัมพันธ์ระหว่างผู้วินิจฉัยและผู้ป่วย และช่วยให้แพทย์ผู้มีประสบการณ์สามารถระบุข้อมูลที่เขาต้องการสำหรับการวินิจฉัย มาตราส่วน Stanford-Binet และการทดสอบอื่นๆ ที่อธิบายไว้ในบทนี้ทำให้คุณสามารถสังเกตวิธีการทำงานของผู้ตอบ แนวทางการแก้ปัญหา และแง่มุมเชิงคุณภาพอื่นๆ ของการปฏิบัติงาน ผู้ทดสอบยังมีความสามารถในการประเมินลักษณะทางอารมณ์และแรงจูงใจบางอย่างของผู้สอบ เช่น สมาธิ ระดับกิจกรรม ความมั่นใจในตนเอง และความพากเพียร แน่นอนว่า การสังเกตเชิงคุณภาพใดๆ ที่เกิดขึ้นในขณะทำการทดสอบแต่ละครั้งจะต้องได้รับการบันทึกอย่างแม่นยำเป็นการสังเกต และไม่ตีความในลักษณะเดียวกับตัวบ่งชี้การทดสอบตามวัตถุประสงค์ คุณค่าของการสังเกตคุณภาพดังกล่าวขึ้นอยู่กับทักษะ ประสบการณ์ และสัญชาตญาณทางจิตวิทยาของผู้ทดสอบ ตลอดจนความรู้เกี่ยวกับหลุมพรางและข้อจำกัดที่มีอยู่ในการสังเกตประเภทนี้

บทที่ 8ความสามารถส่วนบุคคล

ข้าว. 8-2. ช่วงอายุ 15 Stanford-Binet Test Scale (ฉบับที่สี่) หมายเหตุเกี่ยวกับพื้นที่สีเทา สำหรับการทดสอบเก้ารายการที่มีช่วงอายุจำกัด สมาชิกบางคนในกลุ่มตัวอย่างมาตรฐานที่อยู่นอกขอบเขตยังคงนำเสนอการทดสอบใดๆ เหล่านี้ เนื่องจากคะแนนสูงหรือต่ำผิดปกติบนเส้นทางการทดสอบ ประสิทธิภาพของพวกเขาถูกนำมาพิจารณาเมื่อประเมินผลลัพธ์ของกลุ่มตัวอย่างอายุที่เกี่ยวข้องทั้งหมดสำหรับการรวบรวมตารางเชิงบรรทัดฐาน แต่การประมาณการเหล่านี้ถูกรวมไว้ด้วยความระมัดระวังเป็นพิเศษเกี่ยวกับการใช้งาน ดูรายละเอียดได้ที่ แนะนำ(Thorndike et al., 1986a, p. 7) และ คู่มือทางเทคนิค(Thorndike et al., 1986b, p. 30)

(ให้ความเรียบง่ายจากมาตราส่วนข่าวกรองของ Stanford-Binet: ฉบับที่สี่ คู่มือการบริหารและการให้คะแนน หน้า 7. ลิขสิทธิ์© พ.ศ. 2529 โดยสำนักพิมพ์ริเวอร์ไซด์ - ทำซ้ำโดยได้รับอนุญาตจากสำนักพิมพ์)

ตรงกันข้ามกับหลักอายุของงานการจัดกลุ่มที่ใช้ในรุ่นก่อนหน้าของมาตราส่วนใน SB-Wงานแต่ละประเภทจะถูกจัดวางในการทดสอบแยกกันตามลำดับความยากที่เพิ่มขึ้น มาตราส่วนประกอบด้วยการทดสอบ 15 แบบ ซึ่งคัดเลือกมาเพื่อเป็นตัวแทนของโดเมนความรู้ความเข้าใจหลักสี่โดเมน: พฤติกรรมทางเชื้อชาติทางวาจา การให้เหตุผลเชิงนามธรรม/ด้วยภาพ การให้เหตุผลเชิงปริมาณ และความจำระยะสั้น (ดูรูปที่ 8-2) การทดสอบทั้ง 15 รายการนี้ แม้จะจัดกลุ่มเป็นสี่หมวดหมู่เพื่อจุดประสงค์ในการคำนวณเมตริก แต่ดำเนินการตามลำดับแบบผสมเพื่อรักษาความสนใจและความสนใจของผู้สอบ ช่วงความยากของเกรดหกระดับนี้ครอบคลุมช่วงอายุทั้งหมดของมาตราส่วน เอสบี-IVอย่างที่เห็นใน

ตอนที่ 3การทดสอบความสามารถ

ข้าว. 8-2 การทดสอบที่เหลืออีกเก้ารายการ เนื่องจากลักษณะของงานที่มีอยู่ อาจเริ่มนำเสนอในภายหลัง หรือหยุดนำเสนอเร็วกว่าขีดจำกัดอายุที่เกี่ยวข้อง

ดำเนินการ SB-IVเป็นกระบวนการสองขั้นตอน ขั้นแรกผู้ทดสอบให้แบบทดสอบคำศัพท์ซึ่งทำหน้าที่เลือกเส้นทางของการสอบโดยกำหนด ระดับเริ่มต้นสำหรับการทดสอบอื่นๆ ทั้งหมด จะเริ่มงานอะไร การทดสอบคำศัพท์ขึ้นอยู่กับอายุของผู้สอบเท่านั้น สำหรับการทดสอบที่เหลือ ระดับเริ่มต้นจะถูกกำหนดโดยโนโมแกรม (หรือตาราง) ตามการทดสอบคำศัพท์และอายุตามลำดับเวลา ในขั้นตอนที่สองของการทดสอบ ผู้เชี่ยวชาญที่ดำเนินการควรจัดตั้ง ฐานและ ระดับเพดานสำหรับการทดสอบแต่ละครั้งโดยพิจารณาจากผลการทดสอบจริงของแต่ละคน ถึงระดับฐานเมื่อวัตถุจัดการกับงานสี่งานในสองระดับที่อยู่ติดกัน ถึงระดับสูงสุดเมื่องานสามในสี่ (หรืองานทั้งสี่) ในสองระดับที่อยู่ติดกันไม่ได้ทำโดยหัวเรื่อง เมื่อถึงระดับขีดจำกัดสำหรับการทดสอบเฉพาะ จะไม่มีใช้ในการทดสอบเพิ่มเติมของเรื่อง

เมื่อมีการนำเสนองานและได้รับการตอบสนองของผู้ตอบต่องานนั้น ผู้สอบจะเข้าสู่การประเมินในสมุดบันทึกเพื่อบันทึกคำตอบ การประเมินเบื้องต้น ("คะแนนดิบ") สำหรับการทดสอบแต่ละครั้งจะพบโดยการกำหนดจำนวนงานที่มีระดับสูงสุดของทั้งหมดที่นำเสนอในหัวข้อและลบจำนวนงานทั้งหมดที่เขาทำไม่ถูกต้องออกจากจำนวนผลลัพธ์ นอกจากนี้ การทดสอบ 11 รายการยังรวมถึงงานตัวอย่างที่ทำขึ้นเพื่อให้คุ้นเคยกับการทดสอบเท่านั้น และจะไม่นำมาพิจารณาในการคำนวณตัวบ่งชี้ ในการทดสอบส่วนใหญ่ แต่ละรายการมีคำตอบที่ถูกต้องเพียงข้อเดียว คำตอบดังกล่าวจะระบุไว้ที่ด้านหลังบัตรมอบหมายและในสมุดคำตอบ การมอบหมายทั้งหมดจะได้รับการประเมินโดยผ่าน / ไม่ผ่าน ตามคำตอบอ้างอิงที่กำหนดไว้ การทดสอบห้าแบบใช้คำตอบฟรี ดังนั้นจึงต้องใช้บรรทัดฐานและกฎเกณฑ์ที่ละเอียดมากขึ้นในการประเมิน ซึ่งระบุไว้ในแนวทางการดำเนินการและประเมินผล SB-IV(Thorndike et al., 1986a), 1 โดยให้ตัวอย่างบางส่วนของคำตอบที่คลุมเครือ ซึ่งต้องมีการชี้แจงเพิ่มเติมจากผู้เชี่ยวชาญด้านการทดสอบ

แม้ว่าจะเต็มขนาด SB-Wมีการทดสอบ 15 รายการในองค์ประกอบของมัน ไม่มีคนเดียวที่ผ่านการทดสอบเหล่านี้ทั้งหมด เนื่องจากการทดสอบบางส่วนใช้ได้เฉพาะในช่วงอายุที่จำกัด โดยปกติแบตเตอรี่เต็มจะมีการทดสอบตั้งแต่ 8 ถึง 13 ครั้ง ขึ้นอยู่กับอายุของผู้สอบและผลการทดสอบที่กำหนดเส้นทางของการสอบ อายุการใช้งานแบตเตอรี่ประมาณ 30 ถึง 90 นาที แต่ผู้ใช้ที่มีประสบการณ์น้อยอาจใช้เวลานานกว่านั้น ตามกฎแล้ว การตรวจสอบโดยใช้มาตราส่วน SB-YVดำเนินการในเซสชั่นเดียว อาจมีช่วงเวลาพักระหว่างการทดสอบหลายนาที สำหรับวัตถุประสงค์บางอย่าง แนวทางปฏิบัติของ SB-IV สำหรับการดำเนินการและการประเมินผลลัพธ์ (Thorndike et al., 1986a) แนะนำแบตเตอรี่ที่ลดจำนวนลงหลายก้อน โดยใช้เวลาทดสอบน้อยกว่า แต่เน้นที่การทดสอบที่เหมาะสมที่สุดสำหรับวัตถุประสงค์ในการทดสอบเฉพาะ แบตเตอรี่เหล่านี้รวมแบตเตอรี่รวมที่ลดลงทั้งหมด 6 การทดสอบ

"การทดสอบเหล่านี้รวมถึง: คำศัพท์ ความเข้าใจ ความตลกขบขัน การลอกเลียน และความสัมพันธ์ทางวาจา

บทที่ 8ความสามารถส่วนบุคคล

การนัดหมายและการทดสอบแบบ 4 ก้อนของการตรวจคัดกรองด่วน ทั้งสองมีการทดสอบอย่างน้อยหนึ่งครั้งในแต่ละโดเมนความรู้ความเข้าใจทั้งสี่ นอกจากนี้ยังมีแบตเตอรี่สามก้อนสำหรับคัดกรองนักเรียนเพื่อรวมไว้ในโปรแกรมที่มีพรสวรรค์สำหรับแต่ละระดับอายุสามระดับตามลำดับ และแบตเตอรี่สามก้อนสำหรับนักเรียนที่มีปัญหาในการเรียนรู้ ซึ่งสอดคล้องกับระดับอายุทั้งสามด้วย แบตเตอรี่ช็อตคัททั้งหมดเหล่านี้ใช้ขั้นตอนมาตรฐานสำหรับระดับการเริ่มต้น การทดสอบ และการให้คะแนน ในคู่มืออ้างอิงสำหรับผู้ใช้ SB-IV (คู่มือผู้ตรวจสอบ)(Delaney, & Hopkins, 1987) ชี้แจงประเด็นขั้นตอนต่างๆ ที่เกี่ยวข้องกับการบริหาร (และการประเมิน) การทดสอบนี้กับกลุ่มวิชาต่างๆ

มาตรฐานและบรรทัดฐานขนาดตัวอย่างที่เป็นมาตรฐานของ SB-IV มีขนาดเกิน 5,000 อาสาสมัครอายุ 2 ถึง 23 ปีที่ได้รับการทดสอบใน 47 รัฐ (รวมถึงอะแลสกาและฮาวาย) และ District of Columbia เล็กน้อย ตัวอย่างนี้แบ่งชั้นตามพื้นที่ ขนาดของชุมชน (ขนาดชุมชน)กลุ่มชาติพันธุ์และเพศเพื่อให้บรรลุการติดต่อใกล้ชิด (ที่ระดับสัดส่วน) กับข้อมูลของสำมะโนสหรัฐ 1980 ในปี 2523 นอกจากนี้สถานะทางเศรษฐกิจและสังคมของอาสาสมัครยังถูกควบคุมในรูปแบบของระดับวิชาชีพและการศึกษาของ พ่อแม่. ผลลัพธ์ของการควบคุมนี้เผยให้เห็นการแสดงเกินของอาสาสมัครที่ด้านบนและด้านล่างที่เป็นตัวแทน ความไม่สอดคล้องกันเหล่านี้ได้รับการแก้ไขโดยการกำหนดปัจจัยการถ่วงน้ำหนักที่แตกต่างกันให้กับความถี่เมื่อคำนวณค่าตัวบ่งชี้ในตารางกฎเกณฑ์ ดังนั้น แต่ละเรื่องจากครอบครัวที่มีสถานะทางเศรษฐกิจและสังคมสูงจึงถูกนับเป็นส่วนหนึ่งของกรณีที่สังเกตพบ ในขณะที่ตัวอย่างจากครอบครัวที่มีสถานะทางเศรษฐกิจและสังคมต่ำจะถูกนับเป็นกรณีที่มีสารเติมแต่งบางอย่าง

ตารางเชิงบรรทัดฐานใช้เพื่อแปลงคะแนนหลักสำหรับการทดสอบทั้ง 15 รายการเป็น "คะแนนอายุมาตรฐาน" เอสเอเอส) *เป็นคะแนนมาตรฐานที่ปรับให้เป็นมาตรฐานโดยมีค่าเฉลี่ย 50 และ SD= 8 ในแต่ละช่วงอายุ ตารางแนวปฏิบัติจะรวบรวมเป็นระยะ 4 เดือนสำหรับอายุ 2 ถึง 5 ปี ช่วง 6 เดือนสำหรับอายุ 6 ถึง 10 ปี และช่วง 1 ปีสำหรับอายุ 11 ถึง 17 ปี มีตารางบรรทัดฐานเพียงตารางเดียวสำหรับระดับอายุตั้งแต่ 18 ถึง 23 ปี สมุดบันทึกสำหรับบันทึกคำตอบประกอบด้วยไดอะแกรมแบบฟอร์มพิเศษสำหรับสร้างโปรไฟล์บุคคล 5L5 ตามผลการทดสอบที่ทำกับวิชาทดสอบเฉพาะ

ตัวชี้วัดมาตรฐานของอายุ (เอสเอเอส)สามารถรับได้สำหรับแต่ละโดเมนแห่งความรู้ความเข้าใจทั้งสี่และสำหรับคะแนนเต็มสเกลสะสม 55-IV ค่าที่ซับซ้อนและตัวบ่งชี้มาตรฐานบางส่วนสี่ตัวของอายุพบโดยค่า SASสำหรับการทดสอบที่ทำกับหัวข้อการทดสอบเฉพาะ ซึ่งคุณเพียงแค่ต้องอ้างอิงถึงตารางกฎเกณฑ์ที่เกี่ยวข้อง ห้าสิ่งนี้ SASยัง

ตารางเหล่านี้มอบให้โดย Thorndike et al., 1986a, p. 183-188. ความหมายบางอย่าง เอสเอเอสโดยอิงจาก "กรณีที่สังเกตได้น้อยกว่า 100 กรณีที่ประมาณการทางสถิติสำหรับกลุ่มอายุเต็มและ" จะถูกเน้นในตารางเชิงบรรทัดฐานที่มีพื้นหลังสีเข้ม ตัวชี้วัดดังกล่าวปรากฏขึ้นเมื่อผู้เข้ารับการทดลองแสดงผลสูงผิดปกติหรือในทางกลับกัน มีอายุต่ำ

ST U ซึ่งกำหนดเส้นทางของการสำรวจ (Thorndike ct al., 1986b, p. 29-30)

ตอนที่ 3การทดสอบความสามารถ

ค่ามาตรฐานที่ทำให้เป็นมาตรฐาน แต่ด้วยค่าเฉลี่ย 100 และ SD = 16 ดังนั้นจึงแสดงเป็นหน่วยเดียวกับมาตรฐาน ไอคิวรุ่นก่อนหน้าของมาตราส่วน Stanford-Binet อย่างไรก็ตาม การใช้คำว่า "/ Q" ได้ถูกยกเลิกโดยสมบูรณ์แล้ว สำหรับวัตถุประสงค์พิเศษ มีความเป็นไปได้ในการคำนวณตัวบ่งชี้มาตรฐานของอายุสำหรับการรวมกันของสองรายการขึ้นไป (เช่น สอดคล้องกับหนึ่งในสี่ด้านความรู้ความเข้าใจ) SAS- ที่เรียกว่า "องค์ประกอบบางส่วน" (คอมโพสิตบางส่วน).ตัวอย่างเช่น การรวมกัน SASสำหรับการให้เหตุผลทางวาจาและเชิงปริมาณตรงกับ "ความสามารถในการเรียนรู้" อย่างใกล้ชิด (ความถนัดทางวิชาการ)และอาจมีความสนใจเป็นพิเศษเกี่ยวกับการประเมินผลสัมฤทธิ์ทางการเรียนหรือความพร้อมในการเรียนรู้

ความน่าเชื่อถือ ตั้งแต่ใน SB-IVไม่มีรูปแบบอื่น ความน่าเชื่อถือของมาตราส่วนนี้สามารถประเมินได้โดยการคำนวณความสอดคล้องภายในหรือโดยการทดสอบซ้ำ ในกรณีส่วนใหญ่ ใช้วิธี Kuder-Richardson ซึ่งนำไปใช้กับข้อมูลที่ได้จากตัวอย่างมาตรฐานทั้งหมด ตามที่คาดไว้ ตัวบ่งชี้แบบผสมสำหรับแบตเตอรี่เต็มให้ค่าสัมประสิทธิ์ความน่าเชื่อถือสูงสุดในทุกระดับอายุ โดยมีค่าอยู่ระหว่าง 0.95 ถึง 0.99 ความน่าเชื่อถือของตัวบ่งชี้เฉพาะในแต่ละโดเมนความรู้ความเข้าใจทั้งสี่ก็สูงเช่นกัน แม้ว่าจะแตกต่างกันไปตามจำนวนการทดสอบที่รวมอยู่ในแต่ละโดเมน แต่ปัจจัยความน่าเชื่อถือที่สอดคล้องกันอยู่ในช่วง 0.80 ถึง 0.97 สำหรับการทดสอบแต่ละรายการ ส่วนใหญ่มีค่าสัมประสิทธิ์ความน่าเชื่อถือในช่วงเวลาระหว่าง 0.80 ถึง 0.90 ยกเว้นการทดสอบ "หน่วยความจำสำหรับวัตถุ" แบบสั้น (ประกอบด้วย 14 รายการ) ค่าความเชื่อถือได้จะแตกต่างกันไปตั้งแต่ 0.66 ถึง 0 78 โดยทั่วไป อัตราส่วนความปลอดภัยทั้งหมดมีแนวโน้มที่จะเพิ่มขึ้นเล็กน้อยเมื่อเราเปลี่ยนจากระดับอายุน้อยกว่าเป็นอายุที่มากขึ้น

ข้อมูลเพิ่มเติมเกี่ยวกับความน่าเชื่อถือในการทดสอบซ้ำได้มาจากเด็กก่อนวัยเรียน 57 คน (อายุ 5 ปี) และเด็กนักเรียน 55 คน (อายุ 8 ปี) ซึ่งได้รับการทดสอบซ้ำหลายเดือนต่อมา (จาก 2 ถึง 8) โดยทั่วไป ความน่าเชื่อถือสูงสำหรับตัวบ่งชี้คอมโพสิต: ค่าสัมประสิทธิ์ที่สอดคล้องกันสำหรับทั้งสองกลุ่มคือ 0.91 และ 0.90 แม้ว่าคะแนนเฉพาะในด้านการใช้เหตุผลด้วยวาจาจะให้ค่าสัมประสิทธิ์ความน่าเชื่อถือที่สูงกว่า 0.80 ความน่าเชื่อถือในการทดสอบซ้ำของตัวบ่งชี้เฉพาะอื่นๆ และการทดสอบแต่ละรายการมีความผันผวนอย่างมีนัยสำคัญ ผลลัพธ์เหล่านี้ตีความได้ยากเนื่องจากการทดสอบบางอย่างอาจมีผลกระทบจากช่วงอายุที่จำกัดและผลของการปฏิบัติ ซึ่งอาจแตกต่างอย่างมีนัยสำคัญในเด็กแต่ละคน

นอกจากปัจจัยด้านความปลอดภัยในแนวทางการดำเนินการและประเมินผลแล้ว SB-W (คู่มือ)และในคู่มือทางเทคนิค (คู่มือทางเทคนิค)ข้อผิดพลาดมาตรฐานของการวัดจะได้รับ (SEM)ภายในแต่ละระดับอายุสำหรับการทดสอบแต่ละครั้ง ตัวบ่งชี้เฉพาะสำหรับพื้นที่การเรียนรู้และตัวบ่งชี้ที่ซับซ้อนในขนาดเต็ม เช่น SEMจำเป็นสำหรับการประเมินตัวบ่งชี้แต่ละตัวและสำหรับการตีความความแตกต่างระหว่างตัวบ่งชี้ในการวิเคราะห์โปรไฟล์ ครอบคลุมทั่วไป SAS (M= 100, SD = 16) มี SEMจาก 2 ถึง 3 หน่วยมาตราส่วน ตัวอย่างเช่น หากเป็นค่าเฉลี่ยโดยประมาณ SEMรับ 2.5 นั่นคือ 2 โอกาส 1 ที่ตัวบ่งชี้ที่ซับซ้อน "จริง" ของเรื่องใดเรื่องหนึ่งจะไม่แตกต่างจากตัวบ่งชี้ที่เขาได้รับมากกว่า 2.5 หน่วย นอกจากนี้ มีโอกาส 95 จาก 100 ที่การเปลี่ยนแปลงจะไม่เกิน 5 หน่วย (2.5 x 1.96 = 4.90)

บทที่ 8ความสามารถส่วนบุคคล

วี คู่มืออ้างอิงผู้ใช้ 5B- / V (Delaney, & Hopkins, 1987) ให้กรอบการตีความที่สนับสนุนสมมติฐานที่จะกำหนดและตรวจสอบข้ามกับข้อมูลเชิงปริมาณและคุณภาพที่รวบรวมด้วยแบตเตอรี่นี้ การวิเคราะห์เชิงปริมาณเป็นไปตามแบบจำลองที่เสนอครั้งแรกโดย FB Davis (FB Davis, 1959) และนำไปใช้กับ Kaufman (1979, 1994) และรุ่นอื่นๆ กับเครื่องชั่ง Wechsler โดยพื้นฐานแล้ว ประกอบด้วยรูปแบบการเปรียบเทียบทั่วไปสำหรับตัวบ่งชี้ที่ซับซ้อนและตัวบ่งชี้เฉพาะสี่ตัว (ดูรูปที่ 8-2) เพื่อตรวจหาความแตกต่างที่มีนัยสำคัญทางสถิติตามค่า เอสอีเอ็มความถี่ของความแตกต่างที่ได้รับจะถูกเปรียบเทียบกับข้อมูลเชิงบรรทัดฐานที่สอดคล้องกันจากตัวอย่างมาตรฐาน นอกจากนี้ จุดแข็งและจุดอ่อนของความสามารถเฉพาะของแต่ละบุคคล ซึ่งเปิดเผยโดยการทดสอบแต่ละครั้ง สามารถประเมินอย่างเป็นระบบได้ ซึ่งผลเฉลี่ยของวิชาสำหรับตัวบ่งชี้ที่ซับซ้อนและบางส่วนจะถูกนำมาเปรียบเทียบกับตัวบ่งชี้สำหรับการทดสอบแต่ละรายการ คู่มืออ้างอิงนี้ประกอบด้วยข้อมูลทั้งหมดที่คุณต้องการเพื่อดำเนินการวิเคราะห์โปรไฟล์ประเภทนี้ รวมถึงตัวอย่างที่สมบูรณ์สี่รายการของแอปพลิเคชัน จะได้รับการชื่นชมจากทั้งผู้เริ่มต้นและผู้ใช้ที่มีประสบการณ์ของมาตราส่วน Stanford-Binet

ความถูกต้องตามแนวคิดสมัยใหม่ของการตรวจสอบความถูกต้องของการทดสอบ ผู้พัฒนามาตราส่วน Stanford-Binet รุ่นที่สี่ได้ปฏิบัติตามแนวทางที่หลากหลายในการระบุและกำหนดโครงสร้างที่อยู่ภายใต้มาตราส่วนดังกล่าว ตัวเลือกหลักของโครงสร้างได้รับคำแนะนำจากการวิเคราะห์วรรณกรรมทางวิทยาศาสตร์ที่มีอยู่เกี่ยวกับธรรมชาติและการวัดความฉลาด (R. L. Thorndike et al., 1986b, บทที่ 1) ประสบการณ์การใช้มาตราส่วนนี้รุ่นก่อนหน้าและจุดแข็งและจุดอ่อนที่เปิดเผยในระหว่างการดำเนินการดังกล่าวเป็นแนวทางเพิ่มเติมสำหรับการร่างแผนสำหรับการสร้างมาตราส่วนใหม่และการตัดสินใจ ตัวอย่างเช่น การแบ่งประเภทงานออกเป็นการทดสอบย่อยที่เชื่อถือได้เป็นการทดแทนที่จำเป็นสำหรับการปฏิบัติทางคลินิกแบบดั้งเดิมของการวิเคราะห์โครงสร้างของการตอบสนองอย่างหลวม ๆ ตามการจัดกลุ่มงานตามอัตวิสัย

หลังจากการคัดเลือกเบื้องต้นและคำจำกัดความเบื้องต้นของโครงสร้างที่ประเมินใน SB-IV แล้ว ตัวเก่าจะถูกระบุและมีการพัฒนางานใหม่ซึ่งสอดคล้องกับคำจำกัดความเหล่านี้ งานทั้งชุดได้รับการวิเคราะห์อย่างครอบคลุมและซับซ้อนทางสถิติ ซึ่งรวมถึงการประเมินอคติทั้งทางอัตนัยและทางสถิติของงาน (R. L. Thorndike et al., 1986b, บทที่ 2) เวอร์ชันสุดท้ายของสเกล ซึ่งได้มาจากการตรวจสอบเบื้องต้นและการทดลองภาคสนามหลายครั้ง ได้ดำเนินการกับตัวอย่างที่เป็นมาตรฐาน จากนั้นจึงตรวจสอบในแง่ของข้อมูลการตรวจสอบความถูกต้องสามประเภทหลัก: 1) ความสัมพันธ์ระหว่างกันและการวิเคราะห์ปัจจัยของตัวบ่งชี้ 2) ความสัมพันธ์กับการทดสอบความฉลาดอื่น ๆ และ 3) การเปรียบเทียบผลลัพธ์ในกลุ่มเฉพาะที่กำหนดไว้ล่วงหน้า (Thorndike et al., 1986b, บทที่ 6)

อย่างแรกเลย ตามข้อมูลของตัวอย่างมาตรฐานฉบับสมบูรณ์ ความสัมพันธ์ระหว่างกันถูกคำนวณระหว่างตัวบ่งชี้ของการทดสอบทั้งหมด ตัวบ่งชี้เฉพาะสำหรับพื้นที่ความรู้ความเข้าใจทั้งสี่และตัวบ่งชี้ที่ซับซ้อนของแบตเตอรี่ - แยกกันสำหรับแต่ละระดับอายุ ค่ามัธยฐานสหสัมพันธ์ (พบโดยการจัดลำดับสัมประสิทธิ์ชนิดเดียวกันสำหรับทุกวัย) ใช้เป็นข้อมูลป้อนเข้าสำหรับการวิเคราะห์ปัจจัยยืนยัน จุดประสงค์หลักของเรื่องนี้และนาลิสาคือเพื่อทดสอบสมมติฐานเกี่ยวกับการมีอยู่ของปัจจัยร่วมที่อธิบายความสัมพันธ์

ตอนที่ 3การทดสอบความสามารถ

ความสัมพันธ์ระหว่างการทดสอบจากโดเมนความรู้ความเข้าใจที่แตกต่างกัน และปัจจัยกลุ่มที่อธิบายความสัมพันธ์ที่เหลือภายในแต่ละโดเมน การวิเคราะห์ปัจจัยที่คล้ายคลึงกันได้ดำเนินการด้วยความสัมพันธ์แบบมัธยฐานในแต่ละกลุ่มอายุ (จาก 2 ถึง 6, จาก 7 ถึง 11 และ 12 ถึง 18-23)

ผลลัพธ์ของการวิเคราะห์ปัจจัยในแต่ละกรณีแสดงให้เห็นโหลดที่มีนัยสำคัญของปัจจัยร่วมในการทดสอบทั้งหมด จึงเป็นเหตุผลที่สมควรที่จะใช้ตัวบ่งชี้ที่ซับซ้อนร่วมกัน สำหรับโดเมนความรู้ความเข้าใจสามในสี่โดเมน ปัจจัยกลุ่มอธิบายสัดส่วนที่มีนัยสำคัญของความแปรปรวนรวมที่เหลือภายในโดเมนที่เกี่ยวข้อง ข้อยกเว้นคือพื้นที่ของ "การให้เหตุผลเชิงนามธรรม / การมองเห็น" ซึ่งการทดสอบทั้งสี่แสดงความจำเพาะในระดับสูง สามารถสันนิษฐานได้ว่าความล้มเหลวในการค้นหาการยืนยันที่ชัดเจนของปัจจัยกลุ่มในโดเมนความรู้ความเข้าใจนี้อาจเกี่ยวข้องกับผลสะสมของหลักสูตรของโรงเรียนซึ่งไม่ได้จัดอย่างระมัดระวังในแง่ของเนื้อหาเชิงพื้นที่และการรับรู้ในแง่ของคำพูดและตัวเลข วัสดุ. ประสบการณ์ส่วนตัวในแต่ละวันที่เอื้อต่อการพัฒนาความสามารถในการรับรู้เชิงพื้นที่ไม่ได้จัดเป็น "หลักสูตร" หรือเนื้อหาอย่างเป็นระบบ เช่น ประสบการณ์การเรียนรู้ ดังนั้นจึงมีโอกาสน้อยที่ประสบการณ์ส่วนตัวจะเอื้อต่อการสร้างโครงสร้างความผูกพันร่วมกันระหว่างบุคคลต่างๆ (Anastasi, 1970, 1986b)

ภาพรวมของผลการวิเคราะห์ปัจจัยที่กำหนดในคู่มือการทดสอบ ตลอดจนผลการวิเคราะห์ปัจจัยที่ดำเนินการโดยผู้วิจัยอิสระอื่นๆ ตามข้อมูลมาตรฐาน เอสบี-วายวี,ยืนยันความถูกต้องของการใช้ตัวบ่งชี้ที่ซับซ้อนเป็นตัววัดความสามารถทางปัญญาทั่วไป (R. M. Thor-ndike, 1990) อย่างไรก็ตาม นักวิจัยไม่เห็นด้วยกับจำนวนและลักษณะของปัจจัยที่แคบกว่า (ดู McCallum, 1990 ด้วย) สถานการณ์นี้ซับซ้อนเพราะว่าตั้งแต่ SB-YVประกอบด้วยชุดการทดสอบที่แตกต่างกันในแต่ละช่วงอายุ ข้อมูล "ดิบ" สำหรับการวิเคราะห์ปัจจัย (กล่าวคือ ความสัมพันธ์ระหว่างตัวบ่งชี้การทดสอบ) จะแตกต่างกันตามไปด้วย ดังนั้นความแตกต่างในประเภทและจำนวนของปัจจัย - ตั้งแต่สองถึงสี่ - ที่ปรากฏในระดับอายุต่างกัน ความคลาดเคลื่อนเหล่านี้รุนแรงขึ้นโดยวิธีการวิเคราะห์ปัจจัยที่หลากหลายที่ใช้ในการศึกษาต่างๆ อย่างไรก็ตาม โดยทั่วไป เมื่ออายุมากขึ้นของอาสาสมัคร โซลูชันแฟกทอเรียลจะตรงกับแบบจำลองสี่ปัจจัยที่คาดการณ์ไว้ในการพัฒนา SB-IV โดยเฉพาะอย่างยิ่งเมื่อใช้การวิเคราะห์ปัจจัยที่เป็นความลับเมื่อเทียบกับการสำรวจ (สำรวจ)

แหล่งข้อมูลที่สองของการตรวจสอบความถูกต้องขึ้นอยู่กับชุดของกลุ่มการศึกษาที่ SB-YVและการทดสอบสติปัญญาอื่นๆ รวมถึงมาตราส่วน L-Msama Stanford-Binet 1 กลุ่มเหล่านี้ประกอบด้วยเด็กนักเรียนที่เข้าชั้นเรียนเป็นประจำและครูบรรยายว่า "สามัญ" (ไม่พิเศษ).นอกจากนี้นักวิจัยยังมี "พิเศษ" สามประการ (พิเศษ)กลุ่มนักเรียนในโครงการสำหรับเด็กที่มีพรสวรรค์ เด็กที่มีปัญหาในการเรียนรู้ และเด็กที่มีความบกพร่องทางสติปัญญา ในตัวอย่างปกติ สหสัมพันธ์ของมาตรฐาน ไอคิวตามรุ่นก่อนหน้าของมาตราส่วน Stanford-Binet (แบบฟอร์ม 1-M) พร้อมตัวบ่งชี้ที่ซับซ้อนสำหรับ 56-IV คือ 0.81 ใหญ่เป็นอันดับสอง (0.76) คือความสัมพันธ์ของมาตรฐาน ไอคิวรูปร่าง L-Mcการแสดงส่วนตัว

รวมอื่นๆ 1 รายการ WISC-R, WAIS-R, WPPSIและ เค-เอบีซี,ซึ่งจะกล่าวถึงในนี้”บทต่อไปเล็กน้อย

บทที่ 8ความสามารถส่วนบุคคล

ผู้ริเริ่ม SB-Wในด้าน "การให้เหตุผลทางวาจา" และความสัมพันธ์ต่ำสุด (0.56) คือมาตรฐาน / Qdal พร้อมตัวบ่งชี้ส่วนตัว SB-Wในด้าน "การให้เหตุผลเชิงนามธรรม / การมองเห็น" ซึ่งคาดว่าจะขึ้นอยู่กับความเหมือนและความแตกต่างในเนื้อหาของทั้งสองรูปแบบของมาตราส่วน Stanford-Binet ในทุกกลุ่มความสัมพันธ์ของตัวบ่งชี้ที่ซับซ้อนและบางส่วน SB-IVด้วยตัวบ่งชี้ทั่วไปหรือบางส่วนในการทดสอบความฉลาดอื่น ๆ ส่วนใหญ่ไม่ได้ขัดแย้งกับสมมติฐานเกี่ยวกับโครงสร้างที่ทดสอบ ในขณะเดียวกันก็มีการศึกษาอย่างรอบคอบถึงความสัมพันธ์ทั้งหมดที่พบระหว่างตัวบ่งชี้เฉพาะ SB-Wและการทดสอบความฉลาดอื่น ๆ ช่วยให้เข้าใจโครงสร้างได้ดีขึ้นโดยวัดจากมาตราส่วน Stanford-Binet ที่ทันสมัย

การศึกษาพิเศษชุดที่สามเกี่ยวกับตัวอย่างพิเศษพบว่า SB-IWช่วยให้คุณกำหนดระดับประสิทธิภาพของเด็กที่มีพรสวรรค์ที่มีปัญหาในการเรียนรู้ได้อย่างถูกต้องและล้าหลังในการพัฒนาเด็กวัยเรียน ค่าเฉลี่ยของตัวบ่งชี้ที่ซับซ้อนและตัวบ่งชี้เฉพาะสี่ตัวในตัวอย่างที่มีพรสวรรค์นั้นสูงกว่าค่าเฉลี่ยที่สอดคล้องกันในตัวอย่างมาตรฐานอย่างมีนัยสำคัญ ค่าเฉลี่ยในกลุ่มตัวอย่างเด็กที่มีปัญหาในการเรียนรู้และปัญญาอ่อนต่ำกว่าค่าเฉลี่ยของกลุ่มตัวอย่างที่มีมาตรฐานอย่างมีนัยสำคัญ และค่าเฉลี่ยของผู้ที่มีปัญญาอ่อนต่ำกว่าค่าเฉลี่ยในกลุ่มตัวอย่างที่มีปัญหาในการเรียนรู้อย่างมีนัยสำคัญ ควรสังเกตว่าในการศึกษาทั้งหมดของกลุ่มพิเศษผู้เข้าร่วมถูกกำหนดบนพื้นฐานของการทดสอบหรือตัวบ่งชี้ประสิทธิภาพอื่น ๆ แต่มาตราส่วนเอง SB-1 V ไม่ได้ใช้ในกรณีนี้

ในการทบทวนการศึกษาความถูกต้องล่าสุด SB-W(Laurent, Swerdlik, & Ry-burn, 1992) สรุปว่า อย่างน้อยมาตราส่วนนี้ก็เป็นหน่วยวัดความฉลาดทั่วไปที่ดีพอๆ กับเครื่องมืออื่นๆ ที่มีอยู่ มีความสัมพันธ์อย่างมากกับการวัดผลสัมฤทธิ์ทางการเรียน และยิ่งไปกว่านั้น ยังทำให้สามารถแยกแยะระหว่างความบกพร่องทางสติปัญญา ผู้ที่มีพรสวรรค์ และผู้ป่วยที่มีความเสียหายทางระบบประสาท ผู้เขียนรีวิวแนะนำว่า SB-IVสามารถใช้เป็นเครื่องมือในการคัดเลือกเด็กที่มีพรสวรรค์ได้ เนื่องจาก "เพดาน" สูงซึ่งกำหนดโดยช่วงอายุของการทดสอบนี้ ในทางกลับกันพวกเขาวิพากษ์วิจารณ์ SB- IV สำหรับการขาดงานที่ง่ายมาก - ง่ายพอที่จะวินิจฉัยภาวะปัญญาอ่อนในเด็กที่อายุน้อยที่สุด

การวิจัยที่จำเป็นในการเสริมสร้างความหมายการตีความของการทดสอบต่างๆ SB-Wและการรวมกันของมันยังคงสะสมอย่างรวดเร็ว นอกจากนี้ มีรายงานหลายฉบับที่ให้คำแนะนำเกี่ยวกับการใช้มาตราส่วนนี้ (Sattler, 1988; Glutting, & Kaplan, 1990; Kampha-us, 1993) Stanford-Binet รุ่นปัจจุบันสะท้อนให้เห็นถึงความก้าวหน้าที่แท้จริงในการออกแบบมาตราส่วน 55-IV ให้ความยืดหยุ่นที่จำเป็นโดยให้ผู้ใช้ให้คะแนนความสามารถส่วนบุคคลกับเป้าหมายการทดสอบที่เฉพาะเจาะจง สุดท้ายนี้ มาตราส่วนรุ่นนี้สอดคล้องกับความเข้าใจทางทฤษฎีในปัจจุบันเกี่ยวกับธรรมชาติของหน่วยสืบราชการลับและการวิจัยเมื่อเร็วๆ นี้ในด้านนี้มากขึ้น (ดูบทที่ 11)

เครื่องชั่ง Wechsler

เครื่องชั่งอัจฉริยะที่พัฒนาโดย David Wexler มีรุ่นต่อเนื่องหลายรุ่นที่มีสามมาตราส่วน: สำหรับผู้ใหญ่ สำหรับเด็กวัยเรียน และสำหรับเด็กก่อนวัยเรียน นอกจากใช้วัดความฉลาดทั่วไปแล้ว เปลือกตา

ตอนที่ 3การทดสอบความสามารถ

มีการใช้เกล็ดของ Sler เพื่อช่วยในการวินิจฉัยทางจิตเวช จากการสังเกตว่าสมองถูกทำลาย อาการกำเริบของโรคจิต และความผิดปกติทางอารมณ์สามารถเลือกส่งผลกระทบต่อการทำงานทางปัญญา ดี. เว็กซ์เลอร์ และนักจิตวิทยาทางการแพทย์คนอื่นๆ แย้งว่าการวิเคราะห์เปรียบเทียบประสิทธิภาพของการทดสอบย่อยต่างๆ ของผู้ป่วยอาจให้ความกระจ่างเกี่ยวกับลักษณะเฉพาะของความผิดปกติทางจิต ปัญหาและผลลัพธ์ที่เกี่ยวข้องกับการวิเคราะห์โปรไฟล์มาตราส่วน Wechsler จะกล่าวถึงในบทที่ 17 เพื่อเป็นตัวอย่างของการใช้การทดสอบในสถานพยาบาล

ความสนใจในเครื่องชั่ง Wechsler และความกว้างของการประยุกต์ใช้เป็นที่ประจักษ์โดยสิ่งตีพิมพ์หลายพันฉบับที่อุทิศให้กับพวกเขาซึ่งปรากฏจนถึงปัจจุบัน นอกเหนือจากบทวิจารณ์ปกติเกี่ยวกับการทดสอบใน หนังสือรุ่นวัดพลังจิตการศึกษาที่เกี่ยวข้องกับเครื่องชั่ง Wechsler ครอบคลุมเป็นระยะในวารสาร (Guertin, Frank, & Rabin, 1956; Guertin, Ladd, Frank, Rabin, & Hiester, 1966; Guertin, Ladd, Frank, Rabin, & Hiester, 1971; Guertin, Rabin, Frank, & Ladd, 1962; TD Hill, Reddon, & Jackson, 1985; Littell, 1960; Rabin, & Guertin, 1951; IL Zimmerman, & Woo-Sam, 1972) และสรุปเป็นหนังสือหลายเล่ม (เช่น Forster & Matarazzo, 1990 ; Gyurke 1991; Kamphaus 1993; Kaufman 1979,1990,1994; Sattler 1988,1992)

อดีตและปัจจุบันของ Veksler Intelligence Scalesรูปแบบแรกของเครื่องชั่ง Wechsler หรือที่รู้จักในชื่อ Wechsler-Bellevue IQ Scale ได้รับการตีพิมพ์ในปี 1939 หนึ่งในเป้าหมายหลักของการเตรียมมาตราส่วนนี้คือการพัฒนาการทดสอบสติปัญญาที่เหมาะสมสำหรับการทดสอบผู้ใหญ่ การแนะนำมาตราส่วนนี้เป็นครั้งแรก D. Wechsler (Wechsler, 1939) ตั้งข้อสังเกตว่าการทดสอบสติปัญญาที่มีอยู่ก่อนหน้านี้ได้รับการพัฒนาขึ้นสำหรับเด็กนักเรียนเป็นหลักและปรับให้เข้ากับผู้ใหญ่โดยการเพิ่มงานที่ยากขึ้นในประเภทเดียวกัน เนื้อหาของการทดสอบดังกล่าวมักไม่ได้รับความสนใจจากผู้ใหญ่ หากรายการทดสอบไม่มีความถูกต้องชัดเจนเป็นอย่างน้อย ก็แทบจะเป็นไปไม่ได้เลยที่จะสร้างสายสัมพันธ์ที่เหมาะสมกับผู้ที่เป็นผู้ใหญ่ รายการทดสอบความฉลาดหลายรายการที่ได้รับการปรับให้เหมาะกับกิจกรรมประจำวันของเด็กวัยเรียนโดยเฉพาะขาดความสมเหตุสมผลที่เห็นได้ชัดจากมุมมองของผู้ใหญ่ส่วนใหญ่

การกำหนดเป้าหมายการทดสอบความเร็วส่วนใหญ่อาจทำให้ผู้สูงอายุเสียเปรียบได้ นอกจากนี้ ดี. เวคส์เลอร์เชื่อว่าในการทดสอบความฉลาดแบบเดิมๆ ความสำคัญอย่างยิ่งยวดอย่างไม่สมเหตุสมผลนั้นผูกติดอยู่กับการใช้คำที่ค่อนข้างเป็นสูตร เขาดึงความสนใจของเพื่อนร่วมงานเกี่ยวกับความไม่สามารถบังคับใช้ของบรรทัดฐานอายุจิตกับผู้ใหญ่ และชี้ให้เห็นว่าตัวอย่างมาตรฐานก่อนหน้านี้สำหรับการทดสอบความฉลาดของแต่ละบุคคลนั้นมีเพียงผู้ใหญ่จำนวนเล็กน้อยเท่านั้น

ความปรารถนาที่จะเอาชนะข้อบกพร่องเหล่านี้นำไปสู่การพัฒนามาตราส่วน Wechsler-Bellevue ครั้งแรก ในรูปแบบและเนื้อหา มาตราส่วนนี้ทำหน้าที่เป็นแบบจำลองพื้นฐานสำหรับมาตราส่วนปัญญา Veksler ที่ตามมาทั้งหมด ซึ่งแต่ละส่วนได้แนะนำการปรับปรุงบางอย่างในเวอร์ชันก่อนหน้า ในปี พ.ศ. 2492 ได้มีการจัดทำ Veksler Intelligence Scale for Children (W1SOเป็นการขยายมาตราส่วน Wechsler-Bellevue ไปสู่ระดับอายุที่ต่ำกว่า (Seashore, Wesman, & Doppelt, 1950) หลายรายการนำมาจากการทดสอบสำหรับผู้ใหญ่โดยตรง และเพิ่มรายการที่เบากว่าประเภทเดียวกันในแต่ละการทดสอบย่อย ในปี 1955 มาตราส่วน Wechsler-Bellevue ถูกแทนที่ด้วยมาตราส่วนความฉลาดทาง Wechsler สำหรับผู้ใหญ่ ( WAIS)ปราศจากเทคนิคบางอย่างที่ไม่ใช่

บทที่ 8ความสามารถส่วนบุคคล

ความเพียงพอของมาตราส่วนก่อนหน้าเกี่ยวกับขนาดและความเป็นตัวแทนของตัวอย่างเชิงบรรทัดฐาน ตลอดจนความน่าเชื่อถือของการทดสอบย่อย ในปี 1967 กลุ่มทดสอบของ Veksler ได้รับการเติมเต็มด้วย "ลูกคนสุดท้อง" - มาตราส่วนหน่วยสืบราชการลับของ Veksler สำหรับเด็กก่อนวัยเรียนและนักเรียนระดับประถมศึกษา (WPPSP)แต่เดิมตั้งครรภ์สำหรับเด็กอายุตั้งแต่ 4 ถึง 6.5 ปีโดยเป็นส่วนเสริมของส่วนล่างของช่วงอายุ WISC,ซึ่งมีไว้สำหรับเด็กอายุตั้งแต่ 5 ถึง 15 ปี

การพัฒนาของ WISCถูกทำเครื่องหมายตั้งแต่เริ่มแรกด้วยการโต้เถียงที่โดดเด่นในขณะที่ Wechsler มุ่งมั่นที่จะสร้างการทดสอบของเขาส่วนหนึ่งเนื่องจากความจำเป็นเร่งด่วนสำหรับมาตราส่วนในการวัดความฉลาดของผู้ใหญ่ซึ่ง ไม่จะเป็นการขยายขนาดเด็กที่มีอยู่แล้วไปสู่ระดับอายุที่สูงขึ้นอย่างง่าย ฉบับพิมพ์ครั้งแรก WISCอันที่จริงถูกวิพากษ์วิจารณ์อย่างสมบูรณ์เนื่องจากขาดการปฐมนิเทศเนื้อหาที่มีต่อเด็ก ฉบับแก้ไขของมาตราส่วนนี้ ( WISC-R),งานมอบหมายที่เน้นผู้ใหญ่ซึ่งตีพิมพ์ในปี 1974 ได้รับการแทนที่หรือปรับเปลี่ยนเพื่อให้เข้ากับประสบการณ์ในวัยเด็กตามปกติมากขึ้น ในการทดสอบย่อยเลขคณิต ตัวอย่างเช่น ในเงื่อนไขของปัญหา "ซิการ์" ถูกแทนที่ด้วย "ขนม" การเปลี่ยนแปลงอื่น ๆ รวมถึงการกำจัดงานที่อาจจะคุ้นเคยกับระดับต่างๆ ของเด็กบางกลุ่ม และการรวมอักขระเพศหญิงและสีดำในเนื้อหาภาพของการทดสอบย่อย การทดสอบย่อยจำนวนหนึ่งต้องยืดเยื้อเพื่อปรับปรุงความน่าเชื่อถือ นอกจากนี้ ยังได้ปรับปรุงขั้นตอนการทดสอบและให้คะแนนอีกด้วย

คำอธิบายของเครื่องชั่งจนถึงปัจจุบัน เครื่องชั่ง Wechsler ทั้งสามเครื่องได้ผ่านการแก้ไขอย่างน้อยหนึ่งครั้งหรือหลายครั้ง มีสามรุ่นที่ทันสมัยของเครื่องชั่งที่ตีพิมพ์ภายใต้ชื่อ David Wechsler หลังจากที่เขาเสียชีวิตในปี 1981: มาตราส่วน IQ สำหรับผู้ใหญ่ที่แก้ไขของ Wechsler (WAIS-R- Wechsler, 1981) ครอบคลุมช่วงอายุตั้งแต่ 16 ถึง 74 ปี Weksler Intelligence Scale สำหรับเด็ก - รุ่นที่สาม ( WISC-III- Wechsler, 1991) มีไว้สำหรับเด็กอายุตั้งแต่ 6 ปีถึง 16 ปี 11 เดือน; มาตราส่วนความฉลาดของ Veksler ที่แก้ไขแล้วสำหรับเด็กก่อนวัยเรียนและเด็กประถม ( WPPSI-R- Wechsler, 1989) ปัจจุบันครอบคลุมช่วงอายุตั้งแต่ 3 ปี ถึง 7 ปี 3 เดือน รุ่นที่สามของมาตราส่วนความฉลาดของผู้ใหญ่ ( WAIS)งานปรับปรุงที่ได้ดำเนินการมาตั้งแต่ปี 2535 โดยมีแผนที่จะเตรียมการภายในปี 2540

WAIS-R, WISC-IIIและ WPPSI-Rมีความคล้ายคลึงกันหลายประการ รวมทั้งการจัดระดับพื้นฐานของเครื่องชั่งแบบวาจาและแบบไม่ใช้คำพูด ซึ่งแต่ละแบบประกอบด้วยการทดสอบย่อยอย่างน้อยห้า (และสูงสุดเจ็ด) และให้ตัวบ่งชี้แต่ละรายการในหน่วยของมาตรฐาน ไอคิวตัวบ่งชี้ส่วนบุคคล แต่การทดสอบย่อยที่ดำเนินการอย่างเป็นระบบทั้ง 10 รายการ (11 สำหรับ WAIS-R)มารวมกันเป็นสเกลเต็ม IQ (ไอคิวเต็มสเกล),ซึ่งมีค่าเฉลี่ยและค่าเบี่ยงเบนมาตรฐานเท่ากัน (M = 100, SD= 15) เป็นสองมาตราส่วนย่อย - ทางวาจาและอวัจนภาษา จากการทดสอบย่อย 17 ประเภทที่ใช้ใน WAIS-R, WlSC-ชิ WPPSI-R,แปด (5 วาจาและ 3 อวัจนภาษา) เป็นเรื่องปกติของทั้งสามมาตราส่วน เมื่อใช้มาตราส่วนเหล่านี้ การทดสอบย่อยด้วยวาจาและอวัจนภาษาจะสลับกันและนำเสนอในลำดับที่กำหนดไว้ล่วงหน้า ซึ่งจะต่างกันไปตามแต่ละมาตราส่วน

การทดสอบย่อยการให้ความรู้เป็นการทดสอบย่อยด้วยวาจาครั้งแรกที่นำเสนอในทั้งสามระดับและทำหน้าที่เป็นวิธีการที่ดีในการสร้างความสามัคคีกับผู้ทำการทดสอบ ได้ใช้ความพยายามอย่างมากเพื่อหลีกเลี่ยงคำถามเกี่ยวกับเรื่องพิเศษ

ตอนที่ 3การทดสอบความสามารถ

ความรู้. การมอบหมายครั้งแรกของเขานั้นง่ายพอสำหรับผู้สอบส่วนใหญ่ เว้นแต่พวกเขาจะปัญญาอ่อนหรือมีอาการสับสน ในกรณีเช่นนี้ ผู้ทดสอบสามารถตัดสินใจยุติการทดสอบได้อย่างรวดเร็ว คำถามของการทดสอบย่อย "การรับรู้" ในเวอร์ชัน WAIS-Rและ WISC-IIIเกี่ยวข้องกับข้อเท็จจริงที่คนส่วนใหญ่ที่อาศัยอยู่ในสหรัฐอเมริกามีโอกาสค้นพบมากที่สุด เช่น "เดือนใดมาก่อนเดือนธันวาคม" หรือ "ใครคือมาร์ก ทเวน" ในเวอร์ชัน WPPSI-Rแนะนำคำถามที่คล้ายกันแม้ว่าจะมีระดับความยากต่ำกว่า อันที่จริง เวอร์ชันนี้เริ่มต้นด้วยงานที่นำเสนอในรูปแบบภาพ ซึ่งต้องแสดงคำตอบที่ถูกต้องเท่านั้น ตัวอย่างเช่น เมื่อนำเสนอภาพสิ่งของในครัวเรือนหลายชิ้น เด็กอาจถูกถามว่าใช้อันใดในการทำความสะอาด การทดสอบย่อย "เลขคณิต" เป็นอีกหนึ่งการวัดทางวาจาที่แสดงให้เห็นถึงความยากที่หลากหลายในกลุ่มเครื่องชั่ง Wecksler ในงานเลขคณิตที่ง่ายที่สุด WPPSI-Rต้องแสดงเพียงรายการเดียวในแถวที่แสดงแนวคิดเชิงปริมาณ (เช่น "เล็กที่สุด" หรือ "ใหญ่กว่า") งานที่ซับซ้อนมากขึ้นอาจเกี่ยวข้องกับการคำนวณหรือการแก้ปัญหาทางคณิตศาสตร์ ซึ่งยากที่สุดที่ต้องใช้ความชำนาญของเศษส่วน