شناسهٔ خبر: 53143 - سرویس دیگر رسانه ها

ارزشیابی و سنجش: اهرم اصلاح آموزش

تحلیلی بر یافته‌های کنفرانس «انجمن بین‌المللی سنجش آموزش»

فرهنگ امروز/ ابراهیم طلائی. عضو هیئت‌علمی دانشگاه تربیت مدرس:

چهل‌‌و‌سومین کنفرانس سالانه انجمن بین‌المللی سنجش آموزش که در گرجستان برگزار شد، بهانه‌ای برای  توجه مجدد به یکی از عناصر مهم آموزش، یعنی سنجش و ارزشیابی بود. در این پنج روز و در ارائه‌هایی که کشورها درباره نظام سنجش و ارزشیابی، کنترل  و تضمین کیفی، آموزش‌سنجی، سنجش آموخته‌ها، نظام مدرک‌دهی،  ساختار و سازوکار خروج دانش‌‌آموزان از نظام آموزش‌وپرورش و ورود به آموزش عالی ارائه داشتند، فرصتی فراهم آمد تا آنچه را در این کشورها می‌گذرد، بشنوم و همچنین در جریان پیشرفت‌های علمی متخصصان و مراکز تخصصی‌ اندازه‌گیری و سنجش دانشگاه‌ها قرار گیرم. در نهایت هم فرصتی شد تا ساختار اداری و ارتباط منطقی و غیرمنطقی بین دولت، بخش خصوصی و معلمان را در حوزه سنجش و ارزشیابی بررسی کنم.
معرفی انجمن بین‌المللی سنجش آموزش
انجـــمن بین‌المــللی سنــــجش آمـــوزش
 (International association for educational assessment) از سال ١٩٧٤ شکل گرفت و  تقریبا هر ساله یک کنفرانس بین‌المللی با حضور هر دو بخش آکادمیک (متخصان سنجش و ارزشیابی دانشگاهی)  و سیاست‌گذار (مرکز سنجش وزارتخانه‌های آموزش‌وپرورش کشورها) برگزار کرده است. هدف از شکل‌گیری این انجمن تبادل دانش، تخصص، تجربه و مهارت‌هایی در حوزه سنجش و ارزشیابی آموزشی است که بتواند به بهبود و بهسازی آموزش کمک کند. این انجمن به‌عنوان نهادی غیردولتی، برای کشورها و نهادهایی همچون یونسکو نقش مشاور را نیز ایفا کرده و در پروژه‌های ارزشیابی برنامه‌ای و آموخته‌ها با این نهادها و کشورها همکاری می‌کند. نزدیک به ٢٠٠ نهاد از کشورهای مختلف عضو انجمن مذکور هستند. سایت این انجمن (www. iaea. info) دربردارنده مقالات و مباحث کنفرانس‌های سال‌های پیش نیز هست.
کنفرانس امسال (٢٠١٧) به میزبانی مرکز سنجش آموزش‌وپرورش گرجستان و در شهر ساحلی باتومی برگزار شد و کنفرانس سال آینده (٢٠١٨) در شهر آکسفورد انگلستان و به میزبانی مرکز سنجش آموزش دپارتمان تعلیم و تربیت دانشگاه آکسفورد برگزار خواهد شد. مرکز سنجش و امتحانات  (National Assessment and Examination Centre) گرجستان در سال ٢٠٠٢ از سوی وزارت آموزش‌وپرورش این کشور تأسیس شد و بزرگ‌ترین سازمان حرفه‌ای در حوزه سنجش آموزش در گرجستان است. این مرکز بیش از ١٤ سال است که تنها مرجع مدیریت و اجرای آزمون‌های خطیر و بزرگی همچون امتحان نهایی دیپلم است که به‌صورت کامپیوتری اجرا می‌شود و مدعی هستند که بزرگ‌ترین (از نظر تعداد شرکت‌کنندگان) آزمون در نوع خود در اروپا است. حدود ٢٠٠ نفر پرسنل حرفه‌ای دارند که خدمات خود را به مدارس و ادارات و حتی خارج از کشور می‌فروشند. هرساله به‌منظور کمک به دانشجویان دکترا و ارشد برای شرکت در کنفرانس‌های سالانه انجمن،  بورس کمک‌هزینه‌ای هم ارائه می‌دهند (هزینه بلیت و اسکان و شرکت در کنفرانس) که امسال دانشجویی از ایران (از دانشگاه شیراز) موفق به اخذ آن شده بود و در کنفرانس شرکت کرده بود. ایشان و من، تنها شرکت‌کنندگان ایرانی در کنفرانس مذکور بودیم!
مضمون‌های اصلی طرح‌شده در کنفرانس ٤٣
١) تخصصی و حرفه‌بودن تولید سؤال خوب: برای تولید آزمونی که قابل‌اطمینان باشد و براساس آن بتوان تصمیم‌گیری‌هایی را انجام داد (یا اصطلاحا آزمون‌های خطیر) همچون آزمون‌های نهایی دیپلم و کنکور سراسری، مسیر تخصصی و مراحل ١٢گانه خاصی باید طی شود که این دقت برای تولید آن آزمون هزینه قابل‌توجه‌ای می‌طلبد و مهم‌تر اینکه، لازم است از در دسترس قرار‌دادن سهل و سریع چنین آزمون‌های گرانی جلوگیری شود. این آزمون‌ها لزوما چهارجوابی نیستند یا اصلا نباید تا حد زیادی از آنها چهارجوابی باشند، چراکه سؤالات چهارجوابی محدودیت‌های ویژه‌ای دارند که تشخیص سره از ناسره را سخت می‌کند و در‌عین‌حال امکان‌هایی را فراهم می‌آورد که از یک طرف شانس را در کار دخیل می‌کند و از طرف دیگر، «مسیر رسیدن به هدف» ارزشمند جلوه نمی‌کند و نتیجه مهم‌تر از فرایند می‌شود. البته چنین آزمون‌هایی هم گران تولید می‌شوند و هم گران تصحیح و گزارش می‌شوند، اما کشورها چاره‌ای جز رفتن به سمت این انتخاب و فرار‌کردن از ورطه هولناک سؤالات چهارجوابی ندارند. برای همین موضوع، چنین آزمون‌هایی نباید به‌راحتی و بلافاصله در دسترس قرار گیرند و امکان خرید و فروش پیدا کنند. ارزشیابی از آموزش در سه سطح کاربرد دارد: سطح فردی (پذیرش یا سطح‌بندی، مدرک‌دهی)، سطح کلاسی (در خدمت تدریس معلم، دادن بازخورد به معلم و دانش‌آموز و والدین)، سطح نظام آموزشی (کنترل و نظارت عملکرد نظام آموزشی برای ارائه بازخورد به سیاست‌گذاران...). نمی‌توان همه این سه سطح کاربرد را یک‌جا و با یک آزمون محقق کرد. انتظار از هر آزمون را باید واقع‌بینانه کرد. برای آزمون‌های خطیری همچون کنکور و امتحانات نهایی که سطح فردی درنظر است و جایگاه و سرنوشت افراد را تعیین می‌کند، نمی‌توان با مجموعه‌ای از سؤالات چهارگزینه‌ای به نتیجه مطلوب رسید و افراد را در جایگاهی گذاشت که حقشان است.
٢) تکنولوژی‌های پیشرفته‌ در حوزه سنجش: تصحیح اوراق الکترونیکی، گزارش‌‌دهی الکترونیکی و به‌ویژه تصحیح و نمره‌دهی آزمون‌های تشریحی در دنیا کشف و خلق شده است که آموزش‌وپرورش و بخش‌های خصوصی از آنها درراستای تولید و تنوع‌بخشی به آزمون‌ها و همچنین تصحیح در تعداد کلان بهره می‌برند. این تکنولوژی‌ها گرچه به نهایت صحت و بهره‌وری نرسیده‌اند، اما تحقیقات ارائه‌شده نشان می‌داد که هم‌راستایی و همبستگی بالایی بین آزمون‌های تشریحی تصحیح‌شده با ماشین و انسان وجود داشته و آن میزان غیرهم‌راستایی را می‌توان در قبال آورده‌های باارزش آن روش، نادیده گرفت یا با تصحیح انسانی، آن را تکمیل کرد. کشور هلند هم در این زمینه پیشرفت‌های قابل مطالعه و توجهی را داشته است. آنها از سال ٢٠٠٥ قدم در این مسیر گذاشته‌اند و در سه فاز (٢٠٠٥-٢٠١٠، ٢٠١٠-٢٠١٥، ٢٠١٥ تا ٢٠٢٠) موضوع تولید نرم‌افزار، امنیت آن، تولید سؤال، تصحیح الکترونیکی (e-marking)، تولید گزارش‌های کلان، مقایسه‌هایی در سطح فرد، کلاس، مدرسه و منطقه و استان را دنبال کرده‌اند. یکی از درس آموخته‌های آنان این است که نمی‌توان «ساختار سازمانی و کیفیت نیروی انسانی» سازمانی‌ای را که تاکنون آزمون قلم و کاغذی تولید و اجرا و تصحیح و گزارش می‌کرده، برای سازمانی که قرار است ارزشیابی الکترونیکی (e-assessment) برگزار کند، حفظ کرد؛ چراکه اساسا این سازمان جدید فقط متشکل از یک گروه یک‌دست آموزشی (معلم) نیست، بلکه کار تیمی است که متخصصان آموزش، فناوری، نرم‌افزار، امنیت، چندرسانه‌ای، مدارس، وزرات آموزش‌وپرورش، بخش خصوصی و دانشگاهی در کنار هم این هدف را محقق می‌کنند و نیازمند تغییر الگوی سازمانی است. تجربه هلندی‌ها نشان می‌دهد که اگرچه آزمون‌های الکترونیکی در ابتدا زمان‌بر و انرژی‌بر هستند اما در بلندمدت هم حجم کاری را کاهش می‌دهند و هم امکان سنجش شایستگی‌هایی را می‌دهند که جدا از ارزش افزوده آموزش‌وپرورش است (همانند سخت هستگی و پشت کار، نبریدن در برابر مشکلات خرد و کلان زندگی و روی نیاوردن به مخدرها برای فرار از این سختی‌ها...).
٣) فساد در ارزشیابی: گرجستان در چند سال پیش چالشی جدی برای برگزاری آزمون نهایی دیپلم داشته است: اعتبار سؤالات آزمون، فساد ایجادشده در آزمون (هم در بعد لو‌رفتن سؤالات و هم در بعد ایجاد بازار نمره به‌دست معلمان خبره!)، میانگین پایین کشوری در دروس اصلی دیپلم. بنابراین وزارت آموزش‌وپرورش تصمیم گرفت آزمون را با حمایت بخش‌های خصوصی و موسسات
علمی-بین‌المللی برگزار کند، به‌طوری‌که فساد ایجادشده جمع شود، دروس بیشتری را شامل شود، در زمان کوتاهی در داخل مدارس اجرا شود و نسبت هزینه به فایده آن منطقی باشد. قرار شد در پروسه‌ای سه ساله این کار انجام شود اما در عمل به‌دلیل فشارهای سیاست‌گذاران در ١٠ ماه به‌طور ناقص انجام شد. آنها می‌گویند ما توان این را داشتیم اما زمان کم و نبود نرم‌افزار مانع از اجرای بهینه کار شد. در نهایت یک آزمون خطیر و پر‌فساد را مبتنی بر رایانه برای ٤٧٠٠٠ دانش‌آموز در ١٦٠٠ مدرسه با ١٠ هزار رایانه برای هشت درس اجرا کردند. در‌حال‌حاضر هم نتایج مد نظرشان خصوصا رفع فساد محقق شده است.
٤) اعتماد عمومی به نمره به‌عنوان حکم داور (معلم): هرگاه این اعتماد، سلب ‌شده، کل نظام داوری (ارزشیابی) زیر سؤال می‌رود. در آینده سنجش و ارزشیابی آموزشی این موضوع اهمیت بالایی دارد که نظام ارزشیابی و معلمان می‌خواهند چه جایگاه و پایگاهی نزد افکار عمومی برای خود داشته باشند و نمره (حکم داوری معلم) چه ارزش مکانی‌ای را برای خود داراست. اگر فساد در داوری وارد شود و نمره، معرف توان فرد نباشد و جایگاه بعدی فرد نشان دهد آن حکم و تصمیم (قبولی یا رد در امتحان) نادرست بوده، دیگر سنگ روی سنگ برای رخنه در حکم معلم و گسترش فساد، بند نمی‌شود. کسب مجدد اعتماد مردم طولانی‌مدت است.
٥) سنجش ١٨٠ درجه: اصلی وجود دارد که اگر اهداف برنامه درسی در ارزشیابی-با تناظر یک به یک- متجلی نشود، به احتمال بسیار زیاد، آن اهداف معطل باقی می‌مانند؛ یعنی نه در آموزش و تدریس معلم انکاس می‌یابد و نه در یادگیری یادگیرنده. در‌حال‌حاضر تخمین زده می‌شود سنجش فعلی در کشورها، حدود ٤٥ درجه از ١٨٠ درجه اهداف را هدف گرفته‌اند و این ٤٥ درجه همان اهدافی است که راحت‌تر به چنگ سنجش و تصحیح و نمره‌دهی درمی‌آیند (همانند دانش کودک از مفاهیم و حقایق علوم، یا دانش او از ارائه‌های ادبی، حل مسائل ریاضی...) و از جنس اهداف دانشی هستند. ٤٥ درجه دیگر را ناظر بر ایده اصلی یا کلیدی هر درس می‌دانیم؛ یعنی اهدافی که در پسِ موضوعات علوم، ریاضی، فارسی و تاریخ و جغرافیا مد نظر است. همانند مهارت پرسشگری و خلق فرضیه و آزمون فرضیه در درس علوم، مهارت تعمیم و تخصیص، حدس و استدلال در درس ریاضی... این مهارت‌های کلیدی در قالب عباراتی کلی و اصلی برای هر درس ذکر می‌شود که مثلا برای چه ما تقسیم و اعشار را به کودک آموزش می‌دهیم. برای یادگیری خودِ اعشار یا در پسِ اعشار، مهارتی کلیدی برای زندگی مد نظر است. این اهداف معمولا تجلی زیادی در ارزشیابی‌ها ندارند و برای همین هم در تدریس معلم و یادگیری بچه‌ها، کمتر جلوه می‌کند. اما ٩٠ درجه باقی‌مانده ناظر بر چیست؟ این ٩٠ درجه ناظر بر آنچه اصطلاحا مهارت‌های عمومی یا کلیدی یا قرن بیست‌ویکی می‌نامند، است؛ مهارت‌هایی همچون همدلی، مهرورزی، صبر، پشت کار، سخت هستگی، سخت‌کوشی، کفایت در برابر استرس، تاب‌آوری، ارتباط‌گیری، خودابرازی، اعتمادبه‌نفس، خلق، جرئت‌ورزی، کارآفرینی، تعادل بین کار و تفریح، عشق، دوست‌داشتن، پایبندی به اصول انسانی، تعامل و تفاعل، دگراندیشی... . سنجش این موارد را سنجش حوزه‌های سخت (hard to assess areas) نامیده‌اند و کمتر در ارزشیابی‌های متداول متجلی می‌شود و به همین نسبت در تدریس معلم و یادگیری بچه‌ها هم کم‌رنگ است. کشورهای حاضر در این کنفرانس هم برای این ١٣٥ درجه مغفول کار را تمام نکرده‌اند اما آغاز کرده‌اند. این امور با توان بخش دولتی سازگار نیست و معمولا بخش‌های خصوصی به اتفاق بخش‌های دانشگاهی ورود پیدا کرده‌اند و کار را با تعاون با بخش دولتی به جایی رسانده‌اند. در ایران بخش خصوصی سنجش و ارزشیابی کشور توان مالی و سرمایه‌گذاری این بخش را دارد اما یا خود را بی‌نیاز از دانشگاه می‌انگارد یا دولتی‌ها اجازه ورود به آنها را نداده‌اند یا تمایلی به این بخش نمی‌بیند چون برگشت مالی در آن نمی‌بیند. بنابراین انرژی و ثروت خویش را در بخشی صرف می‌کنند که همان ٤٥ درجه اهداف را بیشتر لحاظ نمی‌کند.
 

روزنامه شرق