فرهنگ امروز/ ابراهیم طلائی. عضو هیئتعلمی دانشگاه تربیت مدرس:
چهلوسومین کنفرانس سالانه انجمن بینالمللی سنجش آموزش که در گرجستان برگزار شد، بهانهای برای توجه مجدد به یکی از عناصر مهم آموزش، یعنی سنجش و ارزشیابی بود. در این پنج روز و در ارائههایی که کشورها درباره نظام سنجش و ارزشیابی، کنترل و تضمین کیفی، آموزشسنجی، سنجش آموختهها، نظام مدرکدهی، ساختار و سازوکار خروج دانشآموزان از نظام آموزشوپرورش و ورود به آموزش عالی ارائه داشتند، فرصتی فراهم آمد تا آنچه را در این کشورها میگذرد، بشنوم و همچنین در جریان پیشرفتهای علمی متخصصان و مراکز تخصصی اندازهگیری و سنجش دانشگاهها قرار گیرم. در نهایت هم فرصتی شد تا ساختار اداری و ارتباط منطقی و غیرمنطقی بین دولت، بخش خصوصی و معلمان را در حوزه سنجش و ارزشیابی بررسی کنم.
معرفی انجمن بینالمللی سنجش آموزش
انجـــمن بینالمــللی سنــــجش آمـــوزش
(International association for educational assessment) از سال ١٩٧٤ شکل گرفت و تقریبا هر ساله یک کنفرانس بینالمللی با حضور هر دو بخش آکادمیک (متخصان سنجش و ارزشیابی دانشگاهی) و سیاستگذار (مرکز سنجش وزارتخانههای آموزشوپرورش کشورها) برگزار کرده است. هدف از شکلگیری این انجمن تبادل دانش، تخصص، تجربه و مهارتهایی در حوزه سنجش و ارزشیابی آموزشی است که بتواند به بهبود و بهسازی آموزش کمک کند. این انجمن بهعنوان نهادی غیردولتی، برای کشورها و نهادهایی همچون یونسکو نقش مشاور را نیز ایفا کرده و در پروژههای ارزشیابی برنامهای و آموختهها با این نهادها و کشورها همکاری میکند. نزدیک به ٢٠٠ نهاد از کشورهای مختلف عضو انجمن مذکور هستند. سایت این انجمن (www. iaea. info) دربردارنده مقالات و مباحث کنفرانسهای سالهای پیش نیز هست.
کنفرانس امسال (٢٠١٧) به میزبانی مرکز سنجش آموزشوپرورش گرجستان و در شهر ساحلی باتومی برگزار شد و کنفرانس سال آینده (٢٠١٨) در شهر آکسفورد انگلستان و به میزبانی مرکز سنجش آموزش دپارتمان تعلیم و تربیت دانشگاه آکسفورد برگزار خواهد شد. مرکز سنجش و امتحانات (National Assessment and Examination Centre) گرجستان در سال ٢٠٠٢ از سوی وزارت آموزشوپرورش این کشور تأسیس شد و بزرگترین سازمان حرفهای در حوزه سنجش آموزش در گرجستان است. این مرکز بیش از ١٤ سال است که تنها مرجع مدیریت و اجرای آزمونهای خطیر و بزرگی همچون امتحان نهایی دیپلم است که بهصورت کامپیوتری اجرا میشود و مدعی هستند که بزرگترین (از نظر تعداد شرکتکنندگان) آزمون در نوع خود در اروپا است. حدود ٢٠٠ نفر پرسنل حرفهای دارند که خدمات خود را به مدارس و ادارات و حتی خارج از کشور میفروشند. هرساله بهمنظور کمک به دانشجویان دکترا و ارشد برای شرکت در کنفرانسهای سالانه انجمن، بورس کمکهزینهای هم ارائه میدهند (هزینه بلیت و اسکان و شرکت در کنفرانس) که امسال دانشجویی از ایران (از دانشگاه شیراز) موفق به اخذ آن شده بود و در کنفرانس شرکت کرده بود. ایشان و من، تنها شرکتکنندگان ایرانی در کنفرانس مذکور بودیم!
مضمونهای اصلی طرحشده در کنفرانس ٤٣
١) تخصصی و حرفهبودن تولید سؤال خوب: برای تولید آزمونی که قابلاطمینان باشد و براساس آن بتوان تصمیمگیریهایی را انجام داد (یا اصطلاحا آزمونهای خطیر) همچون آزمونهای نهایی دیپلم و کنکور سراسری، مسیر تخصصی و مراحل ١٢گانه خاصی باید طی شود که این دقت برای تولید آن آزمون هزینه قابلتوجهای میطلبد و مهمتر اینکه، لازم است از در دسترس قراردادن سهل و سریع چنین آزمونهای گرانی جلوگیری شود. این آزمونها لزوما چهارجوابی نیستند یا اصلا نباید تا حد زیادی از آنها چهارجوابی باشند، چراکه سؤالات چهارجوابی محدودیتهای ویژهای دارند که تشخیص سره از ناسره را سخت میکند و درعینحال امکانهایی را فراهم میآورد که از یک طرف شانس را در کار دخیل میکند و از طرف دیگر، «مسیر رسیدن به هدف» ارزشمند جلوه نمیکند و نتیجه مهمتر از فرایند میشود. البته چنین آزمونهایی هم گران تولید میشوند و هم گران تصحیح و گزارش میشوند، اما کشورها چارهای جز رفتن به سمت این انتخاب و فرارکردن از ورطه هولناک سؤالات چهارجوابی ندارند. برای همین موضوع، چنین آزمونهایی نباید بهراحتی و بلافاصله در دسترس قرار گیرند و امکان خرید و فروش پیدا کنند. ارزشیابی از آموزش در سه سطح کاربرد دارد: سطح فردی (پذیرش یا سطحبندی، مدرکدهی)، سطح کلاسی (در خدمت تدریس معلم، دادن بازخورد به معلم و دانشآموز و والدین)، سطح نظام آموزشی (کنترل و نظارت عملکرد نظام آموزشی برای ارائه بازخورد به سیاستگذاران...). نمیتوان همه این سه سطح کاربرد را یکجا و با یک آزمون محقق کرد. انتظار از هر آزمون را باید واقعبینانه کرد. برای آزمونهای خطیری همچون کنکور و امتحانات نهایی که سطح فردی درنظر است و جایگاه و سرنوشت افراد را تعیین میکند، نمیتوان با مجموعهای از سؤالات چهارگزینهای به نتیجه مطلوب رسید و افراد را در جایگاهی گذاشت که حقشان است.
٢) تکنولوژیهای پیشرفته در حوزه سنجش: تصحیح اوراق الکترونیکی، گزارشدهی الکترونیکی و بهویژه تصحیح و نمرهدهی آزمونهای تشریحی در دنیا کشف و خلق شده است که آموزشوپرورش و بخشهای خصوصی از آنها درراستای تولید و تنوعبخشی به آزمونها و همچنین تصحیح در تعداد کلان بهره میبرند. این تکنولوژیها گرچه به نهایت صحت و بهرهوری نرسیدهاند، اما تحقیقات ارائهشده نشان میداد که همراستایی و همبستگی بالایی بین آزمونهای تشریحی تصحیحشده با ماشین و انسان وجود داشته و آن میزان غیرهمراستایی را میتوان در قبال آوردههای باارزش آن روش، نادیده گرفت یا با تصحیح انسانی، آن را تکمیل کرد. کشور هلند هم در این زمینه پیشرفتهای قابل مطالعه و توجهی را داشته است. آنها از سال ٢٠٠٥ قدم در این مسیر گذاشتهاند و در سه فاز (٢٠٠٥-٢٠١٠، ٢٠١٠-٢٠١٥، ٢٠١٥ تا ٢٠٢٠) موضوع تولید نرمافزار، امنیت آن، تولید سؤال، تصحیح الکترونیکی (e-marking)، تولید گزارشهای کلان، مقایسههایی در سطح فرد، کلاس، مدرسه و منطقه و استان را دنبال کردهاند. یکی از درس آموختههای آنان این است که نمیتوان «ساختار سازمانی و کیفیت نیروی انسانی» سازمانیای را که تاکنون آزمون قلم و کاغذی تولید و اجرا و تصحیح و گزارش میکرده، برای سازمانی که قرار است ارزشیابی الکترونیکی (e-assessment) برگزار کند، حفظ کرد؛ چراکه اساسا این سازمان جدید فقط متشکل از یک گروه یکدست آموزشی (معلم) نیست، بلکه کار تیمی است که متخصصان آموزش، فناوری، نرمافزار، امنیت، چندرسانهای، مدارس، وزرات آموزشوپرورش، بخش خصوصی و دانشگاهی در کنار هم این هدف را محقق میکنند و نیازمند تغییر الگوی سازمانی است. تجربه هلندیها نشان میدهد که اگرچه آزمونهای الکترونیکی در ابتدا زمانبر و انرژیبر هستند اما در بلندمدت هم حجم کاری را کاهش میدهند و هم امکان سنجش شایستگیهایی را میدهند که جدا از ارزش افزوده آموزشوپرورش است (همانند سخت هستگی و پشت کار، نبریدن در برابر مشکلات خرد و کلان زندگی و روی نیاوردن به مخدرها برای فرار از این سختیها...).
٣) فساد در ارزشیابی: گرجستان در چند سال پیش چالشی جدی برای برگزاری آزمون نهایی دیپلم داشته است: اعتبار سؤالات آزمون، فساد ایجادشده در آزمون (هم در بعد لورفتن سؤالات و هم در بعد ایجاد بازار نمره بهدست معلمان خبره!)، میانگین پایین کشوری در دروس اصلی دیپلم. بنابراین وزارت آموزشوپرورش تصمیم گرفت آزمون را با حمایت بخشهای خصوصی و موسسات
علمی-بینالمللی برگزار کند، بهطوریکه فساد ایجادشده جمع شود، دروس بیشتری را شامل شود، در زمان کوتاهی در داخل مدارس اجرا شود و نسبت هزینه به فایده آن منطقی باشد. قرار شد در پروسهای سه ساله این کار انجام شود اما در عمل بهدلیل فشارهای سیاستگذاران در ١٠ ماه بهطور ناقص انجام شد. آنها میگویند ما توان این را داشتیم اما زمان کم و نبود نرمافزار مانع از اجرای بهینه کار شد. در نهایت یک آزمون خطیر و پرفساد را مبتنی بر رایانه برای ٤٧٠٠٠ دانشآموز در ١٦٠٠ مدرسه با ١٠ هزار رایانه برای هشت درس اجرا کردند. درحالحاضر هم نتایج مد نظرشان خصوصا رفع فساد محقق شده است.
٤) اعتماد عمومی به نمره بهعنوان حکم داور (معلم): هرگاه این اعتماد، سلب شده، کل نظام داوری (ارزشیابی) زیر سؤال میرود. در آینده سنجش و ارزشیابی آموزشی این موضوع اهمیت بالایی دارد که نظام ارزشیابی و معلمان میخواهند چه جایگاه و پایگاهی نزد افکار عمومی برای خود داشته باشند و نمره (حکم داوری معلم) چه ارزش مکانیای را برای خود داراست. اگر فساد در داوری وارد شود و نمره، معرف توان فرد نباشد و جایگاه بعدی فرد نشان دهد آن حکم و تصمیم (قبولی یا رد در امتحان) نادرست بوده، دیگر سنگ روی سنگ برای رخنه در حکم معلم و گسترش فساد، بند نمیشود. کسب مجدد اعتماد مردم طولانیمدت است.
٥) سنجش ١٨٠ درجه: اصلی وجود دارد که اگر اهداف برنامه درسی در ارزشیابی-با تناظر یک به یک- متجلی نشود، به احتمال بسیار زیاد، آن اهداف معطل باقی میمانند؛ یعنی نه در آموزش و تدریس معلم انکاس مییابد و نه در یادگیری یادگیرنده. درحالحاضر تخمین زده میشود سنجش فعلی در کشورها، حدود ٤٥ درجه از ١٨٠ درجه اهداف را هدف گرفتهاند و این ٤٥ درجه همان اهدافی است که راحتتر به چنگ سنجش و تصحیح و نمرهدهی درمیآیند (همانند دانش کودک از مفاهیم و حقایق علوم، یا دانش او از ارائههای ادبی، حل مسائل ریاضی...) و از جنس اهداف دانشی هستند. ٤٥ درجه دیگر را ناظر بر ایده اصلی یا کلیدی هر درس میدانیم؛ یعنی اهدافی که در پسِ موضوعات علوم، ریاضی، فارسی و تاریخ و جغرافیا مد نظر است. همانند مهارت پرسشگری و خلق فرضیه و آزمون فرضیه در درس علوم، مهارت تعمیم و تخصیص، حدس و استدلال در درس ریاضی... این مهارتهای کلیدی در قالب عباراتی کلی و اصلی برای هر درس ذکر میشود که مثلا برای چه ما تقسیم و اعشار را به کودک آموزش میدهیم. برای یادگیری خودِ اعشار یا در پسِ اعشار، مهارتی کلیدی برای زندگی مد نظر است. این اهداف معمولا تجلی زیادی در ارزشیابیها ندارند و برای همین هم در تدریس معلم و یادگیری بچهها، کمتر جلوه میکند. اما ٩٠ درجه باقیمانده ناظر بر چیست؟ این ٩٠ درجه ناظر بر آنچه اصطلاحا مهارتهای عمومی یا کلیدی یا قرن بیستویکی مینامند، است؛ مهارتهایی همچون همدلی، مهرورزی، صبر، پشت کار، سخت هستگی، سختکوشی، کفایت در برابر استرس، تابآوری، ارتباطگیری، خودابرازی، اعتمادبهنفس، خلق، جرئتورزی، کارآفرینی، تعادل بین کار و تفریح، عشق، دوستداشتن، پایبندی به اصول انسانی، تعامل و تفاعل، دگراندیشی... . سنجش این موارد را سنجش حوزههای سخت (hard to assess areas) نامیدهاند و کمتر در ارزشیابیهای متداول متجلی میشود و به همین نسبت در تدریس معلم و یادگیری بچهها هم کمرنگ است. کشورهای حاضر در این کنفرانس هم برای این ١٣٥ درجه مغفول کار را تمام نکردهاند اما آغاز کردهاند. این امور با توان بخش دولتی سازگار نیست و معمولا بخشهای خصوصی به اتفاق بخشهای دانشگاهی ورود پیدا کردهاند و کار را با تعاون با بخش دولتی به جایی رساندهاند. در ایران بخش خصوصی سنجش و ارزشیابی کشور توان مالی و سرمایهگذاری این بخش را دارد اما یا خود را بینیاز از دانشگاه میانگارد یا دولتیها اجازه ورود به آنها را ندادهاند یا تمایلی به این بخش نمیبیند چون برگشت مالی در آن نمیبیند. بنابراین انرژی و ثروت خویش را در بخشی صرف میکنند که همان ٤٥ درجه اهداف را بیشتر لحاظ نمیکند.
روزنامه شرق
نظر شما