کاربرد “اندازه اثر” در روش شناسی DIF
کاربرد “اندازه اثر” در روش شناسی DIF
به طور کلی توصیه شده است که در زمان کار با آزمونهای آماری، نتیجه را در آن زمینهی خاص از طریق اندازه های اثر آزمون کرد(کیرک،1996)، چون در حجم ها ی پایین نمونه ممکن است از لحاظ آماری نتایج معنادار نباشد؛ حال آنکه اندازهی اثر معنادار باشد، از طرف دیگر ممکن است حجم بالای نمونه به طور کاذب منجر به معناداری نتایج شود؛ حال آنکه اندازهی اثر مقدار کوچکی داشته باشد. بنابراین توصیه شده که در مطالعات DIF، اندازهی اثر به همراه آزمون معناداری ارائه شود و این منجر به قضاوت صحیحتر در مورد حضور یا عدم حضور DIF در یک سوال میشود، علاوه بر اینکه شناسایی نتایج غلط ممکن میشود.
جودوین و گیرل(2001) به منظور ارزشیابی خطای نوع اول و توان آزمون “اندازه اثر”LR DIF مطالعات شبیه سازی شده را انجام دادند. آمارهی حداقل مجذورات وزنی، مقدار DIF یکنواخت و غیر یکنواخت را به صورت کمی ارائه میدهد. این آماره به عنوان “اندازهی اثر” روش LR DIF محسوب میشود. زومبو و توماس(1996) مشخص کردند برای آزمون معناداری DIF رگرسیون لجستیک به دو آزمون 〖 x〗^2با دو درجه آزادی و یک اندازه از بزرگی اثر احتیاج است. آنها برای اندازه گیری ”اندازه اثر” در رگرسیون لجستیک R2 را بر آمارههای دیگر ترجیح دادند. برای این که یک سوال به عنوان سوال دارای DIF تشخیص داده شود باید آزمون مجذور خی با دو درجهی آزادی در رگرسیون لجستیک ارزش P کمتر یا برابر 01/0 داشته باشد و همچنین “اندازه اثر” زومبو و توماس حداقل از 13/0 بیشتر باشد. تحقیقات پاپ و همکاران (1997) نشان داده است که مقیاس “اندازه اثر” زومبو و توماس همبستگی بالایی با تکنیک های دیگر DIF از قبیل منتل هنزل و SIBTEST دارد.x^2 با دو درجهی آزادی میتواند به دو آزمون با یک درجه آزادی برای آزمونهای یکنواخت و غیر یکنواخت تبدیل شود(جودوین و گیرل، 2001). جودوین و گیرل(2001) دریافتند که اگر آزمونهای یکنواخت و غیر یکنواخت در تعامل با “اندازهی اثر” به دو آزمون جدا تبدیل شوند، روش اتخاذ شده منجر به قدرت بیشتری در کشف DIF یکنواخت و غیر یکنواخت نسبت به زمانی خواهد شد که از یک آزمون x^2 با دو درجهی آزادی استفاده میکنیم. این وضعیت حتی زمانی که از نمونههای با حجم کوچک استفاده میکنیم نیز صادق است. آنها ذکر میکنند اگر “اندازه اثر” برای LR DIF وجود داشته باشد میتوان آزمون x^2 با دو درجه آزادی را به دو آزمون جداگانه با یک درجه آزادی تبدیل کرد. آنها دریافتند در صورتی که آزمونهای یکنواخت و غیر یکنواخت در دو آزمون جداگانه باشند و در عین حال از طریق “اندازهی اثر” به هم مربوط شوند، نتایج برآمده نسبت به زمانی که آزمونهای با دو درجه آزادی استفاده میشود، قدرت بالاتری در کشف DIF یکنواخت و غیر یکنواخت خواهند داشت، حتی اگر حجم نمونه کوچک تر شود. به دلیل توان بالای آزمونهای با یک درجه آزادی جودوین و گیرل(2001) استفاده از آزمونهای با یک درجه آزادی را برای کشف DIF یکنواخت و غیر یکنواخت پیشنهاد کردند. این آزمونها احتمال کشف DIF یکنواخت و غیر یکنواخت را افزایش داده و میزان خطای نوع اول را کاهش میدهد. توضیح “اندازهی اثر”R2 ∆ برای LR DIF در ادامه میآید.
R2∆: اندازه ا ثر LR DIF
فرمول LR DIF براساس بیان سوامیناتان و رگرز(1990) به صورت زیر است:
P(uij = 1|өij) = e(βoj+ β1jө1j)/[1 + e(βoj+ β1jө1j)],
J=1,2 & i=1,….,nj
B0پارامتر قاطع(عرض از مبدا)، B1 پارامتر شیب، u پاسخ به سوال و θ توانایی فرد میباشند. اگر چه این معادله خطی نیست اما توسط زومبو و توماس(1996) به صورت خطی تبدیل شده است. مدل معادله خطی به صورت زیر است:
Ln (P/1-P) =τ0 +τ1 +τ2g +τ3 (өg).
P احتمال پاسخ صحیح به سوالات وg بیانگر عضویت در گروه g است.
زمانی که از نتایج پرگیبون (1998) مربوط به بردار برآورد درستنمایی بیشینه، تاو، برای ضریب LR در معادلهی بالا استفاده میشود، معادله تبدیل به یک مدل حداقل مجذورات وزنی میشود. فرمول برای برآورد پیشینهی درستنمایی، تاو(τ) به صورت زیر است:
τ = (X’VX)-1 X’Vz
که در آنXτ+ V-1 Z= و r=(u=p)، v یک ماتریس قطری N*N با مولفههای Pi(1-Pi) میباشد،I=1,.......,N یک ماتریس دادههای N*4 است که ردیف های آن (1,θI,gi,θigi) میباشد. P یک بردارN*1 از ارزشهای برازش یافتهی مدل LR است، U یک بردار N*1 از پاسخ آزمودنیها و N جمع حجم نمونه مربوط به گروههای هدف و مرجع است(جودوین و گیرل، 2001).
به منظور توضیح LR DIF از طریق مدل حداقل مجذورات، زومبو و توماس(1996) بوسیلهی هندسهی مربوط به حداقل مجذورات ثابت کردند که اضافه کردن متغیرهای توضیحی و تبیینی میتواند ایدهی قابل قبولی باشد.
جودوین(2001) R12 و R22 را مجموع حاصل ضرب ضرایب رگرسیونی استاندارد شده برای متغیرهای میداند. زومبو و توماس(1996) به منظور اهداف مقایسه ای”اندازه اثر” حداقل مجذورات وزنی(R2Δ)، دست به طبقهبندی این “اندازه اثر” زدند. زویک و اریکان(1989) نیز دست به طبقهبندی لگاریتم نسبت شانس Δα(MH) زدند. بر اساس این طبقهبندیها مقدار R2Δ کمتر از 0.13 ضعیف و قابل اغماض، R2Δ بین 0.13 تا 0.26 متوسط و R2Δ بیشتر از 0.26 بزرگ است. برای Δα(MH) مقدار کمتر از |1| ضعیف، بین |1| و |1.5| متوسط و مقدارDIF بزرگ بیشتر از |1.5| است.
“اندازه اثر”، R2Δ از طریق تجربی و مطالعات شبیه سازی شده مورد تحقیق قرار گرفته و با SIBTEST مقایسه شده است. SIBTEST و “اندازه اثر” LR DIF رابطه غیر خطی(انحنایی) با یکدیگر دارند. “اندازهی اثر” LR DIF نیاز به مطالعهی بیشتر و مقایسهی آن با روشهای مشابه DIF مانند روش MH DIF دارد.
- لینک منبع
تاریخ: چهارشنبه , 22 آذر 1402 (18:19)
- گزارش تخلف مطلب