ظاهرا بدیهی به نظر میرسد که هرچه تعداد اتاقهای منزل (خوابها) بیشتر باشد، قیمت آن هم بالاتر است، ولی وقتی دنبال آمار میرویم میبینیم که قضیه متفاوت است و اگر نموداری داشته باشیم که محور عمودی آن متوسط قیمت خانه و افقی آن تعداد اتاقها باشد، شیب آن منفی است!
علت چیست؟ چرا واقعیت این فرض بدیهی را تایید نمیکند؟ پاسخ ساده است، یک فاکتور مهم در قیمت را در نظر نگرفته ایم: محل! وقتی خانههایی که در یک منطقه جغرافیایی قرار دارند را بررسی میکنیم قیمت و تعداد اتاقها خانهها با هم رابطه مستقیم دارند، ولی وقتی دادههای مناطق مختلف را روی هم میریزیم، رابطهای مخدوش به دست میآید.
به این پدیده پارادوکس سیمسون میگویند که در مورد رابطه بین دو متغیر نتایج نادرست میگیریم، وقتی که دادهها مربوط به گروه های مختلف اند، همین را میتوان در مورد رابطه بار مالیاتی و درآمد سرانه یک کشور به کار گرفت که در کل مثبت است، ولی در مورد کشورهای گروه درآمدی مختلف رابطه منفی است، خلاصه مراقب همگنی دادهها در تحلیل باشید، والله اعلم.