چگونه به داده ها وزن بدهیم تا بتوانیم تصمیمات متعادل تری بگیریم؟

How_To_Weight_Data_To_Make_More_Balanced_Decisions

چگونه به داده ها وزن بدهیم تا بتوانیم تصمیمات متعادل تری بگیریم؟

1280 853 مسترکاما

به ندرت یک جمعیت از گروه همگنی از مشتریان تشکیل می شوند که دارای ویژگی های مشابهی باشند.
در نتیجه نمونه های ما ترکیبی از مشتریانی هستند که ممکن است ترکیبی از جمعیت مشتریان باشند یا نباشند.

متغیرهای مختلفی وجود دارند که در چگونگی طرز تفکر مشتریان نسبت به محصولات و خدمات تاثیر گذارند. یکی از رایج ترین متغیرهایی که بر اندازه گیری های ما تاثیر می گذارند تجربه ی اولیه است. تجربه ی اولیه نسبت به محصولات، نرم افزار و وبسایت در مقایسه با جنس، سن، درآمد و شغل تاثیر بیشتری روی ویژگی ها و رفتار مشتری دارند.

1

ما این مورد را در تست کاربردپذیری و نظرسنجی هایی که ویژگی های برند را اندازه می گرفت، مشاهده نمودیم. به طور کلی هر چه تجربه ی مشتریان بیشتر بود، عملکرد آن ها در وظایف بهتر بود و ویژگی های آن ها در برابر آن محصول یا خدمتی که در حال تست بود مثبت تر بود.

بنابراین در هر نمونه ای از افراد شرکت کننده در مطالعات تحقیق، شما حداقل می خواهید که تجربه ی اولیه مشتریان را اندازه بگیرید. حتی اگر برای اندازه گیری این متغیر برنامه ریزی نکرده اید باید آن را اضافه کنید زیرا در زمان تحلیل اغلب مفید خواهد بود.

یکی از راه هایی که محققان تجربه ی اولیه را کنترل می کنند تطبیق سطح تجربه ی نمونه با سطح تجربه ی جمعیت است. اگر شما باور کنید، برای مثال ۶۰ درصد از بازدید کننده های وبسایت شما سایت شما را هفته ای یکبار استفاده می کنند و بقیه ی ۴۰ درصد آن را کمتر استفاده می کنند، می توانید شرکت کننده هایی را بکار بگیرید تا با آن ترکیب منطبق شوند. می توانید فاصله ی اطمینان را محاسبه کنید و مقایسه های آماری را انجام دهید (دو طراحی جایگزین) و نتیجه بگیرید که در کدام طراحی کاربران بهتر عمل می کنند و یا کدام طراحی را ترجیح می کنند. بیشتر مشتری های ما این روش را ترجیح می دهند (تطبیق نمونه با جمعیت) زیرا وقتی شما آن را با سهامداران مطرح می کنید، برای آن ها ملموس تر است.

شما همیشه نمی توانید نمونه های خود را وزن دهی کنید تا با جمعیت منطبق شوند. حتی اگر برای مثال داده های شما نشان دهد که ۳۰ درصد از کاربران نسخه ی موبایل سایت شما به سایت شما در سال گذشته دسترسی نداشته اند، ممکن است که یافتن این کاربران برای شرکت در این مطالعه دشوار باشد. وقتی که نیاز دارید که تعیین کنید کدام طراحی توسط کاربران ترجیح داده می شود یا برای انجام هر گونه مقایسه ی دیگری، نباید تصمیمات شما براساس ترکیب نامناسبی از نمونه ی شما باشد.

با نمونه های نامتعادل، دو روش می تواند تاثیر تجربه ی اولیه بر روی اندازه های بدست آمده را کنترل و کمتر کند: t-test وزن دار و ANOVA نوع یک. تحلیل واریانس (ANOVA) یک روش آماری است که از آن برای مقایسه بیش از دو میانگین در یک زمان استفاده می شود. همچنین شما را قادر به دیدن تاثیر چندین متغیر به طور همزمان می کند. ANOVA از نظر محاسباتی نسبت به t-test سنگین تر است و معمولا نیاز به نرم افزار تخصصی مانند spss، R یا Minitab برای اجرا دارد. همچنین به یک فرد متخصص در آمار برای کمک در نصب و تحلیل نتایج ANOVA نیاز دارید.

در مورد تست t-Test وزن دار

یک روش نسبتا ساده برای استفاده از داده های وزن دار روش t-test وزن دار نامیده می شود. وقتی دو گروه با داده های پیوسته مقایسه می شوند، روش توصیه شده برای این کار t-test است. روش t-test برای نمونه های کوچک، بزرگ و اندازه های نامساوی می تواند استفاده شود و در برابر داده ی غیر عادی انعطاف پذیر است. t-test تحلیل آماری محکم و قدرتمندی است، در تعیین اهمیت آماری تنها یک متغیر را در نظر می گیرد. یعنی شما نمی توانید با استفاده از آن، ویژگی های طراحی A را با طراحی B و فاکتور تجربه ی قبلی شان را با محصول خودتان (تجربه ی پایین و تجربه ی بالا) مقایسه کنید.
به هر حال نسخه ی وزن دار t-test دارای عاملی در متغیر دوم است. این روش میانگین و انحراف معیار را براساس مقدار وزن هر پاسخ گو تنظیم می کند. شرکت کننده ها باید ۶۰ درصد از جمعیت که با امتیازی ۶۰ درصدی وزن دهی شده اند را دارا باشند، حتی اگر ۲۰ درصد نمونه ی شما را تشکیل دهند. می توانید یادداشت های محاسباتی را در paper by Bland and Kerry. ببینید.

استفاده از t-Test وزن دار

در اینجا خواهیم دید که t-Test چگونه کار می کند.

اخیرا بررسی کردیم که چگونه کاربران یک سایت خرده فروشی آنلاین در برابر طراحی های مختلف اطلاعات محصولات واکنش نشان می دهند. ما دو طراحی را ارائه دادیم و می خواستیم بدانیم که کدام یک به طور آماری از نظر تعداد ابعاد شامل جامعیت و راحتی ترجیح داده می شود. ۸۵۷ شرکت کننده ی واجد شرایط به صورت تصادفی به طرح های a یا b اختصاص داده شدند. ما جامعیت و راحتی استفاده از مقیاس های ۱۰ نقطه ای را ارزیابی کردیم.

میانگین، انحراف معیار و اندازه ی نمونه برای هر دو گروه در مورد سوال اطمینان در جدول ۱ نشان داده شده است.

2جدول۱٫ میانگین های غیر وزن دار برای دو طراحی که آزمایش شد.

با وجود اینکه طراحی a از نظر اسمی دارای میانگین بیشتری است (۸٫۵۸ در برابر ۸٫۳۷) با استفاده از t-test استاندارد برای مقایسه های میانگین متوجه شدیم که تفاوت مهمی در سطح alpha = .05ی اهمیت (p=0.095) وجود ندارد.

می دانیم که تجربه ی اولیه دارای تاثیر زیادی بر روی ویژگی ها نسبت به واسط کاربری است و چهار گروه در هر دو نمونه قرار دارند که تجربه ی هر یک نسبت به سایت به مراتب بیشتر از گروه دیگر است.

نمونه دارای زیر گروه هایی است که تجربه ی ناهمگونی دارند و نمایانگر تفکیکی از تجربه ی جمعیت نمی باشد. جدول ۲ تفکیک طراحی a و b را در مقایسه با ترکیب جمعیت کاربران نشان می دهد.

3جدول ۲٫ سطوح تجربه برای نمونه ی مشتریان که به طراحی های a و b اختصاص داده شدند با ترکیب جمعیت مقایسه شدند.

بیشترین تفاوت در سطح ۴ تجربه دیده می شود. وقتی این گروه نیمی از جمعیت را تشکیل می دهد تنها شامل ۴۱ و ۴۲ درصد از نمونه ها در طراحی a و b است.
این گروه ها دارای عقاید متفاوت درباره ی طراحی هایی هستند که در معرض آن قرار می گیرند. جدول ۳ نشان می دهد که یکی از بزرگترین تفاوت های در ویژگی ها برای تجربه ی سطح ۴ است که برای طراحی A 0.39 بیشتر از طراحی b است. علاوه بر این کوچکترین زیرگروه طراحی b را به a ترجیح می دهد.

4جدول۳٫ متوسط پاسخ ها به سوال اطمینان (بالاتر بهتر است)، تفاوت در میانگین در سطوح تجربه (۱ تا ۴) و ترکیب جمعیت سطوح تجربه.

t-test وزن دار یک میانگین و انحراف معیار ترکیبی ایجاد می کند اندازه ی زیر گروه متناسب است. میانگین و انحراف معیار بروز شده در جدول ۴ با داده های اصلی نشان داده شده است.

5جدول۴: سطح تجربه برای نمونه ای از مشتریان که به طراحی های a و b اختصاص داده شده اند با ترکیب جمعیت مقایسه شده است.

نتیجه ی t-test وزن دار مقدار p برابر با ۰٫۳ را تولید کرد که از نظر آماری در سطح اهمیت alpha = .05 مهم است. شما همیشه تفاوت هایی را در مقادیر اهمیت بین روش های وزن دار و بدون وزن مشاهده نمی کنید. این بستگی دارد به اینکه چقدر نمونه ی شما نامناسب است و چه مقدار گروه های کم وزن تر با گروه های با وزن بیشتر فرق می کنند.

با این نتایج می توانیم نتیجه بگیریم که طراحی a دارای رتبه ی بیشتری است و این تفاوت رتبه به اندازه ی نامناسب نمونه مربوط نمی شود. شما همچنین می توانید از این روش برای متغیر واسطه (مانند جغرافی، جنس و شغل) و نه فقط برای تجربه ی اولیه استفاده کنید.

نکته سریع: شما باید دلیل خوب و داده ی واقعی برای پشتیبانی از وزن های مورد استفاده داشته باشید. داده های خود را تنها برای بدست آوردن اهمیت آماری وزن دهی نکنید. در حالی که بسیاری از متغیرها در نمونه ی شما ممکن است با جمعیت شما متفاوت باشند، خیلی ها ممکن است تاثیر زیادی نداشته باشند تا بتوانند وزن دهی را توجیه کنند (اگر تاثیری وجود داشته باشد).

خلاصه

چیزهایی که باید درباره ی وزن دهی داده ها به خاطر داشته باشید.

  • درحالی که بسیاری از متغیرها می توانند اندازه ی ما را تحت تاثیر قرار دهند، تجربه ی اولیه ی شرکت کننده ها در مورد یک محصول یکی از قابل توجه ترین ویژگی هاست.
  • t-test وزن دار یک تست آماری برای تعادل دوباره ی نمونه های شماست. t-test وزن دار انحراف معیار و میانگین را تنظیم می کند تا مقدار p را براساس ارائه ی درست تولید کند.
  • استفاده از تست های آماری وزن دار در برابر تست های اماری غیر وزن دار لزوما نتایج متفاوتی را تولید نمی کند.
  • دلیل خوب و داده های واقعی برای حمایت از وزن دهی نمونه ی خود داشته باشید.

ترجمه توسط مسترکاما

چگونه به داده ها وزن بدهیم تا بتوانیم تصمیمات متعادل تری بگیریم؟

زمان مطالعه: 7 دقیقه