সংক্ষেপে বলতে গেলে, সাধারণত যদি ডেটার বন্টন বাম দিকে তির্যক হয়, তাহলে মান মধ্যমা থেকে কম হয়, যা প্রায়শই মোড থেকে কম হয়। যদি ডেটার বন্টন ডানদিকে তির্যক হয়, মোড প্রায়ই মধ্যমা থেকে কম হয়, যা গড় থেকে কম।
মিডিয়ান তির্যক ডেটা দ্বারা কম প্রভাবিত হয় কেন?
কেন গড়ের তুলনায় তির্যক ডেটা দ্বারা মধ্যমা কম প্রভাবিত হয়? যাইহোক, ডেটা তির্যক হয়ে যাওয়ার সাথে সাথে গড় ডেটার জন্য সেরা কেন্দ্রীয় অবস্থান প্রদান করার ক্ষমতা হারিয়ে ফেলে কারণ তির্যক ডেটা এটিকে সাধারণ মান থেকে দূরে টেনে নিয়ে যাচ্ছে।
কেন তির্যক ডেটার জন্য মাঝারিটি ভাল?
আউটলায়ার্স বা তির্যক ডিস্ট্রিবিউশনের জন্য, মাঝারিটি প্রায়শই কেন্দ্রীয় প্রবণতার জন্য পছন্দের পরিমাপ কারণ মধ্যম গড়টির চেয়ে আউটলারের প্রতি বেশি প্রতিরোধী হয়… মনে রাখবেন যে গড়টি তির্যকতার দিকে টানা হয়েছে (অর্থাৎ, লেজের দিক)।
যখন ডানদিকে তির্যক থাকে তখন মধ্যম হয়?
একটি ডান তির্যক বণ্টনের জন্য, মানটি সাধারণত মাঝারি থেকে বড় হয় এছাড়াও লক্ষ্য করুন যে ডান হাতের (ধনাত্মক) দিকের বন্টনের লেজের চেয়ে লম্বা বাম দিকে. বাক্স এবং হুইকার ডায়াগ্রাম থেকে আমরা দেখতে পাচ্ছি যে মধ্যম তৃতীয় চতুর্থাংশের তুলনায় প্রথম চতুর্থাংশের কাছাকাছি।
কিভাবে তির্যকতা ডেটাকে প্রভাবিত করে?
তির্যকতার প্রভাব
যদি ডেটাতে খুব বেশি তির্যকতা থাকে, তবে অনেক পরিসংখ্যান মডেল কাজ করে না কিন্তু কেন। সুতরাং তির্যক ডেটাতে, পুচ্ছ অঞ্চল পরিসংখ্যানগত মডেলের জন্য একটি আউটলায়ার হিসাবে কাজ করতে পারে এবং আমরা জানি যে আউটলায়ারগুলি মডেলের কর্মক্ষমতা বিশেষ করে রিগ্রেশন-ভিত্তিক মডেলগুলিকে বিরূপভাবে প্রভাবিত করে৷