Seaborn کتابخانهای است که به همراه Matplotlib که خود به عنوان یک کتابخانه نمایش دادهها است، برای رسم انواع توزیعهای تصادفی استفاده میشود. این کتابخانه برای تجسم توزیعهای تصادفی استفاده خواهد شد. در صورتیکه قبلاً از کتابخانه Seaborn استفاده نکردهاید باید ابتدا آن را طبق آموزشهای قبلی در خصوص نحوه نصب ماژولها در پایتون که در آن به چگونگی نصب کتابخانه Matplotlib نیز پرداخته شد، نصب کنید.
Distplots
Distplot مخفف نمودار توزیع است، یک آرایه را به عنوان ورودی میگیرد و منحنی مربوط به توزیع نقاط آرایه را ترسیم میکند. ما از (sns.distplot(A, hist=False برای تجسم توزیعهای تصادفی در این آموزش استفاده خواهیم کرد. برای نمایش توزیع دادهها کافی است پس از وارد کردن کتابخانههای Matplotlib و Seaborn که با دستور import انجام میشود از دستور
(sns.distplot(A, hist=False استفاده کنید. منظور از A یک آرایه است که میخواهید نحوه توزیع دادههای آن را مشاهده کنید. برای درک بهتر موضوع به مثال شکل ۱ توجه کنید.
شکل ۱) نحوه رسم توزیع داده در پایتون
توزیع نرمال (گاوسی)
توزیع نرمال یکی از مهمترین توزیعها است. این توزیع به نام کارل فردریش گاوس (Carl Friedrich Gauss)، ریاضیدان آلمانی، توزیع گاوسی نیز نامیده میشود. این توزیع با توزیع احتمال بسیاری از رویدادها مطابقت دارد، به عنوان مثال. نمرات IQ، ضربان قلب و غیره. برای ایجاد توزیع نرمال داده میتوانید از دستور(random.normal (loc, scale, size استفاده کنید. این دستور دارای سه پارامتر است:
loc: (میانگین) جایی که اوج (پیک) منحنی زنگولهای شکل وجود دارد.
scale: (انحراف معیار) توزیع نمودار چقدر باید مسطح باشد.
size: شکل آرایه برگشتی.
به طور مثال اگر بخواهیم یک توزیع نرمال تصادفی با ابعاد 2×4 ایجاد کنیم میتوانیم به صورت مثال ذکر شده در شکل 2 عمل کنیم. متغیر A مربوط به تولید توزیع نرمال تصادفی با 4 سطر و 2 ستون است. متغیر B نیز مرتبط با توزیع نرمال تصادفی با 4 سطر و 2 ستون است با میانگین 0 و انحراف معیار 1 است.
شکل ۲) نحوه ایجاد توزیع نرمال تصادفی
نمایش توزیع نرمال تصادفی
کافی است ابتدا به کمک دستور مربوط به تولید توزیع نرمال تصادفی، آرایه مربوطه را ایجاد و سپس به مصورسازی اعداد توسط کتابخانههای مربوط به نمایش اعداد (Matplotlib و Seaborn) پرداخت. شکل ۳ نحوه نمایش توزیع نرمال تصادفی را نشان میدهد.
شکل ۳) نحوه نمایش توزیع نرمال تصادفی
توزیع دو جملهای (Binomial Distribution)
توزیع دو جملهای یک توزیع گسسته است و نتیجه سناریوهای باینری را توصیف میکند، به عنوان مثال پرتاب یک سکه (شیر یا خط). توزیع گسسته در مجموعه جداگانهای از رویدادها تعریف میشود، به عنوان مثال. نتیجه پرتاب سکه گسسته است زیرا میتواند فقط شیر یا خط باشد در حالی که قد افراد پیوسته است زیرا میتواند 170، 1/170، 2/170 و غیره باشد. توزیع دو جملهای تصادفی که به کمک دستور(random.binomial (n, p, size تولید میشود دارای سه پارامتر است:
n: تعداد آزمایشات.
p: احتمال وقوع هر آزمایش (مثلاً برای پرتاب یک سکه هر کدام 50 درصد است.)
size: شکل آرایه برگشتی.
برای ایجاد یک توزیع دو جملهای میتوانید از دستورات نوشته شده در تصویر شکل ۴ استفاده کنید.
شکل ۴) چگونگی ایجاد و نمایش توزیع دو جملهای تصادفی
تفاوت بین توزیع نرمال و دو جملهای
تفاوت اصلی این است که توزیع نرمال پیوسته است در حالی که توزیع دوجملهای گسسته است، اما اگر نقاط داده کافی وجود داشته باشد توزیع دوجملهای کاملاً شبیه توزیع نرمال با میانگین و انحراف معیار مشخص خواهد بود. شکل ۵ تصویر خروجی ایجاد از توزیع نرمال تصادفی و توزیع دو جملهای تصادفی را نشان میدهد. همانطور که در این شکل مشخص است، میتوان با تنظیم پارامترهای دو توزیع ذکر شده، خروجیهای تقریباً مشابه با رفتار یکسان ایجاد کرد.
شکل ۵) نمایش توزیعهای نرمال تصادفی و دوجملهای تصادفی
توزیع پواسون
توزیع پواسون یک توزیع گسسته است. این توزیع تخمین میزند که یک رویداد در یک زمان مشخص چند بار میتواند رخ دهد. به عنوان مثال، اگر کسی روزی دو بار غذا بخورد چه قدر احتمال دارد که سه بار بخورد؟ این توزیع متشکل از دو پارامتر است:
lam: نرخ یا تعداد شناخته شده از رخدادها. به عنوان مثال، 2 برای مثال ذکر شده بالا.
size: شکل آرایه برگشتی
شکل۶ نحوه تولید و نمایش توزیع پواسون در پایتون را نشان میدهد.
شکل ۶) نحوه تولید و نمایش توزیع پواسون تصادفی
توزیع یکنواخت
این توزیع برای توصیف احتمالی استفاده میشود که در آن هر رویداد شانس یکسانی برای وقوع دارد.
به عنوان مثال، در تولید اعداد تصادفی شانس وقوع هر رخداد 50 درصد است. توزیع یکنواخت دارای سه پارامتر است:
a: کران پایین – پیش فرض صفر است.
b: کران بالا – پیش فرض یک است.
size: شکل آرایه برگشتی
برای تولید و نمایش این توزیع نیز میتوانید مطابق مثالهای ذکر شده در بالا ابتدا کتابخانههای مربوطه را فراخوانی و سپس از دستور
(sns.distplot (random.uniform(size=1000), hist=False استفاده کنید که حاصل استفاده از روش مذکور، خروجی مطابق شکل 7 خواهد بود.
شکل ۷) نمایش توزیع یکنواخت تصادفی
توزیع لاجستیک
توزیع لاجستیک برای توصیف رشد استفاده میشود. این توزیع به طور گسترده در یادگیری ماشین در رگرسیون لاجستیک، شبکههای عصبی و غیره استفاده میشود. دستور ایجاد توزیع لاجستیک دارای سه پارامتر است:
loc: به معنی، جایی که قله یا پیک منحنی قرار دارد. پیش فرض 0
scale: انحراف معیار، مسطح بودن توزیع. پیش فرض 1
size: شکل آرایه برگشتی
برای تولید این توزیع نیز میتوانید از دستور
(sns.distplot(random.logistic(size=1000),hist=False استفاده کنید.
توزیع چندجملهای
توزیع چندجملهای تعمیم توزیع دو جملهای است و نتایج سناریوهای چندجملهای را بر خلاف سناریوهای دوجملهای که سناریوها باید فقط یکی از این دو باشند توصیف میکند. به عنوان مثال، گروه خونی یک جمعیت، نتیجه پرتاب تاس. این توزیع نیز دارای سه پارامتر است:
n: تعداد نتایج احتمالی (مثلاً 6 برای تاس انداختن).
pvals: فهرست احتمالات نتایج (به عنوان مثال [6/1، 6/1، 6/1، 6/1، 6/1، 6/1] برای تاس انداختن)
size: شکل آرایه برگشتی
نمونههای چند جملهای یک مقدار واحد تولید نمیکنند. آنها برای هر pval یک مقدار تولید میکنند. از آنجا که آنها توزیع دوجملهای را تعمیم میدهند، نمایش بصری آنها و شباهت توزیع نرمال مانند توزیعهای دو جملهای چندگانه است.
دستور تولید توزیع چندجملهای در پایتون نیز به صورت
([A = random.multinomial(n=6, pvals=[1/6, 1/6, 1/6, 1/6, 1/6, 1/6 است.
توزیع نمایی
توزیع نمایی برای توصیف زمان تا رویداد بعدی به عنوان مثال استفاده میشود. شکست/موفقیت و غیره. این توزیع دو پارامتر دارد:
scale: معکوس نرخ (به lam در توزیع پواسون توجه کنید) به طور پیش فرض 1 است
size: شکل آرایه برگشتی
به کمک دستور
((A = random.exponential(scale=2, size=(2, 3 میتوانید توزیع نمایی ایجاد کنید.
توزیع مربع Chi Square) Chi)
توزیع Chi Square به عنوان مبنایی برای تأیید فرضیه استفاده میشود. این توزیع دو پارامتر دارد:
df: (درجه آزادی)
size: شکل آرایه برگشتی
دستور ایجاد توزیع مربع Chi نیز به صورت
((A = random.chisquare(df=2, size=(2, 3 است. شکل ۸ تصاویر سه توزیع لاجستیک (سمت چپ)، نمایی (وسط) و مربعChi (سمت راست) را نشان میدهد.
شکل ۸) نمایش توزیعهای لاجستیک (سمت چپ)، نمایی (وسط) و مربعChi (سمت راست)
دیدگاه ها