معرفی و نحوه نمایش توزیع داده‌های تصادفی در پایتون

نرم افزار

Seaborn کتابخانه‌ای است که به همراه Matplotlib که خود به عنوان یک کتابخانه نمایش داده‌ها است، برای رسم انواع توزیع‌های تصادفی استفاده می‌شود. این کتابخانه برای تجسم توزیع‌های تصادفی استفاده خواهد شد. در صورتیکه قبلاً از کتابخانه Seaborn استفاده نکرده‌اید باید ابتدا آن را طبق آموزش‌های قبلی در خصوص نحوه نصب ماژول‌ها در پایتون که در آن به چگونگی نصب کتابخانه Matplotlib نیز پرداخته شد، نصب کنید.

Distplots
Distplot مخفف نمودار توزیع است، یک آرایه را به عنوان ورودی می‌گیرد و منحنی مربوط به توزیع نقاط آرایه را ترسیم می‌کند. ما از (sns.distplot(A, hist=False برای تجسم توزیع‌های تصادفی در این آموزش استفاده خواهیم کرد. برای نمایش توزیع داده‌ها کافی است پس از وارد کردن کتابخانه‌های Matplotlib و Seaborn که با دستور import انجام می‌شود از دستور
(sns.distplot(A, hist=False استفاده کنید. منظور از A یک آرایه است که می‌خواهید نحوه توزیع داده‌های آن را مشاهده کنید. برای درک بهتر موضوع به مثال شکل ۱ توجه کنید.

شکل ۱) نحوه رسم توزیع داده در پایتون

توزیع نرمال (گاوسی)
توزیع نرمال یکی از مهمترین توزیع‌ها است. این توزیع به نام کارل فردریش گاوس (Carl Friedrich Gauss)، ریاضیدان آلمانی، توزیع گاوسی نیز نامیده می‌شود. این توزیع با توزیع احتمال بسیاری از رویدادها مطابقت دارد، به عنوان مثال. نمرات IQ، ضربان قلب و غیره. برای ایجاد توزیع نرمال داده می‌توانید از دستور(random.normal (loc, scale, size استفاده کنید. این دستور دارای سه پارامتر است:
loc: (میانگین) جایی که اوج (پیک) منحنی زنگوله‌ای شکل وجود دارد.
scale: (انحراف معیار) توزیع نمودار چقدر باید مسطح باشد.
size: شکل آرایه برگشتی.
به طور مثال اگر بخواهیم یک توزیع نرمال تصادفی با ابعاد 2×4 ایجاد کنیم می‌توانیم به صورت مثال ذکر شده در شکل 2 عمل کنیم. متغیر A مربوط به تولید توزیع نرمال تصادفی با 4 سطر و 2 ستون است. متغیر B نیز مرتبط با توزیع نرمال تصادفی با 4 سطر و 2 ستون است با میانگین 0 و انحراف معیار 1 است.

شکل ۲) نحوه ایجاد توزیع نرمال تصادفی

نمایش توزیع نرمال تصادفی
کافی است ابتدا به کمک دستور مربوط به تولید توزیع نرمال تصادفی، آرایه مربوطه را ایجاد و سپس به مصورسازی اعداد توسط کتابخانه‌های مربوط به نمایش اعداد (Matplotlib و Seaborn) پرداخت. شکل ۳ نحوه نمایش توزیع نرمال تصادفی را نشان می‌دهد.

شکل ۳) نحوه نمایش توزیع نرمال تصادفی

توزیع دو جمله‌ای (Binomial Distribution)
توزیع دو جمله‌ای یک توزیع گسسته است و نتیجه سناریوهای باینری را توصیف می‌کند، به عنوان مثال پرتاب یک سکه (شیر یا خط). توزیع گسسته در مجموعه جداگانه‌ای از رویدادها تعریف می‌شود، به عنوان مثال. نتیجه پرتاب سکه گسسته است زیرا می‌تواند فقط شیر یا خط باشد در حالی که قد افراد پیوسته است زیرا می‌تواند 170، 1/170، 2/170 و غیره باشد. توزیع دو جمله‌ای تصادفی که به کمک دستور(random.binomial (n, p, size تولید می‌شود دارای سه پارامتر است:
n: تعداد آزمایشات.
p: احتمال وقوع هر آزمایش (مثلاً برای پرتاب یک سکه هر کدام 50 درصد است.)
size: شکل آرایه برگشتی.
برای ایجاد یک توزیع دو جمله‌ای می‌توانید از دستورات نوشته شده در تصویر شکل ۴ استفاده کنید.

شکل ۴) چگونگی ایجاد و نمایش توزیع دو جمله‌ای تصادفی

تفاوت بین توزیع نرمال و دو جمله‌ای
تفاوت اصلی این است که توزیع نرمال پیوسته است در حالی که توزیع دوجمله‌ای گسسته است، اما اگر نقاط داده کافی وجود داشته باشد توزیع دوجمله‌ای کاملاً شبیه توزیع نرمال با میانگین و انحراف معیار مشخص خواهد بود. شکل ۵ تصویر خروجی ایجاد از توزیع نرمال تصادفی و توزیع دو جمله‌ای تصادفی را نشان می‌دهد. همانطور که در این شکل مشخص است، می‌توان با تنظیم پارامترهای دو توزیع ذکر شده، خروجی‌های تقریباً مشابه با رفتار یکسان ایجاد کرد.

شکل ۵) نمایش توزیع‌های نرمال تصادفی و دوجمله‌ای تصادفی

توزیع پواسون
توزیع پواسون یک توزیع گسسته است. این توزیع تخمین می‌زند که یک رویداد در یک زمان مشخص چند بار می‌تواند رخ دهد. به عنوان مثال، اگر کسی روزی دو بار غذا بخورد چه قدر احتمال دارد که سه بار بخورد؟ این توزیع متشکل از دو پارامتر است:
lam: نرخ یا تعداد شناخته شده از رخدادها. به عنوان مثال، 2 برای مثال ذکر شده بالا.
size: شکل آرایه برگشتی
شکل۶ نحوه تولید و نمایش توزیع پواسون در پایتون را نشان می‌دهد.

شکل ۶) نحوه تولید و نمایش توزیع پواسون تصادفی

توزیع یکنواخت
این توزیع برای توصیف احتمالی استفاده می‌شود که در آن هر رویداد شانس یکسانی برای وقوع دارد.
به عنوان مثال، در تولید اعداد تصادفی شانس وقوع هر رخداد 50 درصد است. توزیع یکنواخت دارای سه پارامتر است:

a: کران پایین – پیش فرض صفر است.
b: کران بالا – پیش فرض یک است.
size: شکل آرایه برگشتی

برای تولید و نمایش این توزیع نیز می‌توانید مطابق مثال‌های ذکر شده در بالا ابتدا کتابخانه‌های مربوطه را فراخوانی و سپس از دستور
(sns.distplot (random.uniform(size=1000), hist=False استفاده کنید که حاصل استفاده از روش مذکور، خروجی مطابق شکل 7 خواهد بود.

شکل ۷) نمایش توزیع یکنواخت تصادفی

توزیع لاجستیک
توزیع لاجستیک برای توصیف رشد استفاده می‌شود. این توزیع به طور گسترده در یادگیری ماشین در رگرسیون لاجستیک، شبکه‌های عصبی و غیره استفاده می‌شود. دستور ایجاد توزیع لاجستیک دارای سه پارامتر است:

loc: به معنی، جایی که قله یا پیک منحنی قرار دارد. پیش فرض 0
scale: انحراف معیار، مسطح بودن توزیع. پیش فرض 1
size: شکل آرایه برگشتی

برای تولید این توزیع نیز می‌توانید از دستور
(sns.distplot(random.logistic(size=1000),hist=False استفاده کنید.

توزیع چندجمله‌ای
توزیع چندجمله‌ای تعمیم توزیع دو جمله‌ای است و نتایج سناریوهای چندجمله‌ای را بر خلاف سناریوهای دوجمله‌ای که سناریوها باید فقط یکی از این دو باشند توصیف می‌کند. به عنوان مثال، گروه خونی یک جمعیت، نتیجه پرتاب تاس. این توزیع نیز دارای سه پارامتر است:
n: تعداد نتایج احتمالی (مثلاً 6 برای تاس انداختن).
pvals: فهرست احتمالات نتایج (به عنوان مثال [6/1، 6/1، 6/1، 6/1، 6/1، 6/1] برای تاس انداختن)
size: شکل آرایه برگشتی
نمونه‌های چند جمله‌ای یک مقدار واحد تولید نمی‌کنند. آن‌ها برای هر pval یک مقدار تولید می‌کنند. از آنجا که آن‌ها توزیع دوجمله‌ای را تعمیم می‌دهند، نمایش بصری آن‌ها و شباهت توزیع نرمال مانند توزیع‌های دو جمله‌ای چندگانه است.
دستور تولید توزیع چندجمله‌ای در پایتون نیز به صورت
([A = random.multinomial(n=6, pvals=[1/6, 1/6, 1/6, 1/6, 1/6, 1/6 است.

توزیع نمایی
توزیع نمایی برای توصیف زمان تا رویداد بعدی به عنوان مثال استفاده می‌شود. شکست/موفقیت و غیره. این توزیع دو پارامتر دارد:
scale: معکوس نرخ (به lam در توزیع پواسون توجه کنید) به طور پیش فرض 1 است
size: شکل آرایه برگشتی
به کمک دستور
((A = random.exponential(scale=2, size=(2, 3 می‌توانید توزیع نمایی ایجاد کنید.
توزیع مربع Chi Square) Chi)
توزیع Chi Square به عنوان مبنایی برای تأیید فرضیه استفاده می‌شود. این توزیع دو پارامتر دارد:
df: (درجه آزادی)
size: شکل آرایه برگشتی
دستور ایجاد توزیع مربع Chi نیز به صورت
((A = random.chisquare(df=2, size=(2, 3 است. شکل ۸ تصاویر سه توزیع لاجستیک (سمت چپ)، نمایی (وسط) و مربعChi (سمت راست) را نشان می‌دهد.

شکل ۸) نمایش توزیع‌های لاجستیک (سمت چپ)، نمایی (وسط) و مربعChi (سمت راست)

0/5 (0 دیدگاه)

برچسب ها:

شماره 260 - آذر 1401

آخرین خبر

معرفی و نحوه نمایش توزیع داده‌های تصادفی در پایتون

دیدگاه ها

دیدگاهتان را بنویسید لغو پاسخ

جدیدترین مقالات علمی و فنی

گزارش ویژه‌ی این ماه

گزارش های کوتاه ماهنامه

لینک های مرتبط

ثبت نام

بازیابی رمز عبور