جهان امروز، جهان داده است و ذخیرهسازی و استفاده بهینه از دادهها یکی از چالشهای اصلی سازمانها در یک دهه گذشته بوده است. از این رو در سالهای اخیر، تمرکز اصلی متخصصان داده و شرکتهای متخصص داده، روی ساختن چهارچوبها و راهحلهایی برای مدیریت دادهها (از استخراج و ذخیرهسازی تا تحلیل و استراتژیهای دادهمحور) بوده است. «علم داده» (Data Science) در حقیقت حلقه اتصال و هدایتگر این وضعیت است. نقش علم داده و متخصصان علوم داده، امروز تا جایی برجسته شده است که حتی عدهای باور دارند تمام ایدههایی که در فیلمهای علمی-تخیلی هالیوود دیده میشود، میتواند به وسیله علم داده به واقعیت تبدیل شود.
اغراق نیست اگر بگوییم امروز، یکی از بیشترین استفادهها از داده و علم داده در حوزه کسبوکار است. در این تحقیق سعی شده ابتدا توضیحاتی در خصوص علم داده و کاربردهای آن در حوزه سلامت ارائه شود و سپس پیش نیازهای لازم جهت تحلیل دادهها معرفی شوند.
با پیشرفت آمار ریاضی و تحلیل داده در سالهای اخیر، اصطلاح «علم داده» ظهور پیدا کرده است. در حقیقت علم داده مجموعهای از ابزارها، الگوریتمها و اصول یادگیری ماشین است که هدف آن کشف کردن الگو از میان دادههای خام است. تحلیلگر داده با بررسی تاریخچه دادهها، به توضیح آن میپردازد. در حالیکه دانشمند داده نه تنها برای دریافت بینش از دادهها به تحلیل اکتشافی (Exploratory Analysis) میپردازد، بلکه از الگوریتمهای پیچیده یادگیری ماشین برای پیشبینی یک رویداد خاص در آینده استفاده میکند. دانشمند داده از زوایای مختلف به دادهها نگاه میکند، زوایایی که پیش از این ناشناخته بودهاند.
اهمیت علم داده
علم داده، حوزهای بین رشتهای است که با استفاده از روشهای علمی، فرآیندها و الگوریتمهای ریاضی، سعی میکند از میان دادههایی ساختارمند و غیرساختارمند، دانش و بینش جدیدی به وجود بیاورد. به طور مثال در صنعت بیمه خودرو، با استفاده از علم داده میتوان متوجه شد که احتمالاً کدام یک از کارخانههای خودروسازی ماشینهای ایمنتری تولید میکنند یا چه افرادی در جامعه با چه خصوصیاتی رانندگی ایمنتری دارند. در گذشته، دادهها اغلب ساختاریافته بودند و در حجم بسیار کم وجود داشتند. این ویژگیها امکان تحلیل آنها را با استفاده از ابزارهای ساده هوش مصنوعی (Artificial Intelligence) فراهم میکرد؛ اما طی سالهای اخیر با رشد تکنولوژیهای دیجیتال و توسعه دسترسی به اینترنت و اینترنت اشیا (Internet of Things-IoT)، شرکتها، دادههای فراوانی را ذخیره کردهاند و اکنون با انبوهی از داده روبرو هستیم. دادههایی که در صورت مدیریت صحیح، کاربردهای زیادی خواهند داشت. حوزه پزشکی، جُرم شناسی، صنایع، روابط اجتماعی، کسبوکار و هر اقدامی که امروز در جهان در حال اجراست، میتواند دادهمحور (Data-driven) انجام شود؛ البته به شرطی که به اندازه کافی داده در اختیار باشد، سواد داده (Data literacy) وجود داشته باشد و افرادی در کنارمان باشند که در حوزه مدیریت داده و استفاده از آن تخصص داشته باشند. در ادامه با ذکر چند مثال توضیح بیشتری در خصوص کاربرد دادهها ارائه میشود.
فرض کنید شما کارخانه تولید گوشی تلفن همراه دارید. اولین محصول را روانه بازار میکنید و محصول شما با استقبال خیلی خوبی مواجه میشود؛ اما میدانیم که هر فناوری عمری مشخص دارد، پس باید همزمان به فکر ایجاد خلاقیت و نوآوری در محصول باشید. برای اینکه بتوانید به انتظارات مشتری پاسخ دهید یکی از کارمندان پیشنهاد میدهد از بازخوردهای مشتریان استفاده کنید و ببینید آنها منتظر چه ویژگی جدیدی هستند. با استفاده از تکنیکهای دادهکاوی میتوانید به نتایج دلخواه کاربران دست پیدا کنید. علم داده و رویکرد داده-محور به موضوعات، موجب تصمیمگیری بهتر، تحلیلهای پیشبینانه و کشف الگوها میشود و برای شما قابلیتهای زیر را فراهم میکند:
. یافتن علت اصلی یک مشکل
. انجام تحلیل اکتشافی روی دادهها
. مدلسازی دادهها با استفاده از الگوریتمهای مختلف
. انتقال و نمایش نتایج با استفاده از نمودار و داشبوردها
همچنین صنعت هوانوردی را در نظر بگیرید. استفاده از علم داده در خطوط هوایی سبب بهینه شدن عملیات و در نتیجه حل مشکل شرکتهای هوایی و مسافران میشود، به این کاربردها دقت کنید:
. برنامهریزی برای بهینهترین مسیرها و تصمیمگیری در مورد اینکه پروازی مستقیم یا غیرمستقیم به یک مقصد انجام شود.
. ساختن مدلهای پیشبینانه برای پیشبینی میزان تأخیر در پروازها
. پیشنهاد تخفیفهای شخصیسازی شده
(Personalized Promotional Offers) به مشتریان بر اساس الگوهای رزرو پرواز
. تصمیمگیری در مورد خرید یک کلاس پروازی خاص برای دستیابی به سود بیشتر
این دو مثال و هزاران هزار کاربرد دیگر از مزیتهای استفاده از داده در سالهای اخیر است. در یک کلام با استفاده از علم داده و پیدا کردن راهحلهایی با کارایی بالا، میتوان هزینههای تولید را کاهش و محصولی را به مشتریان تحویل داد که در جستجویش هستند و برای آن اشتیاق فراوانی دارند.
مزایای علم داده
در ارائه یک خدمت، در تولید محصولات گوناگون و در تمامی اقدامات اجرایی که به صورت مستمر انجام میشوند، داده تولید میشود. دادههای عبور و مرور وسایل نقلیه از یک جاده، دادههای یک خط تولید، نتایج تزریق یک واکسن جدید به تعداد زیادی از متقاضیان و… همه از جمله این دادهها هستند. علم داده از مرحله طراحی تا مرحله اصلاح آن خدمات و محصولات و اقدامات میتواند مزایای زیادی ایجاد کند و باعث شود که کمتر به شهود استناد و کمتر از مسیرهای پرهزینه و آزمون و خطا استفاده شود.
شرکت مک کینزی (شرکت مشاوره مدیریت) تخمین زده بود که ابتکارات کلان داده (Big Data) در سیستم مراقبتهای بهداشتی ایالات متحده میتواند سبب 300 تا 450 میلیارد دلار یا به عبارتی 12 تا 17 درصد کاهش در هزینههای درمانی 2.6 تریلیون دلاری شود. حتی چند اقدام ساده برگرفته از دادهها میتواند تأثیر بسزایی داشته باشد. به عنوان مثال، دادهها نشان دادهاند که مصرف آسپرین توسط افرادی که در معرض بیماری عروق کرونر قلب هستند، همراه با غربالگری اولیه کلسترول و ترک سیگار، میتواند هزینه کل مراقبت از این بیماران را بیش از ۳۰ میلیارد دلار در سال کاهش دهد. امروزه دادهها امکان شناسایی سریعتر بیماران پرخطر، مداخلات مؤثرتر و نظارت دقیق را فراهم میکند و در نتیجه هزینههای بهداشتی سالانه به میزان قابل توجهی کاهش خواهد یافت. در کسبوکار نیز مدیریت داده میتواند به خلق و ایجاد مزیت رقابتی برای سازمانها منجر شود.
. با تحلیل دادههای جمعآوری شده از مراکز تماس، دلایل نارضایتی مشتری مشخص میشود بنابراین واحد بازاریابی میتواند برای حفظ آن مشتریان اقداماتی استراتژیک و به هنگام انجام دهد.
. تحلیل داده با پیشبینی الگوهای ترافیک، شرایط جوی و سایر موارد به شرکتهای حمل نقل برای بهبود سرعت تحویل بار و کاهش هزینهها کمک میکند.
. تحلیل آزمایشهای پزشکی و گزارش علائم به پزشکان، تشخیص بیماری را سریعتر میکند و میتوان درمان را زودتر و مؤثرتر آغاز کرد.
. بهینهسازی زنجیره تأمین با پیشبینی زمان خرابی تجهیزات
. تشخیص کلاهبرداری در سیستمهای مالی با پیگیری رفتارها و اقدامات مشکوک
. بهبود فروش با ارائه پیشنهادها به مشتریان بر پایه الگوهای قبلی خرید
. و هزاران مصداق دیگر که در جهان بیداده به صورتی که امروز محقق میشود، ممکن نبود.
سازمانهای زیادی علم داده را در اولویت کار خود قرار دادهاند و سرمایهگذاریهای زیادی روی آن انجام دادهاند. در پژوهشی که اخیراً گارتنر (شرکت برجسته آمریکایی در زمینه مشاوره فناوری اطلاعات) روی بیش از 3000 مدیر ارشد اطلاعات (CIO) انجام داده است، پاسخدهندگان، تحلیل و هوش مصنوعی (AI) را برترین فناوری دانستهاند که سبب تمایز آنها از رقبا شده است. مدیران بررسی شده در این پژوهش، این فناوریها را راهحلهایی استراتژیک برای موفقیت کسبوکارشان میدیدند و به همین دلیل سرمایهگذاریهای زیادی روی آن انجام دادند.
تفاوت علم داده و دادهکاوی
داده کاوی (Data Mining) به معنای پیدا کردن روند در بین مجموعه دادههاست (Datasets) و از یادگیری ماشین، آمار و سیستمهای پایگاه داده (Database Systems) برای این کار استفاده میکند. دادهکاوی علمی بین رشتهای و زیرشاخه علوم کامپیوتر است. هدف کلی از دادهکاوی استخراج اطلاعات از بین دادهها با استفاده از روشهای هوشمند و تبدیل این اطلاعات به ساختارهای قابل درک برای استفاده در کسبوکار است.
در سال 1989، گریگوری پیاتتسکی-شاپیرو برای اولین بار اصطلاح «کشف دانش در پایگاه داده» (Knowledge Discovery in Database) را استفاده کرد. در دهه 1990، دادهکاوی برای اولین بار در بین متخصصان پایگاه داده استفاده شد. شرکتهای مالی و خردهفروشی از دادهکاوی برای تحلیل دادهها و تشخیص روندها استفاده میکنند تا مشتریان خود را افزایش دهند و بتوانند نوسانات نرخ بهره، قیمت سهام و تقاضای مشتری را پیشبینی کنند. علم داده، یک حوزه بین رشتهای است که از روشهای علمی، فرایندها، الگوریتم و سیستمها برای استخراج دانش و بینش از میان دادههای زیاد ساختاریافته یا بدون ساختار استفاده میکند. علم داده به دادهکاوی، یادگیری عمیق (Deep Learning) و کلان داده مربوط میشود.
در سال ۱۹۷۴، اولین بار پیتر نائور اصطلاح علم داده را بهعنوان جایگزینی برای علم کامپیوتر استفاده کرد. در سال ۱۹۹۷ جف وو، پیشنهاد کرد که بهتر است آمار به علم داده تغییر نام دهد و علت این کار را هم کلیشههایی بیان کرد که در خصوص آمار وجود داشت که آن را معادل حسابداری یا محدود به توصیف دادهها میدانستند. هرچند در سال ۱۹۹۸، چیکیو هایاشی بیان کرد که علم داده، مفهومی جدید و بینرشتهای است و هنوز بین متخصصان دانشگاهی و صنعت، بر سر ارائه تعریف درست دادهکاوی و علم داده بحث وجود دارد؛ برای اینکه بیشتر با تفاوت هریک از این دو مفهوم آشنا شوید و بدانید از هریک در چه زمینهای بیشتر استفاده میشود، جدول ۱ را مطالعه کنید.
جدول ۱) تفاوت داده کاوی و علم داده
فرآیند علم داده
فرایند تحلیل داده و اقدام بر اساس نتایج تحلیل یک فرایند خطی نیست و بیشتر فرایندی رفت و برگشتی است. معمولاً چرخه عمر علم داده (Data Science Lifecycle) و مدلسازی داده به شرح زیر است:
. مرحله ۱- کشف: (Discovery) پیش از شروع پروژه، باید نیازمندیها، اولویتها و مقیاس کار را مشخص کنید. باید توانایی پرسیدن سؤالات درست را داشته باشید. همچنین باید ببینید که منابع مورد نیاز از جمله افراد متخصص، فناوری، زمان و دادههای مورد نیاز برای انجام پروژه را در اختیاردارید؟ در این مرحله مشخص کردن چارچوب مسئله مورد نظر و همچنین ارائه فرضیههای اولیه کاری مفید است.
. مرحله ۲- آمادهسازی دادهها: (Data Preparation) در این مرحله باید دادهها را بررسی کنید و پردازشهای اولیه را پیش از مدلسازی انجام دهید. سپس نوبت استخراج، تبدیل، بارگذاری و تبدیل است تا دادهها برای تحلیل آماده شوند. با استفاده از نرمافزارهای تحلیل داده میتوانید دادهها را تمیز، تبدیل و تصویرسازی کنید. این کار کمک خواهد کرد تا دادههای پرت (Outlier) را مشخص کرده و بین متغیرها رابطه ایجاد کنید. زمانی که دادهها را تمیز و آماده کردید، وقت انجام تحلیل اکتشافی روی آنهاست.
. مرحله ۳- برنامهریزی مدل: (Model Planning) در این مرحله، تصمیم میگیرید از چه روش و تکنیکی برای ایجاد رابطه بین متغیرها استفاده کنید. این روابط پایه الگوریتمهایی خواهد بود که در گام بعد استفاده خواهید کرد. تحلیل اکتشافی دادهها (EDA) را با استفاده از فرمولهای آماری و ابزارهای تصویرسازی متفاوتی میتوانید انجام دهید.
. چند مورد از ابزارهای رایج برنامهریزی مدل
SQL, R, SAS/ACCESS هستند.
. R: مجموعه کاملی از قابلیتهای مدلسازی را دارا است و فضای خوبی برای ساخت مدلهای تفسیری فراهم میکند.
. SQL: میتواند با استفاده از توابع دادهکاوی متداول و مدلهای ساده پیشبینانه، تحلیل درون پایگاه داده را انجام دهد.
. SAS/ACCESS: میتواند برای دسترسی به دادههای هدوپ (Hadoop) و برای ایجاد نمودارهای مدل تکرارپذیر استفاده شود. اکنونکه بینشی از ماهیت دادهها به دست آوردید و تصمیم گرفتید از چه الگوریتمی استفاده کنید. میتوانید در گام بعد از این الگوریتم استفاده کرده و مدلسازی انجام دهید.
. مرحله ۴- ساخت مدل :(Model building) در این مرحله برای آموزش و آزمایش مدل، مجموعه دادهها را ایجاد میکنید. در اینجا باید بررسی کنید که آیا ابزارهای موجود برای اجرای مدلها کافی است یا به یک محیط مستحکمتر (مانند پردازش سریع و موازی) نیاز است. برای ساخت مدل، تکنیکهای مختلف یادگیری مانند طبقهبندی، ارتباط و خوشهبندی تجزیه و تحلیل خواهند شد. با استفاده از این ابزارها میتوانید مدلسازی را انجام دهید:
.SAS Enterprise Miner, WEKA, SPCS Modeler, Matlab, Alpine Miner, Statistica
. مرحله ۵- اجرا :(Operationalize) در این مرحله، گزارشهای نهایی، جلسات توجیهی، کد و اسناد فنی ارائه میشود. علاوه بر این، گاهی اوقات یک پروژه آزمایشی نیز در یک محیط تولید در زمان واقعی اجرا میشود. با این کار پیش از استقرار کامل، تصویری واضح از عملکرد و سایر محدودیتهای مربوطه در مقیاس کوچک به دست میآید.
. مرحله ۶- اعلام نتایج: (Communicate Results) ارزیابی اینکه آیا به هدف اولیه، رسیده شده یا نه مهم است؛ بنابراین، در این مرحله، تمام یافتههای اصلی شناسایی میشوند، با ذینفعان ارتباط برقرار میکنید و بر اساس معیارهای تدوین شده در مرحله نخست، موفقیت یا شکست نتایج پروژه تعیین میشود.
. مرحله ۷ – نظارت بر مدل: (Monitoring Model) نباید فراموش کرد که استقرار یک مدل به معنی اتمام کار نیست. مدلها باید همیشه پس از استقرار کنترل شوند تا از عملکرد صحیح آنها اطمینان حاصل شود. دادههایی که مدل با استفاده از آنها آموزش داده شده است، ممکن است برای پیشبینیهای آینده پس از یک دوره زمانی قابل استفاده نباشد. به عنوان مثال، در کلاهبرداریها، مجرمان همیشه از راههای جدیدی برای هک حسابها استفاده میکنند.
علم دادهها با استفاده از کلاندادهها (Big Data) و تحلیلهای ارزشمند تجاری، صنعت پزشکی را به کلی دگرگون کرده است و انقلابی گسترده در صنایع مرتبط با مراقبتهای بهداشتی و شخصیسازی آن به وجود آورده است. دسترسی به پایگاههای داده پزشکی، امکان گذر از درمان که سهم عمدهای از بودجههای بهداشت و درمان را به خود اختصاص میدهد و تمرکز روی تشخیص بیماریهای قابل پیشگیری را فراهم میکند. (به عنوان مثال دو بیماری پیشرو و منجر به مرگ قابل پیشگیری بیماریهای قلبی و سرطان ریه هستند.)
مزیتهای کلاندادهها
دادههای پزشکی منبعی قدرتمند برای ایجاد تحلیلهای ارزشمند و کاهش اتلاف دادهها هستند. با توجه به همهگیری جهانی ویروس کرونا و بروز چالشهای بیشمار پزشکی، کلانداده میتوانند به ارائهدهندگان خدمات بهداشتی در شناسایی الگوهای مربوط به سلامتی کمک شایانی کرده و ضمناً از این دادهها میتوان برای اتخاذ اقدامات عملی در صنایع پزشکی استفاده کرد. گذشته از اینکه با استفاده از علم دادهها، تجربه بیماران از خدمات درمانی بهبود نسبتاً زیادی پیدا میکند، ذینفعان علاقهمند به بکارگیری کلانداده در صنعت پزشکی غالباً شامل ارائه دهندگان مراقبتهای بهداشتی، صنعت فناوری سلامتی، داروسازها و بیمههای درمانی هستند.
مهمترین مزایای استفاده از کلاندادهها در صنعت مراقبتهای بهداشتی:
. امکان ایجاد پروفایل بیماران
. امکان شناسایی فوری الگوها در نتایج درمان
. افزایش رضایت بیماران
. تسهیل گردش کارهای اداری در بیمارستانها
. بهبود فرایندهای پزشکی با افزایش کارایی مراقبتهای بهداشتی
مزایای استفاده از کلاندادهها این صنعت را قادر میکند تا مقرون به صرفهتر باشد.
به طور کلی تجزیهوتحلیل دادهها در مراقبتهای بهداشتی، رویکردی کاملاً شخصیسازی شده را برای هر مشتری فراهم کرده، امکان پردازش هر بیمار را در مدلی کاملاً منفرد تضمین میکند و میتواند تاریخچه سلامتی و مسیر دوره سلامت آنها را به صورت دیجیتال ترسیم کند که این به معنای امکان به اشتراک گذاری متعدد قابلیتهای گسترده در تشخیص بیماری و درگیر شدن عمیق بیماران در تصمیمگیریهای پزشکی است. علاوه بر این تجزیهوتحلیل دادهها به بهبود بهرهوری صنعت مراقبتهای بهداشتی نیز کمک میکند زیرا صنعت پزشکی را قادر میکند کیفیت بالای خدمات خود را با پردازش سریع حجم زیادی از دادههای پزشکی و کاهش هزینهها، حفظ کند. اگرچه استفاده از تجزیهوتحلیل دادههای مراقبتهای بهداشتی تا حدودی محدود به اروپا است ولی همهگیری ناشی از COVID-19 مقامات را مجبور به تجدید نظر در محدودیتهای اعمال شده قبلی و نشان دادن چراغ سبز به اقدامات تحلیلی مراقبتهای بهداشتی (به ویژه پیشبینی و تجویز) کرده است.
چالشهای پیش روی کلاندادهها
با توجه به حساسیت دادههای بهداشتی، ماهیت پراکنده آن، عظمت و پیچیدگی پایگاه دادهها و اهمیت ویژه فناوریهای حفظ حریم خصوصی، علم دادهها در مراقبتهای بهداشتی میتواند با چالشهای خاصی روبرو شود. به طور خاص چالشهای پردازش، تجزیه و تحلیل کلاندادهها در مراقبتهای بهداشتی که ممکن است رشد بازار را مهار کند بیشتر مربوط به موارد زیر است:
. کمبود متخصصان فناوری اطلاعات با تخصص مربوطه
. مسائل مربوط به یکپارچگی دادهها
. اطمینان از ایمنی دادهها
علاوه بر این پیچیدگیهای قوانین و عدم وجود رویههای واحد در صنعت مراقبتهای بهداشتی میتواند موانعی را برای استفاده گسترده از تجزیه و تحلیل دادهها توسط ارائه دهندگان پزشکی ایجاد کند و مانع رشد این بازار شود.
کاربردهای علم دادهها
بازار سلامت در بسیاری از کشورهایی که دارای منابع طبیعی زیادی نیستند، بزرگترین بازار است. همچنین در کشورهایی مانند ایران که دارای منابع طبیعی بسیاری است، باز هم حجم بازار سلامت در کنار بازارهایی همچون معدن، نفت و فولاد قرار میگیرد. نکتهای که در این بازار حائز اهمیت است، میزان دادهای است که در آن تولید میشود. همانطور که موسسه Ponemon تخمین زده است 30% از دادههای جهان در حوزه سلامت است. از گذشتههای بسیار دور، سلامت، پزشکی و درمان بر اساس جمعآوری داده و یافتن موارد مشابه در دادهها بوده است. هرچقدر که میزان یک Case در بیماران مراجعه کننده بیشتر باشد، اطلاعات ما درباره آن بیماری و نحوه مدیریت و درمان آن بهتر میشود. پس از گسترش پدیده اینترنت، تولید این دادهها به طرز فزایندهای بیشتر و قابل دسترستر شده است. به طوری که در بسیاری از مقالات و مجلههای علمی، سایتهای مراکز دولتی آمریکایی و اروپایی، براحتی میتوان از دادههای ژنتیکی و دارویی به صورت رایگان استفاده کرد.
با توجه کلماتی که در اینترنت جستجو میشود، اطلاعات کارآزماییهای بالینی، پروندههای الکترونیک، پوشیدنیها، اطلاعات مدیریت بیمارستانی، شبکههای اجتماعی و مقالههای علمی، هیچگونه کمبود دادهای در صنعت سلامت وجود ندارد.
بکارگیری علم دادهها در مراقبتهای بهداشتی، امکان بررسی جامع و آنی پروفایل بیمار را فراهم میکند و امکان پردازش اطلاعات بالینی از جمله آمار جمعیتی بیمار، بیماریهای تشخیص داده شده، داروهای تجویزی، فرایندهای اعمال شده، نتایج آزمایشگاه و یادداشتهای بالینی اضافی را میدهد. ضمناً حجم زیاد دادههای پزشکی که در مؤسسههای بهداشتی موجود است منجر به ایجاد فرصتهای طلایی برای تکمیل موفقیتآمیز پروژههای متعدد در زمینه علوم داده خواهد شد.
شماری از سازمانهای پیشگام و صاحب نام مانند
(Cerner Corporation, International Business Machines Corporation. Mede Analytics, Oracle Corporation و غیره) در حال اجرای پروژههای متعددی در داخل و خارج از کلینیکها هستند تا پتانسیل بیشتر علم داده در مراقبتهای بهداشتی و تحول مثبت آن را نشان دهند. آنها به موفقیتهای چشمگیری در بازار گجتهای پوشیدنی (برای کنترل تناسب اندام، ورزش، حرکت، فعالیت بدنی، شمارش گامها، راه رفتن، دویدن، شنا، میزان مصرف انرژی و غیره) و همچنین ابزارهای تشخیص بیماری دست یافتهاند. به طور کلی در ادامه به بخش کوچکی از کاربردهای علم دادهها در صنعت مراقبتهای بهداشتی اشاره خواهد شد:
تصویربرداری پزشکی یا Medical Imaging
در این سناریوی خاص، رایانهها توانایی یادگیری خود را (Self-Learning Abilities) در تحلیل تصویربرداریهای MRI اشعه ایکس و ماموگرافی برای شناسایی الگوهای موجود در دادهها جهت یافتن تومورها یا هر گونه ناهنجاری در اعضاء را بکار میگیرند.
یکی از مؤثرترین کاربردهای علم داده در مراقبتهای بهداشتی و پزشکی، تصویربرداری پزشکی است. کامپیوترها قادر به تفسیر و شناسایی الگوهای موجود در دادههای عکسهای MRI، اسکنهای اشعه X، ماموگرافی و سایر تصاویر هستند و میتوانند تومورها، تنگی شریان، ناهنجاریهای موجود در اندامها و موارد دیگر را تشخیص دهند.
Iquity یک پلتفرم مراقبتهای بهداشتی و درمانی تحلیلی پیشبینیکننده در مقیاس بزرگ؛ مطالعهای را با تحلیل چهار میلیون شاخص داده از بیست میلیون ساکن نیویورک انجام داده است. نتایج آزمایش با ترکیبی از بیماران با تشخیص نادرست و بیماران با تشخیص درست از بیماری MS نشان داد که Iquity با دقت ۹۰ درصد پیشبینی ابتلا به این بیماری را 8 ماه پیش از شناسایی با ابزارهای مرسوم همچون تصویربرداری با رزونانس مغناطیسی و ضربه زدن به ستون فقرات میتواند انجام دهد. حتی جستجوهای آنلاین میتوانند به افزایش دقت تشخیص کمک کنند. محققان مایکروسافت دادههای 4/6 میلیون کاربر موتور جستجوی Bing را که به دنبال نتایج جستجوی پیشنهادی برای سرطان لوزالمعده بودند تجزیه و تحلیل کردند. محققان به این نتیجه رسیدند که با جستجوی کلمات کلیدی همچون لخته شدن خون و کاهش وزن میتوانند از موضوعات موتورهای جستجو برای پیشبینی تشخیص آینده سرطان لوزالمعده استفاده کنند.
ژن شناسی یا Genomics
در این حالت، ابزارهای پردازش داده از طریق تجزیه و تحلیل به درک دادههای حاصل از نسل بعدی آزمایشات تعیین توالی(Sequencing Experiments)، کمک میکنند.
داروهای جدید در بازار
شرکتهای داروسازی با تجزیهوتحلیل فرایندهای تولید تا مصرفکنندگان نهایی، از علم دادهها برای پیشبینی مالی و تأثیر احتمالی بازار روی یک داروی جدید استفاده میکنند.
پیدا کردن یک فرمولاسیون جدید و ارائه آن به بازار، چیزی حدود 12 سال زمان و 2.6 میلیارد دلار هزینه میبرد. صنعت دارو یکی از گرانترین صنایع حوزه سلامت است و دلیل اصلی هزینهبر بودن آن، انجام آزمایشها و فرآیندهای بسیار زیاد برای تولید داروهای بهتر و جدیدتر است. در صورتی که با استفاده از دادهها، میتوان براساس نتایج داروهای قبلی و دادههای ژنومیکس، چه در زمینه تولید دارو و چه در زمینه یافتن داروهای اختصاصی برای هر فرد فعالیت کرد.
تحلیل دادهها با هدف پیشبینی بیماریها
صنایع پزشکی از این دادهها، برای پیشبینی روندها و الگوهای رفتاری برای بهبود تجربه مشتری از مراقبتهای بهداشتی و همچنین محاسبه احتمال بروز بیماریها بر اساس رویکردی آماری، استفاده میکند.
مقالات بسیار زیادی درباره نحوه رفتار بیماریها و نحوه وقوع آنها وجود دارد؛ بیماریهای واگیر و بیماریهای غیر واگیر از این قاعده مستثنی نیستند. نتایج دادههای گوگل در سالهای 2003، 2008 و 2012 نشان میدهد که پیش از تشخیص طغیانهای بیماریهای SARS و MERS وH1N1 تعداد بسیار زیادی از مردم در آن مناطق علائم آن را جستجو کرده بودند. این نشان میدهد که اگر استفاده از کلمات جستجو در آن زمان را میدانستیم، احتمالاً بسیار زودتر میزان شیوع و بروز این بیماریها را متوجه میشدیم.
نظارت بر سلامت بیمار
با ذخیره کردن اطلاعات دیجیتال مربوط به سلامت بیماران، ارائهدهندگان خدمات بهداشتی میتوانند بهرهوری سیستمهای خود را بهبود بخشند. علاوه بر این تحلیل دادهها برای نظارت آنی بر پارامترهای سلامتی از جمله فشار خون، درجه حرارت بدن و ضربان قلب نیز استفاده میشود.
پیگیری وضعیت سلامتی بیماران
علم دادهها میتواند امکان پیگیری دقیق و مداوم شرایط سلامتی بیمار را فراهم کرده و در صورت وجود موارد بالقوه که بیمار مستعد ابتلا به آنها است، نیز هشدار خواهد داد. به عنوان مثال، در مورد کمک به افراد دیابتی در پیگیری وعدههای غذایی، فعالیت بدنی و میزان گلوکز خون، علم دادهها یک دارایی بسیار ارزشمند است.
تشخیص بیماریها
یکی دیگر از کاربردهای استفاده از علم داده در سلامت، یافتن علائم همراه هر بیماری است. بر اساس دادههایی که در مقالات علمی وجود دارد یا کلماتی که در موتورهای جستجو استفاده میشود، میتوان ارتباط بین علائم مختلف و بیماریها را بهتر پیدا کرد. اینگونه پزشکان با استفاده از سامانههای Decision Support System یا DSS میتوانند سریعتر و بهتر بیماریها را تشخیص دهند.
آکادمیهای ملی علوم مهندسی و پزشکی در آمریکا برآوردی در حدود 12میلیون تشخیص نادرست بیماری برای مردم آمریکا دارند که برخی اوقات میتواند عواقب خطرناکی را به همراه داشته باشد. به طوریکه در گزارشی میزان مرگ و میر ناشی از خطای تشخیصی را سالانه بین 40 تا 80 هزار مورد ثبت کرده است.
درمان
برای درمان یک فرد، درمانگر باید بتواند میزان عوارض، هزینه و بهبود شرایط فرد را تخمین بزند. به همین دلیل است که پزشکانی که در طول طبابت خود بیمار بیشتری دیدهاند، در درمان بیماران جدیدشان موفقتر عمل میکنند. در صورتی که این شرایط میتواند با استفاده از دادههای موجود برای هر درمانگری وجود داشته باشد و بتوانند برنامههای بهتری با توجه به شرایط بیمار خود طراحی و اجرا کنند. در این میان، با توجه به پروژه ژنوم انسانی و اطلاعاتی که در آن پروژه نهفته است، حتی میتوان پلنهای درمانی را براساس اطلاعات ژنتیکی هر فرد شخصیسازی کرد تا روند درمانی با عوارض کمتر و تأثیر بیشتری طی شود.
با داشتن اطلاعات بیشتر در مورد مشخصات فردی بیمار، اکنون میتوان از نسخههای دقیقتر و مراقبتهای شخصیتر استفاده کرد. با نوآوریهایی همچون پروژه National Institute Of Health’s 1000 Genome Project که یک مطالعه منبع باز از مناطقی از ژنوم مرتبط با بیماریهای شایع مانند بیماری عروق کرونر قلب و دیابت است، دانشمندان در حال یادگیری بیشتر در خصوص پیچیدگی ژنهای انسانی هستند و در حال دستیابی به این نتیجهاند که اغلب مقدار یکسان در خصوص دارو و درمان نمیتواند همه افراد بیمار با بیماری یکسان را درمان کند. علم داده در حال ظهور پدیده ژنتراپی است که شامل بکارگیری مواد ژنتیکی در داخل سلولها به جای داروهای مرسوم جهت جبران ژنهای غیرطبیعی است. دانشگاه Emory و مؤسسه سرطاندرمانی Aflac در پروژه NextBio بر روی نوعی تومور مغزی کودکان، که به طور مرسوم با پرتودرمانی درمان میشود، در حال انجام مطالعه است. بررسی دادههای ژنومیک و آزمایشات بالینی حاکی از یافتن بیومارکرهای خاص و شخصیسازی درمان است. تحقیقات مشابهی نیز در موسسه Mount Sinai بر روی سرطان مثانه صورت گرفته است.
مراقبتهای پس از بستری
یکی دیگر از چالشهای پس از بستری، مراقبتهایی است که بیماران باید نسبت به شرایط خود انجام دهند. به طور مثال پس از جراحی چه ریسکها یا خطراتی برای بیماران وجود دارد که باید به آنها توجه کنند؟ پزشک چه مواردی را باید گوشزد کند؟ در شرایطی احتمالاً یک عارضه اورژانسی به وجود آمده است و فرد سریعتر باید به بیمارستان مراجعه کند، اینها اطلاعاتی است که در حال حاضر در دسترس است، اما به دلیل عدم استفاده از علم داده، از آنها نتایج خاصی به دست نیامده است.
پس از هر گونه عمل جراحی یا درمانی، خطر بروز برخی عوارض و درد به صورت مکرر وجود دارد و کنترل این علائم پس از ترخیص بیمار از بیمارستان کاری دشوار است. نظارت از راه دور در خانه به پزشکان کمک میکند تا ضمن آزادسازی منابع محدود و پرهزینه بیمارستان به صورت بلادرنگ و مستمر با بیماران در تماس باشند. نرمافزار Intel Cloudera این امکان را برای کادر درمانی فراهم میکند تا بتواند وضعیت بیمار و تغییرات احتمالی وی در سی روز آینده را بر اساس پرونده پزشکی الکترونیکی ثبت شده بیمار و همچنین شرایط اقتصادی و اجتماعی محل بیمارستان، پیشبینی کند. پلتفرم SeamlessMD که برای مراقبتهای پس از عمل جراحی در بیمارستان Saint peter در شهر نیوجرسی طراحی شده است، این امکان را برای تیم مراقبت بیمار فراهم میکند تا از طریق بررسی دادههایی که بیمار روزانه در آن وارد میکند، وضعیت بیمار را بررسی کرده و هشدارهای هوشمند را در خصوص مشکلات احتمالی دریافت کنند. این عمل میتواند سبب کاهش میانگین یک روزه بستری شدن بیمار و همچنین صرفهجویی به میزان 1500 دلار در هزینههای وی شود.
علم داده در عملیات بیمارستانی
مسئله هزینه و محدودیت منابع در بیمارستانها موضوع حساسی است و نیاز به برنامههای پیچیده دارد. تعداد پرسنل در ساعات مشخص از شبانهروز برای به حداکثر رساندن کارایی، اطمینان از تعداد تخت کافی برای بیماران، برنامه اتاق عمل و عملکرد با کارایی بالا در آنجا نیاز به طرحریزی همه جانبه دارد. تجزیه و تحلیل پیشگویانه میتواند برنامهریزی را بهبود بخشیده و به طور مثال در تصمیمگیری برای اولویتدهی در ترخیص بیماران جهت آزادسازی منابع بیمارستان کمک کند.
نرمافزارهای تجزیه تحلیل در قسمت اورژانس در اطمیناندهی به طی پروسه مرتبط با هر بیمار به طور منظم، کاربرد دارند. مرکز درمانی دانشگاه Emory با استفاده از علم داده برای پیشبینی انواع مختلف تستهای آزمایشگاهی توانست زمان انتظار را تا 75% کاهش دهد. علاوه بر این، هوش تجاری میتواند وضعیت صورتحسابها را ساماندهی کند، بیمارانی را که مشکل دیرکرد پرداخت دارند شناسایی کند و با بخشهای مالی و بیمه همکاری کند.
دستیار مجازی
با استفاده از پلتفرمهای جامع موجود در بازار و به لطف علم دادهها، شناسایی بیماریها از طریق وارد کردن علائم مربوطه در نوار جستجوی برنامه، امکانپذیر شده است. دستیار مجازی بلافاصله بیماری را شناسایی میکند و راهکارهای سلامتی متناسب با آن را پیشنهاد میدهد.
موارد فوق تنها کاربردهای محدودی برای استفاده از علم داده در حوزه سلامت بودند. با توجه به میزان دادههایی که در این حوزه وجود دارد و همچنین اهمیت این بازار برای مردم، استفاده از علم داده باعث میشود هزینههای کلی این بازار کاهش یابد و زندگی با کیفیتتری برای بیماران و مردم به وجود بیاید.
آینده علم داده در پزشکی و مراقبتهای بهداشتی
اکنون زمان مناسبی برای علوم پزشکی و صنعت مراقبتهای بهداشتی مبتنی بر علم داده و افراد فعال در این حوزه همچون شرکتهای زیست فناوری و داروسازی، تأمینکنندگان، بیمارستانها، مراکز تحقیقاتی دانشگاهی و استارتاپهای تحت حمایت سرمایهگذار، است که در این تحول شرکت کنند. علم داده میتواند با پیشبینی احتمال وقوع بیماری، ارائه مشاورههای پزشکی مبتنی بر هوش مصنوعی در مناطق روستایی و دوردست، سفارشیسازی روشهای درمانی برای بیماران با ویژگیهای خاص خود بیمار و یافتن درمان برای سرطان، ایدز، ابولا و موارد دیگر، زندگیهای زیادی را از مرگ نجات دهد.
همچون سایر صنایع، نگرانیهایی در خصوص بکارگیری علم داده در مراقبتهای سلامت وجود دارد. از لحاظ منطقی، داده اغلب به صورت نامتمرکز در شهرها، بیمارستانها و واحدهای اداری متفاوت قرار دارند و ادغام آن در یک سیستم منسجم چالشبرانگیز است. بسیاری از بیماران در مورد حفاظت و محرمانگی اطلاعات پزشکی مربوط به خود نگران هستند، به ویژه آن که شرکتهایی همچون گوگل به علت به کارگیری اطلاعات حساس مربوط به سلامت به منظور اهداف تبلیغاتی، با طرح دعوی روبرو هستند. اگرچه علم داده میتواند کمبود پزشک در بسیاری از کشورها را برطرف کند، عدهای نگران مساله برونسپاری رابطه مهم پزشک و بیمار به الگوریتمهای کامپیوتری و ماشینها هستند.
علم داده روز به روز در حال گسترش است و با توانایی خود در تحلیل دادهها در مقیاس بزرگ میتواند تحول بزرگی در عرصه پزشکی و مراقبتهای بهداشتی و درمانی، در زمینههای گوناگون پدید آورد. در عصر کنونی و در آینده، دنیای علوم پزشکی به متخصصان زیادی در حوزه تحلیل دادهها و هوش مصنوعی نیازمند خواهد بود.
منابع
https://sahab.ir
https://nobka.ir
https://virgool.io
https://7learn.com
دیدگاه ها