چرا به داده کاوی در پزشکی علاقه مند شدم؟
یکی از سوالات مهمی که هر دانشجوی مقطع تحصیلات تکمیلی از خودش و دیگران می پرسد این است که جدیدترین و مطرح ترین موضوعات در رشته من چیست؟ اکثر دانشجویان به دغدغه های خود توجه نمی کنند. چه موضوعی است که برای ما حل آن مهم است و باعث تغییر در جامعه می شود؟!
موضوع پژوهش کارشناسی ارشدم از یکی از دردها و دغدغه هایم سرچشمه می گرفت. بحث جمع آوری داده ها و کاویدن داده های سلامت.
حدود ده سالی بود که درگیر یک بیماری خود ایمنی بودم. هر بار که پیش دکتر جدیدی می رفتم آزمایش های تکراری برای تشخیص بیماری نیاز بود و در آخر هم تشخیص ها همگی غلط از آب در می آمدند.در دهمین سال بیماری ام بودم، سال ۹۴، به واسطه دکتری که خودش هم بر روی ویلچر بود فهمیدم نام بیماری من چیست. دکتر با عصبانیت حرف هایش را در صورتم تف کرد! خانم شما خوب نمی شید! همه زن ها دنبال خوشگلی هستند! و نام بیماری ام را گفت؛ آن هم در میان هق هق ها و نگاه گنگم که می گفت: درد چه ربطی به خوشگلی دارد؟ از مطب او با عصبانیت بیرون آمدم. دستانم درد می کرد. هیچ چیز را نمی توانستم بردارم و دکتری بی مسئولیت که بویی از همدلی نبرده بود به من می گفت: نگران زیبایی ام هستم. به خانه برگشتم و شروع به خواندن مقالات انگلیسی در اینترنت کردم. لااقل الان نام بیماری را می دانستم! آن هم پس از ده سال!
درمانم در یک میوه قرمز رنگ بود. شاه توت! یک ماه بعد، خبری از آن بیماری ده ساله نبود و دردی که باعث می شد حتی نتوانم یک برگه را در بین انگشتانم نگه دارم چنان رخت بربسته بود که گویی وجودش شبیه به یک جک مزخرف بود!
این مساله من بود! چرا کسی داده های سلامت من را درست و ساختارمند جمع آوری نکرده بود!؟اگر همه داده هایم در یک پرونده سلامت الکترونیکی قرار می گرفت و درست تحلیل می شد این بیماری این همه سال همراه من نمی ماند. به هیچ وجه! چرا کسی به کاوش داده ها نمی پرداخت؟ علم داده کاوی سال ها بود که در صنعت، سیاست و بیزینس مورد استفاده قرار می گرفت و حلال بسیاری از مشکلات در نظام سلامت بود. حتی از منظر آموزشی هم این علم می توانست تحول عظیمی در آموزش پزشکی ایحاد کند.
اما مشکل کجای کار بود؟ آیا کسی از وجود این علم مطلع نبود؟ آیا زیرساخت ها فراهم نبود؟ آیا افراد از اجرایی کردن آن سر باز می زدند؟ آیا مشکل انگیزشی بود؟ آیا مشکل عدم آگاهی بود؟ به راستی مشکل چه بود؟
چرا به علمی که می توانست تحولات عجیبی در صنعت بزرگ سلامت ایجاد کند توجهی نمی شد؟ علمی که می توانست به من نوعی بگوید اگر با این روند جلو بروم در طی ۶ ماه یا ۱ سال آینده از سرطان می میرم. علمی که می توانست بر اساس داده های هر شخص داروی متفاوت و مختص به او برایش در نظر بگیرد. چرا از این علم در نظام سلامت استفاده نمی شد؟
شاید برای شما عجیب باشد که چطور یک تکنولوژیست آموزشی که با آموزش سر و کار دارد سر از چنین جایی در می آورد. شاید بهتر بود بر روی داده های یادگیری دانش آموزان یا داده کاوی آموزشی کار می کردم، درست است؟ اجازه دهید در انتها پاسخ این سوال شما را خواهم داد.
اما داده کاوی واقعا چیست؟و چرا مهم است؟
“دادهکاوی به مفهوم استخراج اطلاعات نهان و یا الگوها و روابط مشخص در حجم زیادی از دادهها در یک یا چند بانک اطلاعاتی بزرگ برای تصمیم گیریهای مناسب است” (هان، پی و کمبر[۱]، ۲۰۱۱).
دانش قدرتمند داده کاوی از منظر شناسایی نظم های پیچیده موجود در داده های عظیم از آدمیتوانمندتر است چرا که انسان به دلایل گوناگونی چون سرعت پردازشی، جهل دادهای و چگونگی تحلیل، قدرت تشخیص نظم های پیچیده موجود در داده ها را ندارد. داده کاوی، بصیرتی را به انسان می بخشد که او بتواند با سرعت و دقت بالاتری به حقایق پی ببربد، حقایقی که ممکن است خود آدمی در طی قرنها بدان برسد. این دانش در تمامی بخش ها از قعر اقیانوس گرفته تا فضای بی انتها قابل کاربست است.
چند مثال از داده کاوی در دنیای امروز
نمونهای بارز از داده کاوی، کشف ارتباط محصولات مختلف در هنگام خرید در فروشگاههای زنجیرهای است. برای فروشگاهها دانستن اینکه چه محصولاتی با یکدیگر به فروش میرسد، مهم است چرا که میتوانند از این اطلاعات در برگزاری هوشمندانه فستیوالهای فروش و نحوه ارایه کالا به مشتریان بهره برند. برای مثال هنگامیکه داده کاوی بر روی دادههای فروش یک فروشگاه زنجیرهای در آمریکای شمالی بکار رفت نشان داد که مردانی که قنداق بچه میخرند معمولا به همراه آن آب جو نیز خریداری میکنند. و مشتریانی که تلویزیون خریدهاند، به همراهش گلدان کریستالی نیز اغلب میخرند. نتایج داده کاوی در یک شرکت بزرگ تولید و عرضه پوشاک در اروپا نیز، مشخصکرد که خریداری کراواتهای ابریشمیمنجر به خرید گیره کروات مشکی رنگ در همان روز یا روزهای آتی میشود.
یک شرکت بزرگ آمریکایی دوبلاژ و تکثیر و عرضه فیلمهای سینمایی از داده کاوی برای شناسایی مشتریان بالقوه استفاده کرد. روابط مشتریان و هنرپیشههای سینمایی و نیز گروههای مختلف مشتریان بر اساس سبکهای فیلمها مشخص شد تا مشتریان بالقوه بر اساس علاقه آنها به هنرپیشهها و سبکهای مختلف شناسایی شود.
مثال بسیار جالب دیگر استفاده ستاد انتخاباتی اوباما از داده کاوی در سال ۲۰۱۲ است. آنها متوجه شدند که زنان ساکن سواحل غربی آمریکا که در دهه چهارم زندگی خویش هستند علاقه زیادی به جورج کلونی دارند. حتی برخی از زنان مجرد، حاضرند تا برای غذا خوردن درهالیود با کلونی یا اوباما هزینه کنند. لذا دستیاران ارشد اوباما از نتایج داده کاوی و تحلیل دادههایی که بر روی اطلاعات دو سال گذشته انجام شده بود استفاده کردند. بر اساس نتایج تصمیم به برگزاری مجادله/ مباحثه ای شبیه به مباحثه کلونی- اوباما گرفته شد. آنان با یک فهرست پر از گزینههای عالی جهت مباحثه با اوباما مواجه بودند، اما بنا به توصیه یک مشاور ارشد مبارزات انتخاباتی، سارا جسیکا پارکر، برگزیده شد. و به اینترتیب شام بعدی با باراک اوباما به فرصتی برای غذا خوردن در روستای غربی براون استون پارکر مبدل شد. فهم این قاعده که ایده مجادله – مباحثه با پارکر بر اساس تحلیل دادهها و انجام داده کاوی و کشف رابطه علاقه برخی از مردم به برپایی ضیافتهای شام با افراد مشهور حاصل شده است برای بسیاری از عموم مردم مشکل بود. در مبارزه انتخاباتی اوباما همه چیز توسط گروهی از متخصصان و دانشمندان بنام داده کاوکه به صورت محرمانه به تحلیل و کاوش در دادههای مرتبط انتخاباتی میپرداختند اندازه گیری شد. پس از پیروزی در انتخابات یکی از مشاوران ارشد ستاد انتخاباتی با مجله تایمز مصاحبه کرده و از تاثیر شگرف داده کاوی و تجزیه و تحلیل دادههای به دست آمده سخن گفت. مواردی مانند افزایش ۱ میلیارد دلاری کمکهای مالی به ستاد اوباما، همچنین نتایج استفاده از آگهیها و تبلیغات تلویزیونی براساس تحلیل نظرات مخاطبان که به افزایش کارایی و اثربخشی در تماسهای تلفنی و ارسال مستقیم پستی و استفاده از رسانههای اجتماعی منجر گردیده بود.
[۱] Han, Kamber, & Pei
[۲] Gartner, Inc.