علوم شناختی چه جایگاهی در دادهکاوی پیدا کرده است؟
(توجه: این مصاحبه در زمستان 1399 انجام شده است)
یکی از مباحثی که ستاد علوم شناختی آن را دنبال میکند بحث دادهکاوی به توان شناختی است. اساساً دادهکاوی چیست و ارتباط آن با علوم شناختی به چه معناست؟
دادهکاوی لزوماً شناختی نیست. به دو طریق هوشمند و غیرهوشمند میتوان دادهکاوی کرد. در دادهکاوی هوشمند با کمک هوش مصنوعی این فرآیند انجام میشود.
اما دادهکاوی به توان شناختی که مرتبط است با علوم شناختی در واقع بخشی از دادهکاوی به روش هوشمند است. وقتی از دادههایی، مثل دادههای متنی، بانک اطلاعاتی در دست نیست و به دنبال استخراج معانی هستید، بحث کاملاً شناختی است و نیاز به زبانشناسی شناختی دارد.
ستاد در بحث دادهکاوی شناختی چه اقداماتی را پیگیری کرده است؟
موضوع دادهکاوی هوشنمد در حوزه فعالیتهای ستاد آی تی است، اما ما در جلسه شورای عالی انقلاب فرهنگی این بحث را مطرح کردیم که بخشی از دادهکاوی کاملاً شناختی است و این مبحث باید به دو قسمت تقسیم شود.
موضوعی که مورد توجه دکتر عاملی هم قرار گرفت. چرا که وقتی ما از موضوعاتی مانند تابآوری جامعه و یا بحث شبکههای اجتماعی صحبت میکنیم این موارد کاملاً شناختی است که باید با دادهکاوی هوشمند به توان شناختی به آنها پرداخت.
موضوع تابآوری جامعه بحثی کاملا شناختی است که با دادهکاوی هوشمند به توان شناختی در شبکههای اجتماعی میتوان به آن پرداخت.
به موضوع اهمیت زبانشناسی در دادهکاوی به توان شناختی اشاره کردید. چه گروهی میتوانند در این زمینه مؤثر باشند؟
ما دربحث دادهکاوی شناختی 19 پروژه زیرساختی در دنیا داریم. در این پروژهها ما نیاز به افراد متخصص در حوزه زبانشناسی و علوم داده داریم. خصوصاً در بحثهای علوم اجتماعی. در این 19 پروژه زیرساختی، در دنیا بانک اطلاعاتی وجود دارد، اما در ایران چندان به این موضوع پرداخته نشده است و ما دادههای محدودی داریم که در سطح یک همان nlp رایج است. باید در این زمینه با رویکرد زبانشناسی شناختی به این موضوع بپردازیم. بحثی که در دنیا هم اقدامات کمی برای آن انجام شده و در ایران هم هنوز فعالیتی صورت نگرفته است.
برای اینکه ستاد در این حوزه ورود کند چه برنامههایی را در نظر دارید؟
ما دو پروژه برای این موضع تعریف کردهایم تا حاصل آن رسیدن به سطح دو باشد. اما یکی از چالشهای اصلی ما در بحث دادهکاوی افرادی است که در حوزه زبانشناسی فعالیت میکنند. چرا که این عزیزان بسیار فاصله دارند با رویکرد محاسباتی و بعضاً حتی آن را قبول هم ندارند. دوستانی هم که کار محاسباتی شناختی انجام میدهند، در بهترین حالت با ان آل پی رایج کار میکنند و با حوزه شناختی بیگانهاند. با این همه ما در تلاش هستیم تا با تعریف دو پروژهای که ذکر کردم از آن 19 پروژه زیرساختی عبور کنیم و به سطح دو دادهکاوی در علوم شناختی برسیم.
یکی از چالشهای اصلی ما در دادهکاوی افرادی هستند که در حوزه زبانشناسی فعالیت می کنند. چراکه این عزیزان بسیار با رویکرد محاسباتی فاصله دارند و بعضا حتی آن را قبول ندارند. از طرفی دوستانی هم که کار محاسباتی انجام میدهند با حوزه شناختی بیگانهاند.
چالشی را در زمینه دادهکاوی برگزار کردید. در این چالش به دنبال چه هدفهایی بودید؟
در این چالش به دنبال این بودیم تا مجموعه اقداماتی که در حوزه دادهکاوی انجام شده را شناسایی کنیم. اینکه برای دادهکاوی به توان شناختی چه کمبودهایی داریم.
در چالش دادهکاوی توانستیم 12 گروه که فعالیتهای خوبی را در این زمینه داشتند، بیابیم تا 19 پروژه زیرساختی را در اختیار آنها قرار دهیم. تلاش ما در این راستاست که این گروههای دادهکاوی را با حمایت مالی به شرکت تبدیل کنیم تا بتوانند خدمت ارائه کنند و در گام بعدی بتوانند محصول خود را به فروش برسانند. با چند شتابدهنده هم برای این منظور توافقاتی داشتیم.
در بحث بانک اطلاعاتی که مطرح کردید، اگر کسی به عنوان مثال بخواهد روی شرکتهای دیجیکالا و اسنپ دادهکاوی کند، چقدر دسترسی به اطلاعات وجود دارد؟
به موضوع خوبی اشاره کردید. واقعیت ماجرا این است که دسترسی به دادههای اطلاعاتی به دلیل نبود بانک اطلاعاتی نظاممند در ایران بسیار سخت است.
یکی از مشکلات اساسی ما در کشور همین است. در جلساتی که با شورای عالی انقلاب فرهنگی و معاونت ریاست جمهوی داشتیم در این خصوص هم گفتوگوهایی انجام دادیم. اینکه در حوزه سلامت، حقوق، اقتصاد و … دسترسی به اطلاعاتی، که در بیشتر مواقع محرمانه هم نیست، به سختی صورت میگیرد و یا میسر نیست. این موضوع باعث میشود تا کشور هزینههای زیادی را بعضاً متحمل شود و تصمیمگیری و پیشبینیهای لازم در رویدادهای مختلف را سخت میکند.
برای سال 1400 چه هدفگذاری را تعیین کردهاید؟
فراخوانی که امسال برای دادهکاوی دادیم، همچنان باز است. مهمترین هدف ما در سال آینده همچنان شناسایی گروههای جدید دادهکاوی شناختی است و اینکه گروههایی را که پیش از این شناسایی کردیم، بتوانیم به سمتی هدایت کنیم که بتوانند خدمت ارائه کنند و البته آن را به فروش برسانند.
در تلاش هستیم تا پروژهایی در زمینه دادهکاوی شناختی هوشمند تعریف کنیم تا این پروژهها به 19 پروژه زیرساختی که پیش از این وجود داشتند، اضافه شوند.
منبع: مجله مغز و شناخت، شماره 16، زمستان 1399