روش جدید پژوهشگران دانشگاه تهران برای فهم بهتر دادهها توسط هوش مصنوعی

به گزارش الفبای رشد به نقل از مهر، در پی دستیابی تیم پژوهشی دانشکدگان علوم، متشکل از دکتر باقر باباعلی، دانشیار دانشکده ریاضی، آمار و علوم کامپیوتر و محمدمهدی عزیزی، دانشجوی دکترای علوم کامپیوتر دانشکدگان علوم، به نتایج پیشرو در طبقهبندی سریهای زمانی با تمرکز بر معماری «میکسر ماتریسی» و روش «توکنسازی» دکتر باباعلی، سرپرست تیم، ابعاد نظری و عملی این دستاورد را تشریح کرد.
وی در تحلیل یافتههای پژوهشی جدید با عنوان «توجه به توکنسازی» گفت: «موفقیت مدلهای مبتنی بر توجه در حوزههای پیچیدهای مانند تشخیص پزشکی و پیشبینی مالی، بیش از هر چیز وابسته به شیوه هوشمندانه قطعهبندی و درک معنای دادههای زمانی است. وی این فرآیند را کلید غلبه بر چالش تنوع گسترده در دنیای سریهای زمانی دانست».
دکتر باباعلی با اشاره به چالش اصلی این حوزه گفت: «تنوع بینظیر در ماهیت، نویز، مقیاس و فرکانس دادههای سری زمانی، رؤیای ساخت یک مدل پایه جهانی را به یکی از مسائل دشوار هوش مصنوعی تبدیل کرده بود. پژوهش حاضر با بازتعریف چارچوب میکسر ماتریسی به عنوان یک جعبه ابزار، گامی ساختاریافته به سوی این هدف برداشته است».
وی در توضیح اهمیت یافته «توجه به توکنسازی» افزود: «نتایج به وضوح نشان میدهد که صرف استفاده از یک معماری قدرتمند مانند ترنسفورمر کافی نیست. «توکنسازی» مرحله تبدیل داده خام به زبانی است که مدل میفهمد. اگر این ترجمه ناقص یا نادرست انجام شود، مدل هرچقدر هم قوی باشد، بر روی دادههای اشتباه آموزش دیده است. تمرکز این تحقیق بر بهینهسازی دقیق این مرحله، یعنی «تعبیه قطعات» یا Patch Embedding، دلیل اصلی ارتقای چشمگیر دقت مدلهاست».



