آموزش و فناوری

روش جدید پژوهشگران دانشگاه تهران برای فهم بهتر داده‌ها توسط هوش مصنوعی

به گزارش الفبای رشد به نقل از مهر،  در پی دستیابی تیم پژوهشی دانشکدگان علوم، متشکل از دکتر باقر باباعلی، دانشیار دانشکده ریاضی، آمار و علوم کامپیوتر و محمدمهدی عزیزی، دانشجوی دکترای علوم کامپیوتر دانشکدگان علوم، به نتایج پیشرو در طبقه‌بندی سری‌های زمانی با تمرکز بر معماری «میکسر ماتریسی» و روش «توکن‌سازی» دکتر باباعلی، سرپرست تیم، ابعاد نظری و عملی این دستاورد را تشریح کرد.

وی در تحلیل یافته‌های پژوهشی جدید با عنوان «توجه به توکن‌سازی» گفت: «موفقیت مدل‌های مبتنی بر توجه در حوزه‌های پیچیده‌ای مانند تشخیص پزشکی و پیش‌بینی مالی، بیش از هر چیز وابسته به شیوه هوشمندانه قطعه‌بندی و درک معنای داده‌های زمانی است. وی این فرآیند را کلید غلبه بر چالش تنوع گسترده در دنیای سری‌های زمانی دانست».
دکتر باباعلی با اشاره به چالش اصلی این حوزه گفت: «تنوع بی‌نظیر در ماهیت، نویز، مقیاس و فرکانس داده‌های سری زمانی، رؤیای ساخت یک مدل پایه جهانی را به یکی از مسائل دشوار هوش مصنوعی تبدیل کرده بود. پژوهش حاضر با بازتعریف چارچوب میکسر ماتریسی به عنوان یک جعبه ابزار، گامی ساختاریافته به سوی این هدف برداشته است».
وی در توضیح اهمیت یافته «توجه به توکن‌سازی» افزود: «نتایج به وضوح نشان می‌دهد که صرف استفاده از یک معماری قدرتمند مانند ترنسفورمر کافی نیست. «توکن‌سازی» مرحله تبدیل داده خام به زبانی است که مدل می‌فهمد. اگر این ترجمه ناقص یا نادرست انجام شود، مدل هرچقدر هم قوی باشد، بر روی داده‌های اشتباه آموزش دیده است. تمرکز این تحقیق بر بهینه‌سازی دقیق این مرحله، یعنی «تعبیه قطعات» یا Patch Embedding، دلیل اصلی ارتقای چشمگیر دقت مدل‌هاست».

نوشته های مشابه

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

دکمه بازگشت به بالا