خب بریم سر اصل ماجرا! چند روزه توی شبکههای اجتماعی و سایتهای تکنولوژی یه خبر داغ دستبهدست میشه؛ هوش مصنوعی OpenAI تونسته تو المپیاد جهانی ریاضی ۲۰۲۵ به اندازه یه مدال طلایی عمل کنه!
ماجرا از این قراره که یه مدل تحقیقاتی (نه همین چتباتایی که ما و شما داریم باهاشون چت میکنیم!) ساخته شده و این مدل تونسته از ۶ تا سوال سخت المپیاد جهانی ریاضی، ۵ تاشو درست و حسابی حل کنه. داورای مسابقه و حتی چند تا از مدالآورای قدیمی المپیاد هم وقتی جوابهای مدل رو دیدن گفتن: «آقا این دیگه واقعا عجیبه! هم درست حل کرده، هم توضیحاتش مثل یه ریاضیدان حرفهایه!»
ولی صبر کنید… این وسط یه جنگ لفظی هم راه افتاده! تیم OpenAI میگه: «بله، ما به سطح مدال طلا رسیدیم!» اما از اون طرف دیپمایند (رقیب اصلیشون) میگه: «نه بابا! شما نهایتاً در حد نقره بودید، زیادی دارید شلوغش میکنید!»
آیا این یعنی هوش مصنوعی میتونه تو المپیاد شرکت کنه؟
خب فعلاً نه. این مدلی که تونسته این کارو بکنه هنوز در حال تست و آزمایشاته و به قول خود اوپنایآی، برای استفاده عمومی آماده نیست. تازه خود مهندسهاش هم میگن «هنوز کلی راه داریم تا یه هوش مصنوعی همهفنحریف بسازیم.»
حل کردن سوالات المپیاد جهانی ریاضی، فقط بلد بودن فرمولها نیست. این سوالا طراحی شدن که خلاقیت، استدلال منطقی و صبر یه آدمو محک بزنن. حالا اینکه یه مدل هوش مصنوعی تونسته همچین کاری بکنه، یعنی داریم وارد یه دنیای جدید میشیم که ماشینها شاید بتونن مثل مغز انسان فکر کنن!
برخی کارشناسها میگن این پیشرفتها باید با احتیاط پیش بره. چون هر چی هوش مصنوعی قویتر بشه، مدیریت و کنترلش هم سختتر میشه. یه مدل که میتونه سوالای المپیاد جهانی رو حل کنه، فردا شاید بتونه تصمیمهای خیلی جدیتری بگیره.
نسخه پیشرفته Gemini با حالت Deep Think رسماً به استاندارد مدال طلا در المپیاد جهانی ریاضی رسید
گوگل دیپمایند اعلام کرده مدل پیشرفتهشون به اسم Gemini Deep Think تونسته تو المپیاد جهانی ریاضی (همون IMO معروف) درست مثل یه نابغه واقعی عمل کنه و سطح مدال طلا رو بگیره.
المپیاد جهانی ریاضی از سال ۱۹۵۹ هر ساله برگزار میشه و یه جورایی میشه گفت سختترین رقابت دنیاست. ۶ تا سوال خفن داره که هر سوالش میتونه یه دانشمند رو برای ساعتها مشغول کنه!
حالا گوگل پارسال مدلهای AlphaGeometry و AlphaProof رو فرستاد توی این چالش و اونا تونستن ۴ تا از ۶ تا سوالو حل کنن و در حد مدال نقره ظاهر بشن. امسال اما یه لول بالاتر رفتن؛ Gemini Deep Think وارد شد و از ۶ تا سوال، ۵ تاشو قورت داد! نتیجه؟ ۳۵ امتیاز از ۴۲ امتیاز ممکن = مدال طلا.
چی باعث شد امسال موفقتر باشن؟
پارسال مدلهای دیپمایند باید اول سوالارو از زبان طبیعی به زبانهای رسمی مثل Lean ترجمه میکردن و کلی محاسبه میکردن تا جواب بدن. تازه اونم ۲-۳ روز طول میکشید!
امسال اما Gemini بدون هیچ ترجمه اضافی، مستقیم با همون زبان طبیعی سوالارو خوند و تو همون ۴.۵ ساعت زمان مسابقه، جوابای کامل و دقیق داد.
دلیل اصلی موفقیتش؟ یه حالت جدید به اسم Deep Think که اجازه میده مدل بهجای دنبال کردن یه راهحل خطی، همزمان چند مسیر حل مختلف رو بررسی کنه و بهترین رو انتخاب کنه.
گوگل میگه این نسخه پیشرفته از Gemini فعلاً برای استفاده عمومی آماده نیست و فقط یه سری ریاضیدان و متخصص قراره باهاش کار کنن. ولی بهزودی ممکنه برای کاربرای Google AI Ultra عرضه بشه.
یعنی هوش مصنوعی داره ریاضیدان میشه؟
یهجورایی بله! الان دیگه این مدلها دارن از یه ماشین ساده فرمولزن، به یه چیز خیلی شبیه به مغز آدم نزدیک میشن. ولی گوگل میگه هنوز تا هوش مصنوعی عمومی (AGI) کلی راه داریم و فعلاً تمرکزشون روی کمک به دانشمندا و مهندساست، نه جایگزینی آدما.
(منبع)