نتایج جستجو

پرش به ناوبری پرش به جستجو
  • ...''T5''' (Text-to-Text Transfer Transformer) شامل مجموعه‌ای از مدل‌های زبان بزرگ است که توسط هوش مصنوعی گوگل در سال 2019 ارائه شد. این مدل‌ها بر پایه معماری مدل‌های T5 ابتدا با استفاده از مجموعه‌های عظیمی از داده‌های متنی و کد، پیش‌آموزش دا ...
    ۲۰ کیلوبایت (۱٬۲۲۶ واژه) - ۱۳ مارس ۲۰۲۵، ساعت ۰۴:۱۹
  • به صورت معمول از رگرسیون لجستیک و دیگر [[:en:Log-linear_model|مدل‌های لاگ-خطی]] در [[یادگیری ماشین]] استفاده می‌شود. یک تعمیم از تابع لجستیک به چ ...برای توابع فعال‌سازی یا «کوبیدن یا له‌کردن» که از آن برای اتصال به مقادیر بزرگ و برای محدود نگهداشتن پاسخ شبکه عصبی استفاده می‌شود،<ref name="Gershenfeld- ...
    ۱۸ کیلوبایت (۷۷۷ واژه) - ۱۹ فوریهٔ ۲۰۲۳، ساعت ۰۶:۳۵
  • ...حافظه بلندمدت کوتاه‌مدت (LSTM) کارایی بیشتری دارد و پایه و اساس بسیاری از مدل‌های یادگیری ماشین پیش‌آموزشی مانند BERT<ref>Bidirectional Encoder Representatio ترنسفورمرها به دلیل موازی‌سازی آسان، سرعت و دقت بالا، به یکی از محبوب‌ترین مدل‌های یادگیری ماشین برای پردازش زبان طبیعی تبدیل شده‌اند. ترنسفورمرها در طیف وسیع ...
    ۲۹ کیلوبایت (۸۸۶ واژه) - ۲۳ دسامبر ۲۰۲۴، ساعت ۱۶:۰۰
  • {{short description|سری مدل‌های زبانی توسعه‌یافته توسط گوگل ای‌آی}} {{Infobox software | name = بازنمایی‌های رمزگ * [[مدل زبانی بزرگ]] ...
    ۴۴ کیلوبایت (۲٬۱۶۰ واژه) - ۲۰ فوریهٔ ۲۰۲۵، ساعت ۲۱:۰۶
  • ...ر کاهش می‌یابد، و از '''حل‌کننده‌های مجموعه جواب''' (برنامه‌های تولیدکننده مدل‌های پایدار) برای انجام جستجو استفاده می‌شود. فرایند محاسباتی استفاده شده در طرا ...as Postscript]</ref> ارائه شد. دیدگاه آن‌ها مبتنی بر رابطه بین برنامه‌ها و مدل‌های پایدار بود.<ref>{{cite book|first1=V.S.|last1=Subrahmanian|first2=C.|last2= ...
    ۳۱ کیلوبایت (۲٬۳۶۷ واژه) - ۱۲ اکتبر ۲۰۲۳، ساعت ۰۷:۳۵
  • دارای حذف سور باشد، برای بررسی مجموعه‌های تعریف شدنی در مدل‌های آن، تنها کافی است مجموعه‌های تعریف‌شده با ترکیبات بولیِ فرمول‌های اتمی را د (زبانی که با افزودن ثابت برای ازای هر ...
    ۴۲ کیلوبایت (۱٬۹۲۹ واژه) - ۶ سپتامبر ۲۰۲۴، ساعت ۱۲:۲۰
  • ...هوش مصنوعی در چین (انگلیسی)|شرکت هوش مصنوعی]] چینی است که [[مدل‌های زبانی بزرگ]] [[نرم‌افزار آزاد و متن‌باز|متن‌باز]] را توسعه می‌دهد. دفتر اصلی این شرکت ...میلیارد پارامتر مقیاس‌پذیری داشت. این مدل برای رقابت با دیگر مدل‌های زبانی بزرگ آن زمان توسعه یافت و عملکردی نزدیک به GPT-۴ داشت. البته، این مدل با چالش‌ها ...
    ۷۲ کیلوبایت (۳٬۵۸۱ واژه) - ۶ فوریهٔ ۲۰۲۵، ساعت ۱۴:۱۹
  • ...ر می‌گیرند، به این معنی توزیع درجه‌شان توانی (یا بی‌مقیاس) است، در حالی که مدل‌های تصادفی‌ای همچون [[مدل اردوش-رنیی]] و [[مدل واتس و استروگاتز|مدل واتس-اشتروگ ...و مخرج، مجموع درجات راس‌هایی ست که تا پیش از این مرحله وجود داشته‌اند.(به زبانی دیگر، مخرج، دوبرابر تعداد یال‌های موجود در شبکه است.) ...
    ۱۳ کیلوبایت (۳۵۴ واژه) - ۲۵ نوامبر ۲۰۲۴، ساعت ۰۹:۱۶
  • ...وعی هستند که برای درک، تولید و پاسخگویی به زبان انسان طراحی شده‌اند. آنها «بزرگ» نامیده می‌شوند زیرا حاوی '''میلیاردها پارامتر''' هستند که به آنها امکان می ...ver|date=Jan 9, 2024|website=Analytics India Magazine}}</ref> مدل‌های زبان بزرگ در حدود سال ۲۰۱۸ ظاهر شدند و در گستره وسیعی از وظایف، عملکرد بالایی دارند.< ...
    ۷۴ کیلوبایت (۳٬۰۲۹ واژه) - ۱۷ مارس ۲۰۲۵، ساعت ۰۹:۳۶
  • ...دایت و راهنمایی مدل‌های هوش مصنوعی، به خصوص [[مدل زبانی بزرگ|مدل‌های زبانی بزرگ]]، است. ...task_learners.pdf) |publisher=OpenAI blog |quote="ما نشان دادیم که مدل‌های زبانی می‌توانند وظایف پایین‌دستی را در شرایط بدون شلیک (zero-shot) انجام دهند - ب ...
    ۸۱ کیلوبایت (۵٬۱۲۱ واژه) - ۱۶ سپتامبر ۲۰۲۴، ساعت ۱۷:۲۶
  • ...ید ریاضی–بیشینه کردن|الگوریتم حداکثرسازی انتظارات]] آموزش ببیند، که همانند مدل‌های مخلوط گاوسی است. به عنوان یک مثال خاص، در مرحله انتظار، "بار" (که برای توضی ...ت. در دوره پیش از یادگیری عمیق، MoE کاربردهای دیگری از جمله، در پیاده‌سازی مدل‌های بسیار بزرگتر پیدا کرد. در این کاربرد از MoE به عنوان یک روش ساده برای انجام ...
    ۳۸ کیلوبایت (۲٬۲۵۷ واژه) - ۲۸ سپتامبر ۲۰۲۴، ساعت ۱۱:۱۵
  • ...ید ریاضی–بیشینه کردن|الگوریتم حداکثرسازی انتظارات]] آموزش ببیند، که همانند مدل‌های مخلوط گاوسی است. به عنوان یک مثال خاص، در مرحله انتظار، "بار" (که برای توضی ...ت. در دوره پیش از یادگیری عمیق، MoE کاربردهای دیگری از جمله، در پیاده‌سازی مدل‌های بسیار بزرگتر پیدا کرد. در این کاربرد از MoE به عنوان یک روش ساده برای انجام ...
    ۴۳ کیلوبایت (۲٬۸۲۲ واژه) - ۲۲ آوریل ۲۰۲۴، ساعت ۱۹:۲۳
  • ...های مکالمه‌کننده)، یا وظایف [[بینایی رایانه‌ای]] (مانند [[مدل متن به تصویر|مدل‌های متن به تصویر]] ، و توسعه ربات‌های بازی‌های ویدئویی. در حالی که RLHF یک روش ...نظر ریاضی مورد مطالعه قرار گرفت و به این نتیجه منتهی شد که اجرای RLHF تحت مدل‌های بازخوردی مختلف مرزهای پیچیدگی یکسانی دارد.<ref name="xiejiang" /><ref name= ...
    ۵۲ کیلوبایت (۲٬۴۳۲ واژه) - ۲۹ ژانویهٔ ۲۰۲۵، ساعت ۲۰:۱۱
  • ...جان وارناک در حال گسترش و توسعهٔ یک مفسر برای پایگاه‌داده گرافیکی سه بعدی بزرگ پناه‌گاه نیویورک بود. وارناک سیستم طراحی زبان را به منظور پردازش گرافیک شکل ...و آن‌ها را متقاعد کرد تا پست‌اسکریپت را طوری تغییر دهند تا بتواند به عنوان زبانی برای چاپگرهای لیزری مورد استفاده قرار گیرد. ...
    ۳۷ کیلوبایت (۶۰۷ واژه) - ۳۱ مارس ۲۰۲۴، ساعت ۰۵:۱۰
  • ...dl.acm.org/citation.cfm?id=160438|author2=Almasi, George S.}}</ref> مشکلات بزرگ را اغلب می‌توان به مشکلات کوچکتر تقسیم و سپس همزمان حل کرد. چندین فرم مختلف ...] و [[همگام‌سازی (علوم رایانه)|همگام سازی]] بین زیر-وظایف مختلف معمولاً از بزرگ‌ترین موانع دستیابی به عملکرد بهینه در برنامهٔ موازی است. ...
    ۶۴ کیلوبایت (۱٬۸۰۰ واژه) - ۱۸ دسامبر ۲۰۲۴، ساعت ۱۳:۳۷
  • ...ذشت زمان و به موازات کشف عناصر تازه، جدول بارها دستخوش تغییر و پالایش شد و مدل‌های نظری نوین برای توضیح رفتار شیمیایی عناصر ارائه شد. امروزه استفاده از جدول ت ...زمان از سوی شیمی‌دانان به عنوان عنصر شناخته نمی‌شدند، با توجه به ویژگی‌های زبانی و فرهنگی خاص هر منطقه، دارای نام‌های محلی بودند. حتی پس از شناخته شدن مفهوم ...
    ۴۷ کیلوبایت (۶۲۱ واژه) - ۲۲ ژانویهٔ ۲۰۲۵، ساعت ۲۳:۵۴
  • روان‌شناسان فرگشتی گاهی به [[شامپانزه]]ها، [[بونوبو]]ها و دیگر میمون‌های بزرگ برای شناخت رفتار اجدادی انسان نگاه می‌کنند.<ref name=moralanimal>رایت 1995< ...arper Business.</ref> استدلال او این است که انسان‌ها برای کار در ساختارهای بزرگ و ناشناس بوروکراتیک با سلسله مراتب رسمی سازگار نیستند. ذهن انسان همچنان به ...
    ۲۲۲ کیلوبایت (۸٬۸۹۲ واژه) - ۱۳ مارس ۲۰۲۵، ساعت ۱۴:۴۹