نتایج جستجو
پرش به ناوبری
پرش به جستجو
- ...''T5''' (Text-to-Text Transfer Transformer) شامل مجموعهای از مدلهای زبان بزرگ است که توسط هوش مصنوعی گوگل در سال 2019 ارائه شد. این مدلها بر پایه معماری مدلهای T5 ابتدا با استفاده از مجموعههای عظیمی از دادههای متنی و کد، پیشآموزش دا ...۲۰ کیلوبایت (۱٬۲۲۶ واژه) - ۱۳ مارس ۲۰۲۵، ساعت ۰۴:۱۹
- به صورت معمول از رگرسیون لجستیک و دیگر [[:en:Log-linear_model|مدلهای لاگ-خطی]] در [[یادگیری ماشین]] استفاده میشود. یک تعمیم از تابع لجستیک به چ ...برای توابع فعالسازی یا «کوبیدن یا لهکردن» که از آن برای اتصال به مقادیر بزرگ و برای محدود نگهداشتن پاسخ شبکه عصبی استفاده میشود،<ref name="Gershenfeld- ...۱۸ کیلوبایت (۷۷۷ واژه) - ۱۹ فوریهٔ ۲۰۲۳، ساعت ۰۶:۳۵
- ...حافظه بلندمدت کوتاهمدت (LSTM) کارایی بیشتری دارد و پایه و اساس بسیاری از مدلهای یادگیری ماشین پیشآموزشی مانند BERT<ref>Bidirectional Encoder Representatio ترنسفورمرها به دلیل موازیسازی آسان، سرعت و دقت بالا، به یکی از محبوبترین مدلهای یادگیری ماشین برای پردازش زبان طبیعی تبدیل شدهاند. ترنسفورمرها در طیف وسیع ...۲۹ کیلوبایت (۸۸۶ واژه) - ۲۳ دسامبر ۲۰۲۴، ساعت ۱۶:۰۰
- {{short description|سری مدلهای زبانی توسعهیافته توسط گوگل ایآی}} {{Infobox software | name = بازنماییهای رمزگ * [[مدل زبانی بزرگ]] ...۴۴ کیلوبایت (۲٬۱۶۰ واژه) - ۲۰ فوریهٔ ۲۰۲۵، ساعت ۲۱:۰۶
- ...ر کاهش مییابد، و از '''حلکنندههای مجموعه جواب''' (برنامههای تولیدکننده مدلهای پایدار) برای انجام جستجو استفاده میشود. فرایند محاسباتی استفاده شده در طرا ...as Postscript]</ref> ارائه شد. دیدگاه آنها مبتنی بر رابطه بین برنامهها و مدلهای پایدار بود.<ref>{{cite book|first1=V.S.|last1=Subrahmanian|first2=C.|last2= ...۳۱ کیلوبایت (۲٬۳۶۷ واژه) - ۱۲ اکتبر ۲۰۲۳، ساعت ۰۷:۳۵
- دارای حذف سور باشد، برای بررسی مجموعههای تعریف شدنی در مدلهای آن، تنها کافی است مجموعههای تعریفشده با ترکیبات بولیِ فرمولهای اتمی را د (زبانی که با افزودن ثابت برای ازای هر ...۴۲ کیلوبایت (۱٬۹۲۹ واژه) - ۶ سپتامبر ۲۰۲۴، ساعت ۱۲:۲۰
- ...هوش مصنوعی در چین (انگلیسی)|شرکت هوش مصنوعی]] چینی است که [[مدلهای زبانی بزرگ]] [[نرمافزار آزاد و متنباز|متنباز]] را توسعه میدهد. دفتر اصلی این شرکت ...میلیارد پارامتر مقیاسپذیری داشت. این مدل برای رقابت با دیگر مدلهای زبانی بزرگ آن زمان توسعه یافت و عملکردی نزدیک به GPT-۴ داشت. البته، این مدل با چالشها ...۷۲ کیلوبایت (۳٬۵۸۱ واژه) - ۶ فوریهٔ ۲۰۲۵، ساعت ۱۴:۱۹
- ...ر میگیرند، به این معنی توزیع درجهشان توانی (یا بیمقیاس) است، در حالی که مدلهای تصادفیای همچون [[مدل اردوش-رنیی]] و [[مدل واتس و استروگاتز|مدل واتس-اشتروگ ...و مخرج، مجموع درجات راسهایی ست که تا پیش از این مرحله وجود داشتهاند.(به زبانی دیگر، مخرج، دوبرابر تعداد یالهای موجود در شبکه است.) ...۱۳ کیلوبایت (۳۵۴ واژه) - ۲۵ نوامبر ۲۰۲۴، ساعت ۰۹:۱۶
- ...وعی هستند که برای درک، تولید و پاسخگویی به زبان انسان طراحی شدهاند. آنها «بزرگ» نامیده میشوند زیرا حاوی '''میلیاردها پارامتر''' هستند که به آنها امکان می ...ver|date=Jan 9, 2024|website=Analytics India Magazine}}</ref> مدلهای زبان بزرگ در حدود سال ۲۰۱۸ ظاهر شدند و در گستره وسیعی از وظایف، عملکرد بالایی دارند.< ...۷۴ کیلوبایت (۳٬۰۲۹ واژه) - ۱۷ مارس ۲۰۲۵، ساعت ۰۹:۳۶
- ...دایت و راهنمایی مدلهای هوش مصنوعی، به خصوص [[مدل زبانی بزرگ|مدلهای زبانی بزرگ]]، است. ...task_learners.pdf) |publisher=OpenAI blog |quote="ما نشان دادیم که مدلهای زبانی میتوانند وظایف پاییندستی را در شرایط بدون شلیک (zero-shot) انجام دهند - ب ...۸۱ کیلوبایت (۵٬۱۲۱ واژه) - ۱۶ سپتامبر ۲۰۲۴، ساعت ۱۷:۲۶
- ...ید ریاضی–بیشینه کردن|الگوریتم حداکثرسازی انتظارات]] آموزش ببیند، که همانند مدلهای مخلوط گاوسی است. به عنوان یک مثال خاص، در مرحله انتظار، "بار" (که برای توضی ...ت. در دوره پیش از یادگیری عمیق، MoE کاربردهای دیگری از جمله، در پیادهسازی مدلهای بسیار بزرگتر پیدا کرد. در این کاربرد از MoE به عنوان یک روش ساده برای انجام ...۳۸ کیلوبایت (۲٬۲۵۷ واژه) - ۲۸ سپتامبر ۲۰۲۴، ساعت ۱۱:۱۵
- ...ید ریاضی–بیشینه کردن|الگوریتم حداکثرسازی انتظارات]] آموزش ببیند، که همانند مدلهای مخلوط گاوسی است. به عنوان یک مثال خاص، در مرحله انتظار، "بار" (که برای توضی ...ت. در دوره پیش از یادگیری عمیق، MoE کاربردهای دیگری از جمله، در پیادهسازی مدلهای بسیار بزرگتر پیدا کرد. در این کاربرد از MoE به عنوان یک روش ساده برای انجام ...۴۳ کیلوبایت (۲٬۸۲۲ واژه) - ۲۲ آوریل ۲۰۲۴، ساعت ۱۹:۲۳
- ...های مکالمهکننده)، یا وظایف [[بینایی رایانهای]] (مانند [[مدل متن به تصویر|مدلهای متن به تصویر]] ، و توسعه رباتهای بازیهای ویدئویی. در حالی که RLHF یک روش ...نظر ریاضی مورد مطالعه قرار گرفت و به این نتیجه منتهی شد که اجرای RLHF تحت مدلهای بازخوردی مختلف مرزهای پیچیدگی یکسانی دارد.<ref name="xiejiang" /><ref name= ...۵۲ کیلوبایت (۲٬۴۳۲ واژه) - ۲۹ ژانویهٔ ۲۰۲۵، ساعت ۲۰:۱۱
- ...جان وارناک در حال گسترش و توسعهٔ یک مفسر برای پایگاهداده گرافیکی سه بعدی بزرگ پناهگاه نیویورک بود. وارناک سیستم طراحی زبان را به منظور پردازش گرافیک شکل ...و آنها را متقاعد کرد تا پستاسکریپت را طوری تغییر دهند تا بتواند به عنوان زبانی برای چاپگرهای لیزری مورد استفاده قرار گیرد. ...۳۷ کیلوبایت (۶۰۷ واژه) - ۳۱ مارس ۲۰۲۴، ساعت ۰۵:۱۰
- ...dl.acm.org/citation.cfm?id=160438|author2=Almasi, George S.}}</ref> مشکلات بزرگ را اغلب میتوان به مشکلات کوچکتر تقسیم و سپس همزمان حل کرد. چندین فرم مختلف ...] و [[همگامسازی (علوم رایانه)|همگام سازی]] بین زیر-وظایف مختلف معمولاً از بزرگترین موانع دستیابی به عملکرد بهینه در برنامهٔ موازی است. ...۶۴ کیلوبایت (۱٬۸۰۰ واژه) - ۱۸ دسامبر ۲۰۲۴، ساعت ۱۳:۳۷
- ...ذشت زمان و به موازات کشف عناصر تازه، جدول بارها دستخوش تغییر و پالایش شد و مدلهای نظری نوین برای توضیح رفتار شیمیایی عناصر ارائه شد. امروزه استفاده از جدول ت ...زمان از سوی شیمیدانان به عنوان عنصر شناخته نمیشدند، با توجه به ویژگیهای زبانی و فرهنگی خاص هر منطقه، دارای نامهای محلی بودند. حتی پس از شناخته شدن مفهوم ...۴۷ کیلوبایت (۶۲۱ واژه) - ۲۲ ژانویهٔ ۲۰۲۵، ساعت ۲۳:۵۴
- روانشناسان فرگشتی گاهی به [[شامپانزه]]ها، [[بونوبو]]ها و دیگر میمونهای بزرگ برای شناخت رفتار اجدادی انسان نگاه میکنند.<ref name=moralanimal>رایت 1995< ...arper Business.</ref> استدلال او این است که انسانها برای کار در ساختارهای بزرگ و ناشناس بوروکراتیک با سلسله مراتب رسمی سازگار نیستند. ذهن انسان همچنان به ...۲۲۲ کیلوبایت (۸٬۸۹۲ واژه) - ۱۳ مارس ۲۰۲۵، ساعت ۱۴:۴۹