DeepSeek: R1 Distill Llama 70B
DeepSeek R1 Distill Llama 70B یک مدل زبان بزرگ تقطیری است که بر پایه Llama-3.3-70B-Instruct ساخته شده و از خروجیهای DeepSeek R1 استفاده میکند. این مدل با بهکارگیری تکنیکهای پیشرفته تقطیر، عملکرد بالایی در چندین بنچمارک دارد، از جمله: - AIME 2024 pass@1: 70.0 - MATH-500 pass@1: 94.5 - امتیاز CodeForces: 1633 این مدل با استفاده از تنظیم دقیق خروجیهای DeepSeek R1، عملکرد رقابتی قابل مقایسه با مدلهای بزرگتر frontier ارائه میدهد.

دسترسی API، ساختهشده برای برنامهنویسها
مشخصات اصلی مدل هوش مصنوعی
نام مدل | deepseek/deepseek-r1-distill-llama-70b |
تاریخ ساخت | ۱۴۰۴/۳/۵ |
تاریخ آخرین بهروزرسانی دادهها | ۱۴۰۳/۲/۱۲ |
توکن کانتکست | 131072 |
سرعت مدل | 3.01 / 5 |
Tokenizer | Llama3 |
Reasoning | فعال |
هزینه ورودی متن | $0.39999999999999997 به ازای هر یک میلیون توکن |
DeepSeek: R1 Distill Llama 70B
هر ماه مدلهای هوش مصنوعی متنوعی از شرکتهای مختلف ارائه میشود. ثبت نام، راهاندازی و مدیریت اکانتها و مدیریت مالی مدلهای مختلف کار دشواریست. هوش مصنوعی لیارا، مدلهای برتر دنیا را از طریق یک اکانت و یک کلید دسترسی در اختیار شما قرار میدهد.
مانیتورینگ پیشرفته
تعداد درخواستها، توکنهای مصرفی و هزینههای خود را بهتر مدیریت کنید.
توکن رایگان روزانه
با استفاده از توکنهای رایگان، هزینههای هوشمندسازی نرمافزار خود را کاهش دهید.
مدلهای متنوع
ما به سرعت در حال اضافهکردن مدلهای برتر دنیا هستیم. از OpenAI و DeepSeek گرفته تا Grok و Meta.
معماری مدل
ورودیها | text |
خروجی | text |
Structured Outputs | فعال |
Function Calling | فعال |
Tuning | غیرفعال |
Streaming | فعال |
پارامترهای قابل تنظیم | max_tokenstemperaturetop_preasoninginclude_reasoningtop_kstopfrequency_penaltypresence_penaltyseedlogit_biaslogprobstop_logprobsmin_prepetition_penaltytoolstool_choiceresponse_formatstructured_outputs |
ما سعی میکنیم قابلیتهایی که بهطور مشترک در اکثر مدلها وجود دارد را در قالب OpenAI API پیادهسازی کنیم تا نیازی نباشد برای جابهجایی بین مدلهای مختلف، کدهای خود را تغییر دهید.