Qwen: Qwen3.5-Flash
مدلهای native vision-language سری Qwen3.5 Flash بر پایه یک معماری هیبریدی ساخته شدهاند که یک مکانیزم linear attention را با یک مدل sparse mixture-of-experts ادغام میکند و در نتیجه به بهرهوری بالاتری در inference دست مییابد. در مقایسه با سری 3، این مدلها جهشی قابلتوجه در عملکرد برای هر دو نوع وظایف متنی و multimodal ارائه میدهند و در عین حفظ زمان پاسخدهی سریع، تعادل مناسبی میان سرعت inference و عملکرد کلی برقرار میکنند.

دسترسی API، ساختهشده برای برنامهنویسها
مشخصات اصلی مدل هوش مصنوعی
| نام مدل | qwen/qwen3.5-flash-02-23 |
| تاریخ ساخت | ۱۴۰۵/۳/۱۰ |
| حداکثر ورودی | 1000000 |
| سرعت مدل | 4.8 / 5 |
| Tokenizer | Qwen3 |
| Reasoning | فعال |
| هزینه خروجی متن | $0.26 به ازای هر یک میلیون توکن |
Qwen: Qwen3.5-Flash
هر ماه مدلهای هوش مصنوعی متنوعی از شرکتهای مختلف ارائه میشود. ثبت نام، راهاندازی و مدیریت اکانتها و مدیریت مالی مدلهای مختلف کار دشواریست. هوش مصنوعی لیارا، مدلهای برتر دنیا را از طریق یک اکانت و یک کلید دسترسی در اختیار شما قرار میدهد.
مانیتورینگ پیشرفته
تعداد درخواستها، توکنهای مصرفی و هزینههای خود را بهتر مدیریت کنید.
توکن رایگان روزانه
با استفاده از توکنهای رایگان، هزینههای هوشمندسازی نرمافزار خود را کاهش دهید.
مدلهای متنوع
ما به سرعت در حال اضافهکردن مدلهای برتر دنیا هستیم. از OpenAI و DeepSeek گرفته تا Grok و Meta.
معماری مدل
| ورودیها | textimagevideo |
| خروجی | text |
| Structured Outputs | فعال |
| Function Calling | فعال |
| Tuning | غیرفعال |
| Streaming | فعال |
پارامترهای قابل تنظیم | include_reasoningmax_tokenspresence_penaltyreasoningresponse_formatseedstructured_outputstemperaturetool_choicetoolstop_p |
ما سعی میکنیم قابلیتهایی که بهطور مشترک در اکثر مدلها وجود دارد را در قالب OpenAI API پیادهسازی کنیم تا نیازی نباشد برای جابهجایی بین مدلهای مختلف، کدهای خود را تغییر دهید.

