هوش مصنوعی گوگل حالا می‌تواند صدای شما را بشنود

به گزارش اقتصاد آزاد هوش مصنوعی Gemini ۱.۵ Pro به‌لطف آپدیت جدید گوگل می‌تواند به فایل‌های صوتی آپلودشده گوش دهد و اطلاعات را از تماس‌های دریافتی یا صدای ویدئوها بدون نیاز به دستورهای متنی استخراج کند.

در رویداد Cloud Next، گوگل اعلام کرد که مدل زبانی بزرگ جمنای ۱٫۵ پرو را برای اولین‌بار ازطریق ابزار Vertex AI دردسترس عموم ازجمله توسعه‌دهندگان قرار می‌دهد.

درحال‌حاضر، نسخه‌ی جدید جمنای پرو ازنظر عملکرد، از بزرگ‌ترین و قدرتمندترین مدل جمنای، یعنی اولترا ۱٫۰، پیشی گرفته است. گوگل ادعا می‌کند که جمنای ۱٫۵ پرو می‌تواند دستورالعمل‌های پیچیده را درک کند.

Gemini ۱.۵ Pro برای افرادی کاربردی نیست که به Vertex AI دسترسی ندارند. ناگفته نماند که جمنای اولترا به چت‌بات پیشرفته‌ی جمنای قدرت می‌دهد. این مدل زبانی بزرگ قدرتمند است و می‌تواند دستورهای متنی طولانی را درک کند؛ اما سرعت جمنای ۱٫۵ پرو را ندارد.

جمنای ۱٫۵ پرو، تنها مدل زبانی بزرگ گوگل نیست که به‌روزرسانی می‌شود. Imagen ۲ ابزار تولید متن به تصویر است که به توانمندسازی قابلیت‌های تولید تصویر جمنای کمک می‌کند. این ابزار در آپدیت جدیدش به کاربران اجازه می‌دهد تا سوژه‌ها را به تصویر اضافه یا از آن‌ حذف کنند. گوگل نیز قابلیت واترمارک دیجیتال SynthID خود را در تمامی تصاویر ایجادشده با مدل‌های Imagen دردسترس قرار داده است.

گوگل در حال آزمایش ویژگی پاسخ هوش مصنوعی در صفحه‌ی نتایج اصلی جست‌وجو به‌صورت عمومی است و کاربران بدون نیاز به عضویت در Search Labs می‌توانند پاسخ هوش مصنوعی را مشاهده کنند.

اخبار مرتبط

اشتراک گذاری

برچسب ها :

ارسال نظر شما

  • نظرات ارسال شده توسط شما، پس از تایید توسط مدیران سایت منتشر خواهد شد.
  • نظراتی که حاوی تهمت یا افترا باشد منتشر نخواهد شد.
  • نظراتی که به غیر از زبان فارسی یا غیر مرتبط با خبر باشد منتشر نخواهد شد.

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *