Основне оновлення API Gemini запустило, що виводить інструменти, розроблені для покращення розробки додатків AI. Серед ключових особливостей є Flash та VeO 2 Booti 2,5, обидва спрямовані на надання користувачам більшу гнучкість, можливості в режимі реального часу та вдосконалений інтерфейс користувача для побудови та управління програмами.
Flash Gemini 2.5, ключове оновлення API Gemini, розроблений для того, щоб запропонувати глибше розуміння моделей AI міркувань. Цей інструмент, доступний через AI Studio, дозволяє розробникам краще зрозуміти процес прийняття рішень своїх моделей. Моделюючи різні сценарії, користувачі можуть бачити, як їх моделі «думають», даючи їм чіткіше розуміння результатів моделі. Це суттєвий стрибок у підвищенні прозорості в додатках AI та дозволяє краще налагодити та оптимізувати процеси, які покладаються на штучний інтелект.
VEO 2, інструмент генерації відео, також є частиною оновлення і тепер доступний в API Gemini. Це доповнення дозволяє розробникам безперешкодно прототипові відеопрограми, що полегшує створення відеоконтенту програмно. Для таких галузей, як маркетинг, освіта та розваги, здатність інтегрувати генерацію відео безпосередньо у свої робочі процеси відкриває нові можливості для творчих рішень. За допомогою VEO 2 розробники можуть швидко створити прототипи на основі відео, тестуючи, як можна динамічно інтегровано відеоконтенту в свої програми.
Ще одна помітна функція, представлена в цьому оновленні, – це додавання нових стартівних додатків. Ці додатки пропонують простий спосіб розпочати роботу з API Gemini. Використовуючи вбудований редактор коду, розробники можуть налаштувати ці шаблони відповідно до їх конкретних потреб. Після налаштування додатків можна зберегти, обміняти та інтегрувати у більші проекти. Ця функція спрямована на зменшення кривої навчання для нових користувачів, надання їм готового рішення, яке можна підібрати відповідно до їх індивідуальних випадків використання. З акцентом на доступність, стартерні додатки пропонують розробникам плавніші точки входу в більш складні аспекти API Gemini.
Дивіться також Google Media CDN перевершує 100 ТБП, використовуючи глобальну інфраструктуру YouTube
Оновлена платформа Gemini також приносить потокові можливості в режимі реального часу через нещодавно представлений API в прямому ефірі. Ця функція дозволяє розробникам досліджувати голосову та відео -двонаправлену потокову трансляцію, необхідну для створення сучасних додатків для чатів, служб транскрипції в реальному часі та інших інтерактивних інструментів AI. Спілкування в режимі реального часу стало критичною складовою багатьох додатків-від чатів обслуговування клієнтів до віртуальних помічників, і можливості живих API полегшують розробникам інтегрувати ці функції у свої платформи. Можливість обробки відео та голосового потоку в режимі реального часу розширює сферу використання Близнюків, що забезпечує більш динамічні, інтерактивні та орієнтовані на користувачі програми.
Зверніть увагу на проблему?
Arabian Post прагне надати її найточніше та надійну інформацію своїм читачам. Якщо ви вважаєте, що в цій статті ви визначили помилку чи невідповідність, будь ласка, не соромтеся звертатися до нашої редакційної команди в редакторі[at]thearabianpost[dot]ком. Ми прагнемо негайно вирішити будь -які проблеми та забезпечити найвищий рівень журналістської цілісності.
MENAFN25042025000152002308ID1109473804