...
Неділя, 20 Квітня, 2025
13.7 C
Kyiv

Pinecone об’єднує штучний інтелект із векторною базою даних – блоки та файли

Висновки GenAI тепер можна запускати безпосередньо з векторної бази даних Pinecone, щоб покращити пошуково-розширену генерацію (RAG).

Pinecone надає векторну базу даних для вбудовування, яка буде використовуватися моделями мови штучного інтелекту під час побудови відповідей на запити користувачів чат-бота. Векторні вбудовування — це символічні представлення багатьох вимірів об’єктів тексту, зображення, аудіо та відео, які використовуються в семантичному пошуку за допомогою великих мовних моделей (LLM) і малих мовних моделей (SML). У ньому йдеться, що база даних тепер включає повністю керовані моделі вбудовування та переранжування, а також «новий підхід» до розрідженого вбудовування пошуку поряд із наявними функціями щільного пошуку.

Едо Ліберті, Шишка
Або Свобода

Генеральний директор Pinecone Едо Ліберті, колишній директор з досліджень AWS і Yahoo, заявив: «Додаючи вбудовані та повністю керовані можливості висновку безпосередньо в нашу векторну базу даних, а також нові функції пошуку, ми не тільки спрощуємо процес розробки, але й також значно підвищити продуктивність і точність рішень на основі штучного інтелекту».

База даних, яка тепер називається платформою, має такі функції:

  • власна модель переранжування pinecone-rerank-v0
  • pinecone-sparse-english-v0 власна розріджена модель вбудовування
  • Новий розріджений векторний тип індексу
  • Інтеграція моделі Cohere Rerank 3.5
  • Нові функції безпеки, включаючи контроль доступу на основі ролей (RBAC), журнали аудиту, ключі шифрування, керовані клієнтом (CMEK), і загальну доступність приватних кінцевих точок для AWS PrivateLink

Щільний пошук, який використовується мовними моделями GenAI під час семантичного пошуку в векторних базах даних, використовує всі відповідні вектори. Розріджений пошук — це метод пошуку за ключовими словами, при якому векторизуються лише конкретні слова та терміни, тоді як усім іншим вимірам у вбудованих векторах присвоюється нульове значення. Ключові слова можуть бути представлені у вигляді розріджених векторів, де кожне ключове слово відповідає виміру у векторному просторі.

Інтегрована діаграма висновку Pinecone
Інтегрована діаграма висновку Pinecone

Компанія заявила, що співпрацює з Cohere, щоб розмістити Cohere Rerank 3.5 на платформі Pinecone, і його можна вибрати через API Pinecone. Зазначається, що Rerank 3.5 відмінно підходить для розуміння складної бізнес-інформації різними мовами, що робить його оптимальним для глобальних організацій у таких секторах, як фінанси, охорона здоров’я, державний сектор тощо.

Pinecone каже, що його нові власні моделі переранжування та вбудовування разом із моделями сторонніх розробників, такими як Cohere Rerank 3.5, надають клієнтам «швидкий і легкий доступ до високоякісного пошуку». Ці вдосконалення значно спрощують розробку обґрунтованих додатків ШІ.

«Приземлений» означає меншу ймовірність галюцинацій або генерування уявних відповідей.

Компанія каже, що її дослідження показують, що найкраща продуктивність моделей GenAI вимагає поєднання трьох ключових компонентів:

  • Щільний векторний пошук для захоплення глибокої семантичної подібності
  • Швидкий і точний розріджений пошук для пошуку за ключовими словами та об’єктами за допомогою власного алгоритму розрідженого індексування
  • Найкращі в своєму класі моделі переранжування для поєднання щільних і розріджених результатів і максимальної релевантності

Модель переранжування отримує першу відповідь із конвеєра пошуку інформації та змінює порядок (знову ранжує) перелічені записи, щоб гарантувати, що релевантніші мають вищий рейтинг для підвищення ефективності пошуку.

Pinecone стверджує, що, об’єднавши в своїй базі даних можливості розрідженого пошуку, щільного пошуку та переранжування, «розробники зможуть створювати наскрізні пошукові системи, які забезпечують до 48 відсотків і в середньому на 24 відсотки кращу продуктивність, ніж щільні або лише розріджений пошук». Там написано:

  • pinecone-rerank-v0 покращує точність пошуку до 60 відсотків і в середньому на 9 відсотків порівняно з провідними моделями галузі за тестом Benchmarking-IR (BEIR).
  • pinecone-sparse-english-v0 підвищує продуктивність для запитів на основі ключових слів, забезпечуючи до 44 відсотків і в середньому на 23 відсотки кращий нормалізований дисконтований кумулятивний приріст (NDCG@10), ніж BM25 на Tracks Deep Learning Conference (TREC).

Pinecone надає ці можливості, розміщені на його інфраструктурі, через єдиний API. У ньому йдеться про те, що розробники тепер можуть розробляти програми пошуку GenAI «без тягаря керування хостингом моделі, інтеграцією чи інфраструктурою» і «усуваючи потребу турбуватися про вектори або дані, які маршрутизуються через кілька постачальників».

Клієнти можуть отримати доступ до Pinecone через AWS Marketplace.

Гаряче цього тижня

Мотоцикліст у критичному стані після аварії Сан -Антоніо

Поліція заявляє, що мотоцикліст їхав з великою швидкістю. Він...

Отримайте ексклюзивні оновлення всередині найсміливішого переказу Marvel

З випуском Фантастична четвірка: Перші кроки Трейлер, Marvel Studios...

Топ -поради щодо SEO нерухомості для ріелторів у Денвері 2025

Від вибору, де їсти, щоб вирішити, де жити, онлайн...

Роль штучного інтелекту в модернізації ланцюгів поставок CPG

Розподіляти Розподіляти Розподіляти Розподіляти Електронна пошта Протягом багатьох років ланцюги поставок були основою промисловості...

Теми

Мотоцикліст у критичному стані після аварії Сан -Антоніо

Поліція заявляє, що мотоцикліст їхав з великою швидкістю. Він...

Отримайте ексклюзивні оновлення всередині найсміливішого переказу Marvel

З випуском Фантастична четвірка: Перші кроки Трейлер, Marvel Studios...

Топ -поради щодо SEO нерухомості для ріелторів у Денвері 2025

Від вибору, де їсти, щоб вирішити, де жити, онлайн...

Роль штучного інтелекту в модернізації ланцюгів поставок CPG

Розподіляти Розподіляти Розподіляти Розподіляти Електронна пошта Протягом багатьох років ланцюги поставок були основою промисловості...

Роббі Вільямс відхилив запит на фото вентилятора через тривогу – музичні новини

Роббі Вільямс виявив, що нещодавно відмовився від прохання фанатів...

Зебра смуга: стратегія Gen Z для модеруючого вживання алкоголю

Домашній>ФокусЗебра смуга: стратегія Gen Z для модеруючого вживання алкоголю ...

Смертельна поліція переслідує маленькі п’ять очок Атланта | Інформація від ордерів

Поліцейська погоня в Атланті закінчилася трагічно, коли транспортний засіб...