...
Вівторок, 29 Квітня, 2025
8.2 C
Kyiv

Pinecone об’єднує штучний інтелект із векторною базою даних – блоки та файли

Висновки GenAI тепер можна запускати безпосередньо з векторної бази даних Pinecone, щоб покращити пошуково-розширену генерацію (RAG).

Pinecone надає векторну базу даних для вбудовування, яка буде використовуватися моделями мови штучного інтелекту під час побудови відповідей на запити користувачів чат-бота. Векторні вбудовування — це символічні представлення багатьох вимірів об’єктів тексту, зображення, аудіо та відео, які використовуються в семантичному пошуку за допомогою великих мовних моделей (LLM) і малих мовних моделей (SML). У ньому йдеться, що база даних тепер включає повністю керовані моделі вбудовування та переранжування, а також «новий підхід» до розрідженого вбудовування пошуку поряд із наявними функціями щільного пошуку.

Едо Ліберті, Шишка
Або Свобода

Генеральний директор Pinecone Едо Ліберті, колишній директор з досліджень AWS і Yahoo, заявив: «Додаючи вбудовані та повністю керовані можливості висновку безпосередньо в нашу векторну базу даних, а також нові функції пошуку, ми не тільки спрощуємо процес розробки, але й також значно підвищити продуктивність і точність рішень на основі штучного інтелекту».

База даних, яка тепер називається платформою, має такі функції:

  • власна модель переранжування pinecone-rerank-v0
  • pinecone-sparse-english-v0 власна розріджена модель вбудовування
  • Новий розріджений векторний тип індексу
  • Інтеграція моделі Cohere Rerank 3.5
  • Нові функції безпеки, включаючи контроль доступу на основі ролей (RBAC), журнали аудиту, ключі шифрування, керовані клієнтом (CMEK), і загальну доступність приватних кінцевих точок для AWS PrivateLink

Щільний пошук, який використовується мовними моделями GenAI під час семантичного пошуку в векторних базах даних, використовує всі відповідні вектори. Розріджений пошук — це метод пошуку за ключовими словами, при якому векторизуються лише конкретні слова та терміни, тоді як усім іншим вимірам у вбудованих векторах присвоюється нульове значення. Ключові слова можуть бути представлені у вигляді розріджених векторів, де кожне ключове слово відповідає виміру у векторному просторі.

Інтегрована діаграма висновку Pinecone
Інтегрована діаграма висновку Pinecone

Компанія заявила, що співпрацює з Cohere, щоб розмістити Cohere Rerank 3.5 на платформі Pinecone, і його можна вибрати через API Pinecone. Зазначається, що Rerank 3.5 відмінно підходить для розуміння складної бізнес-інформації різними мовами, що робить його оптимальним для глобальних організацій у таких секторах, як фінанси, охорона здоров’я, державний сектор тощо.

Pinecone каже, що його нові власні моделі переранжування та вбудовування разом із моделями сторонніх розробників, такими як Cohere Rerank 3.5, надають клієнтам «швидкий і легкий доступ до високоякісного пошуку». Ці вдосконалення значно спрощують розробку обґрунтованих додатків ШІ.

«Приземлений» означає меншу ймовірність галюцинацій або генерування уявних відповідей.

Компанія каже, що її дослідження показують, що найкраща продуктивність моделей GenAI вимагає поєднання трьох ключових компонентів:

  • Щільний векторний пошук для захоплення глибокої семантичної подібності
  • Швидкий і точний розріджений пошук для пошуку за ключовими словами та об’єктами за допомогою власного алгоритму розрідженого індексування
  • Найкращі в своєму класі моделі переранжування для поєднання щільних і розріджених результатів і максимальної релевантності

Модель переранжування отримує першу відповідь із конвеєра пошуку інформації та змінює порядок (знову ранжує) перелічені записи, щоб гарантувати, що релевантніші мають вищий рейтинг для підвищення ефективності пошуку.

Pinecone стверджує, що, об’єднавши в своїй базі даних можливості розрідженого пошуку, щільного пошуку та переранжування, «розробники зможуть створювати наскрізні пошукові системи, які забезпечують до 48 відсотків і в середньому на 24 відсотки кращу продуктивність, ніж щільні або лише розріджений пошук». Там написано:

  • pinecone-rerank-v0 покращує точність пошуку до 60 відсотків і в середньому на 9 відсотків порівняно з провідними моделями галузі за тестом Benchmarking-IR (BEIR).
  • pinecone-sparse-english-v0 підвищує продуктивність для запитів на основі ключових слів, забезпечуючи до 44 відсотків і в середньому на 23 відсотки кращий нормалізований дисконтований кумулятивний приріст (NDCG@10), ніж BM25 на Tracks Deep Learning Conference (TREC).

Pinecone надає ці можливості, розміщені на його інфраструктурі, через єдиний API. У ньому йдеться про те, що розробники тепер можуть розробляти програми пошуку GenAI «без тягаря керування хостингом моделі, інтеграцією чи інфраструктурою» і «усуваючи потребу турбуватися про вектори або дані, які маршрутизуються через кілька постачальників».

Клієнти можуть отримати доступ до Pinecone через AWS Marketplace.

Гаряче цього тижня

Chatgpt додає покупки, пошук WhatsApp та вдосконалені цитати

OpenAI додав кілька нових функцій до інструменту пошуку Chatgpt....

Цифрові маркетингові ресурси для CPA

Фірми CPA можуть використовувати безліч чудових інструментів та послуг,...

Постійні овації та партнер Tetra Pak для оптимізації альтернативного виробництва казеїну

Французький фахівець з точного бродіння молочних продуктів, що стоять...

Телангана урядові передачі 21 офіцери IAS; GHMC отримує нового комісара

Хайдерабад: Уряд Телангани видав накази в неділю, 27...

Теми

Chatgpt додає покупки, пошук WhatsApp та вдосконалені цитати

OpenAI додав кілька нових функцій до інструменту пошуку Chatgpt....

Цифрові маркетингові ресурси для CPA

Фірми CPA можуть використовувати безліч чудових інструментів та послуг,...

Постійні овації та партнер Tetra Pak для оптимізації альтернативного виробництва казеїну

Французький фахівець з точного бродіння молочних продуктів, що стоять...

Телангана урядові передачі 21 офіцери IAS; GHMC отримує нового комісара

Хайдерабад: Уряд Телангани видав накази в неділю, 27...

Чи є Чатгпт, Клод та інші боти AI, які є “кінцевими” впливовими?

Як люблять чатів AI AAIP OPIC, Клод антропікаі Здивування...

Використання якості SEO -інструментів для покращення маркетингового контентного маркетингу

У динамічному світі цифрового маркетингу досягнення видимості часто може...