Blockify переработала корпоративный RAG: IdeaBlock вместо Chunking, сжатие в 40 раз, уменьшение токенов в 3 раза

Корпоративный инструмент оптимизации данных для ИИ Blockify 9 мая собрал и продвигал akshay_pachaar. Он заявляет, что в процессе RAG (Retrieval-Augmented Generation) может сжать корпоративную базу данных в 40 раз, снизить потребление токенов при запросах в 3 раза, а точность векторного поиска повысить в 2,3 раза. В официальном описании Blockify на GitHub сказано: продукт выпустила Iternal Technologies; структура «IdeaBlock» заменяет традиционное chunking, а за счёт дедупликации и объединения пересечений база знаний остаётся компактной, связной и управляемой.

Ключевая идея: IdeaBlock вместо традиционного chunking

Технический дизайн Blockify:

Традиционный подход: длинные документы режутся на чанки фиксированного размера, создаются встраиваемые векторы, при извлечении берутся top-k

Подход Blockify: исходный контент преобразуется в IdeaBlock — XML-структурированные единицы знаний

Каждый IdeaBlock включает: встроенный вопрос, проверяемый ответ, тег(и), сущности, ключевые слова

Похожие IdeaBlock автоматически дедуплицируются и объединяются, поэтому база знаний не раздувается по мере роста контента

Проблема традиционного chunking в том, что одна и та же информация может повторяться в нескольких чанках, создавая избыточность при извлечении и трату токенов; IdeaBlock через дедупликацию повышает плотность знаний — то же самое содержание выражается в меньшем объёме хранения.

Конкретные выгоды: сжатие в 40 раз, токены в 3 раза меньше, точность повышается в 2,3 раза

Опубликованные Blockify показатели конкретной эффективности:

Сжатие данных: корпоративная база сокращается до примерно 2,5% от исходного размера (сжатие в 40 раз), при этом сохраняется более 99% информации

Токены на каждый запрос: примерно со 303 (традиционный chunk) до примерно 98 (IdeaBlock) — эффективность в 3,09 раза выше

Точность векторного извлечения: повышение в 2,29 раза

Общее улучшение точности: примерно в 78 раз (с учётом комплексного эффекта дедупликации и улучшения извлечения)

Расчёт экономии затрат: 100 млн запросов в год, экономия токен-стоимости около 738 тыс. долларов

Общее повышение точности в 78 раз — это совокупный эффект: дедупликация уменьшает шум, IdeaBlock структурированный контент удобнее для векторного поиска, а снижение числа токенов на ответ одновременно уменьшает пространство для ошибок модели.

Сфера интеграции: LlamaIndex, LangChain, Milvus, Cloudflare и другие популярные фреймворки

Уже интегрированные разработческие инструменты и инфраструктура Blockify:

RAG-фреймворки: LlamaIndex, LangChain

Управление знаниями: Obsidian

Векторная БД: Milvus, Elastic, Supabase

Edge-вычисления: Cloudflare

Интеграция low-code: n8n (через шаблоны рабочих процессов)

Стратегия интеграции Blockify — «не заменять существующие RAG-фреймворки, а выступать как слой предварительной оптимизации данных». Разработчики могут, сохраняя остальной процесс неизменным, заменить шаг chunking на Blockify в уже существующих workflow LlamaIndex или LangChain.

Дальнейшие события, за которыми можно следить: рост числа звёзд на GitHub Blockify и уровень внедрения в сообществе, подала ли Iternal Technologies заявку или раскрыла технические детали по структуре IdeaBlock (на данный момент акцент на «patented ingestion»), а также будут ли популярные RAG-фреймворки включать похожую логику дедупликации как встроенную функцию по умолчанию.

Эта статья Blockify «переписывает корпоративный RAG»: использует IdeaBlock вместо chunking, сжимает в 40 раз, уменьшает токены в 3 раза — впервые появилась на ABMedia.

Отказ от ответственности: Информация на этой странице может поступать от третьих лиц и не отражает взгляды или мнения Gate. Содержание, представленное на этой странице, предназначено исключительно для справки и не является финансовой, инвестиционной или юридической консультацией. Gate не гарантирует точность или полноту информации и не несет ответственности за любые убытки, возникшие от использования этой информации. Инвестиции в виртуальные активы несут высокие риски и подвержены значительной ценовой волатильности. Вы можете потерять весь инвестированный капитал. Пожалуйста, полностью понимайте соответствующие риски и принимайте разумные решения, исходя из собственного финансового положения и толерантности к риску. Для получения подробностей, пожалуйста, обратитесь к Отказу от ответственности.

Связанные статьи

Alibaba Cloud запускает план с командными токенами с 10+ моделями уже сегодня

Согласно Beating, сегодня Alibaba Cloud запустила свою программу Team Token Plan, предлагая подписки на 10+ крупных языковых моделей, включая Qwen 3.6, Kimi-K2.6, GLM-5.1 и Wan 2.7. Пользователи могут гибко переключаться между моделями для генерации кода, синтеза изображений и других задач. Версия для команды отличается от персональных тарифов возможностями корпоративного управления. Администраторы могут управлять распределением мест, отслеживать использование и устанавливать бюджетные ограничен

GateNews4ч назад

Дунгуань поставит половину глобальных AI-очков в 2025 году

Компании из Дунгуаня отправили в 2025 году более 4 миллионов пар AI-очков, что почти наполовину составляет общемировой объём в 8,7 миллиона пар, сообщает исследовательская компания Omdia. Город в провинции Гуандун занял первое место в мире по объёмам поставок, а глобальные поставки AI-очков выросли на 322% по сравнению с прошлым годом. Позиция Дунгуаня на рынке и поддержка правительства Преобладание города в производстве AI-очков отражает как уже имеющуюся инфраструктуру электроники, так и недав

CryptoFrontier6ч назад

UXLINK интегрирует AI-инфраструктуру вычислений Origins Network для масштабирования Web3

11 мая в официальном объявлении UXLINK сообщила, что Web3-социальный протокол объявил о стратегическом сотрудничестве с Origins Network, чтобы интегрировать инфраструктуру децентрализованных вычислений на базе ИИ в свою экосистему. Партнёрство направлено на улучшение платформы UXLINK за счёт включения модульной блокчейн-инфраструктуры Origins Network, что позволит повысить вычислительные возможности для AI-driven децентрализованных приложений. Интеграция будет использовать механизм Proof-of-Comp

GateNews10ч назад

Tencent Cloud обеспечивает работу AI-банковского сервиса Ryt Bank для 50 000 пользователей в день запуска

По данным Tencent Cloud 11 мая компания объявила о партнёрстве с базирующимся в Малайзии цифровым банком Ryt Bank, чтобы поддержать его AI-ориентированную разговорную банковскую услугу с помощью Tencent Cloud Chat для обмена сообщениями в реальном времени. Система обслуживала 50 000 активных пользователей в день запуска без простоев, позволяя клиентам отдавать инструкции по платежам простым языком вместо навигации по меню приложения. Ryt Bank достиг 1,2 миллиона пользователей за более чем семь м

GateNews12ч назад

Reactor запускает демонстрацию real-time world model, собрав 7,8 миллиона просмотров

В сегодняшнем выпуске Beating Reactor запустила демонстрацию реальной модели мира в режиме реального времени, позволяющую пользователям генерировать интерактивные 3D-сцены с помощью облачной обработки на базе ИИ. Модель работает на глобальной облачной инфраструктуре компании с низкими задержками, устраняя необходимость в локальном оборудовании. В демонстрационном видео с красным спортивным автомобилем, который едет по ландшафту инопланетной пустыни, ИИ в реальном времени отрисовывал физику релье

GateNews12ч назад

Minara запускает сегодня первый AI-копилот для прогнозного рынка Hyperliquid HIP-4

Согласно BlockBeats, Minara AI запустила AI Prediction Copilot сегодня (11 мая), став первым инструментом для AI-прогнозных рынков, интегрированным с HIP-4 рынка Hyperliquid. Система анализирует краткосрочные тренды BTC, уровни поддержки и сопротивления, а также ценовые расхождения на рынке, чтобы выдавать торговые рекомендации YES/NO. Copilot выводит AI-вероятность, рыночную подразумеваемую вероятность, значение преимущества (edge) и ожидаемую доходность в реальном времени.

GateNews13ч назад
комментарий
0/400
Нет комментариев