DeepSeek получает патент на инновационный метод эффективного сбора данных с минимальной нагрузкой на сеть

Компания **DeepSeek** (Ханчжоуская лаборатория фундаментальных технологий ИИ) получила патент на **«Метод и систему для широкомасштабного сбора данных»**, который был опубликован 1 апреля на сайте Государственного управления интеллектуальной собственности Китая.

**Уменьшение нагрузки на веб-сайты** — алгоритм оптимизирует трафик во время сканирования, что позволяет избегать перегрузки серверов.

**Увеличение эффективности** — система проводит анализ загруженного контента и предсказывает качество еще нескачанных ссылок, тем самым предотвращая дублирование и отбор некачественных данных.

**Стабильность обработки** — выделенная очередь для метаданных обеспечивает безопасность и точность обновлений базы данных.

Современные большие языковые модели (LLM) требуют значительных объемов высококачественных текстовых данных для обучения. Однако традиционные методы сбора информации из интернета сталкиваются с рядом трудностей:

– Неполный охват сложных веб-ресурсов,
– Избыточные запросы, приводящие к сбоям,
– Загруженные дубликаты или бесполезный контент.

Новая технология от DeepSeek оптимизирует эти процессы, делая сбор данных более быстрым, точным и экономичным для сетевых ресурсов.

Источник: IT之家

Бесплатный поиск, мониторинг и регистрация товарных знаков и других объектов интеллектуальной собственности.

Поиск по программам

Регистрация программы