24.2.2025

Чорний лебідь на ринку ШІ. Чи можна довіряти китайському DeepSeek R1 ваші дані?

Тимофій Щербань

Юрист практики Супроводу бізнесу

Петро Білик

КЕРІВНИК ПРАКТИКИ ТЕХНОЛОГІЇ ТА ІНВЕСТИЦІЇ, CHIEF INNOVATION OFFICER

Ще новини по темі

Алгоритм дій під час обшуку: чекліст для бізнесу

15.4.2025

Сірий імпорт: що це таке і як з ним боротися?

15.4.2025

Податок PIT в Польщі: як декларувати та сплачувати податки українським біженцям

21.9.2023

ПОДАТКОВЕ РЕЗИДЕНТСТВО. УКРАЇНСЬКІ РЕАЛІЇ, АБО ЯК ЗАКОННО ОФОРМИТИ СВОЄ ПРОЖИВАННЯ ЗА КОРДОНОМ

11.10.2023

Ризики в публічних закупівлях: що варто знати бізнесу, щоб уникнути кримінальної відповідальності

2.4.2025

Виключення учасника з ТОВ без його згоди

1.4.2025

«Дія City» в дії

13.7.2023

Juscutum отримує нагороду Ukrainian Fintech Awards у номінації Best Legal Tech Advisor

31.3.2025

Ірина Біляєва — серед найвпливовіших жінок юридичного ринку за версією Ukrainian Women in Law — 2025

27.3.2025

Juscutum увійшов у рейтинг The Legal 500 – EMEA 2025

26.3.2025

Китайський ШІ стартап DeepSeek став справжнім «чорним лебедем» на ринку штучного інтелекту, стрімко злетівши до вершин технологічного Олімпу та викликавши шок у Кремнієвій долині та обваливши фондові ринки. Його революційна ШІ-модель DeepSeek R1 поставила під сумнів лідерство США у сфері передових технологій, спричинила падіння індексу Nasdaq і підірвала довіру до технологічних гігантів.

Розроблена модель з обмеженим бюджетом у 6 мільйонів доларів, з відсутністю доступу до передових американських чипів, DeepSeek R1 вже створила конкуренцію іншим моделям штучного інтелекту у незалежних тестах, а її успіх на Apple Store підтвердив зацікавленість користувачів. DeepSeek використав інновації, народжені в кризі, і розробив модель, яка може конкурувати з обмеженими ресурсами з найкращими у світі, що кидає виклик самим принципам сучасного технологічного лідерства.

Проте чи безпечно довіряти свої дані цій системі та як DeepSeek обробляє дані своїх користувачів? Давайте розберемося з цим детальніше.

DeepSeek: що це таке?

DeepSeek — це китайська система штучного інтелекту, яка пропонує широкий набір функцій, побудованих на основі потужних мовних моделей. Вона дозволяє користувачам:

Спілкуватися з чат-ботом, який може генерувати текст або працювати з мультимедійними даними.
Використовувати API та SDK, що дають можливість розробникам інтегрувати ці моделі у власні проєкти.
Та генерувати зображення.

Завдяки універсальності та доступності, DeepSeek приваблює як інноваційні стартапи, так і великі компанії, які прагнуть використовувати гнучкі AI-рішення для підвищення своєї конкурентоспроможності.

Ключові аспекти безпеки та конфіденційності DeepSeek

Використання даних для навчання моделей

За даними Terms of Use і Privacy Policy, DeepSeek збирає та опрацьовує внесені користувачем тексти, завантажені файли, історію чату й іншу інформацію, щоб «удосконалювати та розвивати» свої технології штучного інтелекту. Зокрема, у Terms of Use вказано:

«4.3....ми можемо мінімально використовувати Inputs (вхідні дані) та Outputs (вихідні дані) для підтримки, обслуговування, розробки чи поліпшення Сервісу або технологій, що лежать в його основі.»

Це означає, що DeepSeek аналізує та накопичує анонімізовані або частково знеособлені фрагменти запитів і відповідей, щоб налаштовувати моделі точніше. Подібний підхід характерний для більшості генеративних AI-платформ, але залишається важливим пунктом, якщо ви надаєте конфіденційні дані через сервіс. У багатьох випадках фраза «розробити або вдосконалити … базові технології» фактично може означати використання даних користувача для навчання моделі, тонкого налаштування або інших ітераційних покращень продуктивності.

В той же час Privacy Policy в розділі “How We Use Your Information” зазначено, що:

«Ми використовуємо вашу інформацію, щоб... переглядати, покращувати та розвивати Сервіс, у тому числі шляхом... аналізу того, як люди його використовують, а також шляхом навчання та вдосконалення наших технологій».

Отже дані, які вводять користувачі, і пов’язаний вміст може використовуватися для навчання або вдосконалення моделей DeepSeek.

В інших розділах “User Input” вказано, що текст, аудіовведення, завантажені файли та інший вміст збираються, зберігаються та обробляються DeepSeek.

У сукупності ці посилання підтверджують, що DeepSeek дійсно використовує дані чатів користувачів, з метою вдосконалення системи та навчання моделі.

Оскільки системи штучного інтелекту потребують дедалі більше даних для навчання, медійний ажіотаж навколо DeepSeek та обмежені бюджети можуть бути направлені на отримання даних, потрібних для вдосконалення та донавчання моделей.

Строки зберігання даних

Їх немає. В розділі “How Long Do We Keep Your Information” Privacy Policy також згадується, що DeepSeek зберігає інформацію стільки часу, скільки необхідно для цілей покращення, «вдосконалення та розвитку» системи.

Таким чином, якщо користувач не вимагає видалення, дані розмови можуть залишатися в системах DeepSeek.

Міжнародна передача даних та зберігання

З однієї сторони зазначається, що користувачі мають певні права щодо персональних даних, в залежності від законодавства країни, в якій проживає користувач, з іншої сторони в політиці зазначено, що особиста інформація зберігається на серверах, розташованих у Китайській Народній Республіці.

Передача даних третім особам

В Privacy Policy в розділі “How We Share Your Information” також зазначені випадки, коли DeepSeek може ділитися інформацією, зібраною під час використання системи, а саме:

З сторонніми провайдерами (Service Providers).
З Рекламними чи аналітичними партнерами.
З компаніями в рамках корпоративної групи компаній.
З державними органами, в рамках законодавства.

Політика знеособлення та шифрування

У своїх Terms of Use DeepSeek обіцяє «secure encryption technology» та «strict de-identification». Тобто компанія:

Шифрує користувацькі сесії й дані, які надсилаються на сервер.
Застосовує механізми знеособлення (де це можливо) для скорочення ризику ідентифікації конкретної особи.

Хоча у правовому полі будь-яка політика анонімізації не є стовідсотковою гарантією, зазначені заходи свідчать про спробу DeepSeek дотриматися певних вимог у сфері захисту даних та загальносвітових стандартів безпеки. Однак це не скасовує того факту, що вміст який вводить користувач може оброблятися з метою вдосконалення моделі.

Можливість керування та видалення даних

Згідно з Privacy Policy, DeepSeek надає користувачам певні інструменти керування інформацією:

У налаштуваннях акаунта можна очищувати історію чатів.
Можливість деактивувати акаунт.

Іншими словами, за замовчуванням система може використовувати дані, якщо користувач не надає запит на їх видалення.

Не дивлячись на те, що ви можете мати певні права на доступ або видалення вашої особистої інформації, право на заперечення чи обмеження певної обробки, деякі дані все ще можуть зберігатися для відповідності або для «законних бізнес-інтересів», як-от покращення сервісу або для виконання юридичних і нормативних вимог.

Примітно, що DeepSeek не надає можливість «відмовитися» від використання даних ваших чатів для «навчання та вдосконалення технології», як наприклад в OpenAI. Тож якщо пріоритетом є стовідсоткове видалення персональних даних, потрібно буде звертатися до DeepSeek із додатковим запитом.

Як у інших?

Для об’єктивності давайте порівняємо DeepSeek з іншими моделями.

ChatGPT від OpenAI

OpenAI має окрему політику для користувачів з Європейської економічної зони.

Хоча OpenAI використовує дані користувачів для тренування моделей, зокрема зібрані через ChatGPT, у Privacy Policy та спеціальному «Notice on Model Training» описано можливість відмовитися (opt out) від використання внесеної інформації для навчання. Такі налаштування є у кожному обліковому записі. Компанія пропонує окремі інструкції (зокрема, для корпоративних користувачів ChatGPT Enterprise) щодо того, як заборонити доступ до історії чатів чи відключити її збереження.

Передбачає стандартні права (доступ, виправлення, видалення, перенесення, обмеження обробки тощо), а також додатково описує можливість відключити збереження чату, після чого повідомлення видаляються з основних систем OpenAI через 30 днів. Прямо вказані контактні канали й детальні інструкції для подання запитів.

Має спеціальний розділ «Data transfers», де детально описує, як відбувається обробка даних осіб з ЄС, Великої Британії, Швейцарії та роз’яснює, що OpenAI послуговується стандартними договірними клаузулами, інструментами відповідності, а також механізмами «adequacy» (у разі наявності).

Claude від Anthropic

За умовами актуальної Privacy Policy, Claude не використовує розмови користувачів для тренування моделей у більшості випадків. Винятки: якщо контент (1) був явно надісланий як зворотний зв’язок (Feedback), (2) позначений для Trust & Safety-перевірок або (3) користувач добровільно погодився. Таким чином, модель Anthropic загалом більш стримано залучає користувацькі Inputs/Outputs до навчального процесу.

Також вказує, що “flagged” Inputs і Outputs можуть бути використані для тренування спеціальних моделей без прив’язки до конкретного користувача. Основна мета — безпека, виявлення «небезпечного» чи забороненого контенту та удосконалення механізмів Trust & Safety.

До того ж Claude пропонує набір стандартних прав (доступ, виправлення, видалення, заперечення тощо). При цьому великі наголоси робляться на “Right to Know” та “Right to Delete”, з уточненням, що після видалення розмов із чат-історії компанія стирає їх зі своїх бекенд-систем протягом 30 днів. Умови наближаються до GDPR-підходу із покроковим поясненням, як подати запит і в які терміни він буде виконаний.

Має детально прописану секцію про «Data Transfers», де згадано reliance на “adequacy decisions” (рішення про належний рівень захисту), стандартні договірні клаузули та інші юридичні інструменти для передачі даних з ЄС/Великої Британії до США. Пояснюється, що Anthropic — компанія з офісом у США та дочірньою фірмою в Ірландії; з цим пов’язане дотримання правил GDPR та інших локальних норм.

Висновок

DeepSeek пропонує інструменти генеративного ШІ, але їхня політика обробки персональних даних передбачає ширше використання даних користувачів для навчання та вдосконалення моделей, порівняно з OpenAI та Anthropic (Claude), які докладно регулюють процедури відмови і видалення, DeepSeek більше зосереджений на зборі даних для навчання та розвитку ШІ-рішень. Остаточний вибір між платформами залежить від пріоритетів щодо функціональних можливостей та рівня захисту персональних даних. Кожному бізнесу та користувачеві варто уважно ознайомитися з політиками, оцінити ризики та належним чином структурувати процеси конфіденційності, щоб отримати конкурентні переваги без компромісів із безпекою.

‍

Джерело: Forbes

‍

Петро Білик,

керівник практик Технологій та інвестицій,

Штучного Інтелекту в Juscutum

17.4.2025

Алгоритм дій під час обшуку: чекліст для бізнесу

Читати

15.4.2025

Сірий імпорт: що це таке і як з ним боротися?

Читати

3.4.2025

Ризики в публічних закупівлях: що варто знати бізнесу, щоб уникнути кримінальної відповідальності

Читати

1.4.2025

Виключення учасника з ТОВ без його згоди

Читати

31.3.2025

Juscutum отримує нагороду Ukrainian Fintech Awards у номінації Best Legal Tech Advisor

Читати

27.3.2025

Ірина Біляєва — серед найвпливовіших жінок юридичного ринку за версією Ukrainian Women in Law — 2025

Читати

28.3.2025

Отримання ліцензії для онлайн-казино в Україні

Читати

27.3.2025

Зміна засновників ТОВ: що потрібно знати бізнесу?

Читати

Зв'язатися

ЗАЛИШИЛИСЬ
ПИТАННЯ?

Дякуємо за звернення! Наш менеджер звʼяжеться з вами найближчим часом.

Щось пішло не так. Будь ласка, перевірте всі поля та повторіть відправку.

Ми використовуємо cookie-файли для роботи сайту та оптимізації послуг. Вибираючи опцію «Погодитися», ви даєте згоду на опрацювання персональних даних, які можуть бути отримані з cookie-файлів згідно нашої політики конфіденційності.

Прийняти Відмінити Налаштування

Thank you! Your submission has been received!

Oops! Something went wrong while submitting the form.

Налаштування

DeepSeek: що це таке?