За „революционния пробив" на „DeepSeek", за митовете и реакциите, за последиците и значението, както и за ролята и изводите от «дебюта» на новия китайски цифров събеседник, разговаряме в ексклузивно интервю за КМГ с проф. д-р по история и философия Нако Стефанов.
В. Проф. Стефанов, в последно време терминът-изненада „DeepSeek" набира огромна популярност. Освен това все повече хора от цял свят започнаха да общуват с виртуалния събеседник DeepSeek и бързо откриха, че смислеността на отговорите е невероятна. Моля, разкажете ни повече, тъй като Вие се занимавате и с темата за Изкуствения Интелект, неговото приложение в науката и технологиите, в общуването и в живота. Какво е „DeepSeek", какво представлява този модел и защо ни изненада, къде е началото и какво всъщност ни дава той, по-различно от други модели на ИИ?.
О. На 10 януари 2025 г. обещаващ малък „стартъп" в Китай представя цифров събеседник, базиран на невронната мрежа DeepSeek V3, пусната през декември. Този „стартъп" носи името Ханджоу DeepSeek Artificial Intelligence Co., Ltd. Излиза на пазара с търговската марка DeepSeek. Представлява китайска софтуерна компания за „Изкуствен интелект". Първият му продукт е голям езиков модел (Large Language Model - LLM) с отворен код. Тя е базирана в Ханджоу, Джъдзян. Компанията е собственост и се финансира от китайския хедж фонд High-Flyer. Нейният съосновател, Лян Уенфън, създава компанията през 2023 г. и служи като неин главен изпълнителен директор.
Моделът DeepSeek-R1 предоставя отговори, сравними с други съвременни големи езикови модели, като GPT-4o и o1 на OpenAI.Съобщава се, че разходите за обучение са значително по-ниски от другите LLM. Компанията твърди, че е обучила R1 за 6 милиона щатски долара в сравнение със 100 милиона долара за „GPT-4" на „OpenAI" през 2023 г. Това е приблизително една десета от изчислителната мощност, използвана за сравнимия модел на Meta, „LLaMA 3.1."
„ИИ" моделите на DeepSeek са разработени на фона на санкциите на Съединените щати срещу Китай, ограничаващи достъпа до чипове, използвани за обучение на LLM. Те имат за цел да ограничат способността да се разработват усъвършенствани системи за „Изкуствен интелект". Десет дни по-късно, китайската компания пуска нов модел чатбот, наречен R1, базиран на V3. Версията V2 също влиза в новините миналата пролет, провокирайки война на "невронни мрежи" в Китай: Ниската цена на тяхното предложение принуждава други големи играчи на китайския пазар, било то собствениците на TikTok от ByteDance или собствениците на Aliexpress от Alibaba, да намалят цените за използване на своите модели. Ниската цена на използването на DeepScek го превръща в реклама: въпреки че този „Изкуствен интелект" може и да не демонстрира интелектуални висоти, но достъпността на използването на езиковия модел стана основа за общ интерес. Заявката струва 110 пъти по-малко от тази на американския конкурент. И тогава излезе още една новина: От компанията заявиха, че са изградили изчисленията на остарели чипове, тъй като Джо Байдън спря доставката на нови. След това обявиха, че са обучили модела си на отворени данни от екип от петима души и само за шест милиона долара, като дори изходният му код е отворен. Това при условие, че американците утвърждават, че за същите цели те разходват стотици милиони долари.
В. Да се върнем малко назад и да си припомним ролята на Изкуствения Интелект изобщо, като важна технологическа платформа.
О. Днес несъмнено като ключова технологическа платформа, обект не просто на иновационно-технологическа конкуренция, но на т.нар. „Технологическа война" е „Изкуственият интелект" – ИИ. Понякога у нас се използва и терминът на английски език „Artificial Intelligence" – AI.
„Изкуственият интелект" (ИИ/AI/, известен също като „машинен интелект" /MИ/) е интелигентността, показвана от машините, за разлика от естествената интелигентност- ЕИ (Natural Intelligence - NI), показана от хората и животните. В компютърната наука изследванията на „ИИ" се дефинират като изследване на "интелигентните агенти": всяко устройство, което възприема околната среда и предприема действия, които увеличават шансовете му за успех по достигане на някаква цел. Особено значение в сегашния момент придоби т.нар. „Генеративен изкуствен интелект"/ГенИИ/.
Терминът "Изкуствен интелект" се прилага, когато машината имитира "когнитивни" функции, които хората свързват с друг човешки ум, като "учене" и "разрешаване на проблеми".
В. Какви са целите на Изкуствения Интелект и с какво допринася той в световното развитие?
О. Целите на ИИ са следните: 1. Формиране на аргументи и решаване на проблеми; 2. Представяне на знания; 3. Планиране; 4. Обучение; 5.Езиков превод; 6. Възприятие; 7. Движения и манипулиране; 8.Социална интелигентност, т.е. използване за прогностика; 9. Творчество; 10. Обща интелигентност.
Какво ни носи ИИ все още не е напълно ясно. Но определено се очертава ситуация за качествен, революционен прелом в реализацията на всички човешки дейности. Не бива да се забравя, че немалко на брой специалисти по „ИИ" се придържат към мнението, че „ИИ" дори с всички инвестиции и цялата изразходвана мощност не надхвърля обработката на нечии други създадени от човешката мисъл знания и идеи. И макар и често умело „ИИ" да имитира оригиналната мисъл, той просто ползва създадените от човека творчески мисли и знания. И такава оценка може да се срещне нерядко.
В. Кажете ни моля някои примери или конкретни факти, които подкрепят тези оценки?
О. Подобна оценка се подкрепя от някои важни факти, често пъти неизвестни на широката публика. Например, Microsoft и корпорацията „OpenAI", създател на бота „ChatGPT", създават свързана мрежа от пет центъра за данни. Става дума за съоръжение в Уисконсин, САЩ и четири други в щатите Калифорния, Тексас, Вирджиния, както и в Бразилия. Заедно те образуват масивен суперкомпютър, наречен Stargate/Звездна врата/. Този проект струва повече от 100 милиарда долара. Той изисква пет гигавата електроенергия, което е еквивалентно на мощността на пет средно големи атомни електроцентрали. Microsoft, Amazon, Apple, Google, Meta и други свръхголеми технологични компании инвестират сериозно в центрове за данни, особено в „хипермащабни" центрове за данни. Те не само са огромни по размер. По своята изчислителна мощност са предназначени за задачи с интензивно използване на данни като генериране на „ИИ/AI/" отговори. Всичко това като че ли свидетелства и убеждава, че създаването и ползването на „ИИ" е свръхскъпо и мащабно дело, което е по силите само на свръхбогатите страни на т.нар. „Колективен Запад". Да, „ИИ" може да бъде ползван от потребители по целия свят. Обаче, мащабните инвестиции искат възвращаемост, поради което е нужно потребители да плащат скъпо ползването на „ИИ", като, например, „детето" на „OpenAI" - бота „ChatGPT". Това бе неоспорима истина, доскоро!
Свидетели сме, как хора от цял свят започнаха да общуват с виртуалния събеседник DeepSeek и бързо откриха, че смислеността на отговорите не отстъпва на основния продукт на флагмана на американската „ИИ" индустрия - "Chat GPT" на компанията "OpenAI". Иронията на ситуацията е, че изходният код на продукта „OpenAI" е затворен. Докато видите ли „тоталитарен и защитен" Китай предлага напълно „отворен код".
В. Какво точно демонстрира моделът DeepSeek, какви са неговите преимущества в сравнение с другите модели, визирани по-горе? И нещо много важно – моля кажете ни повече за създателите и екипа на Deep Seek.
О. Представянето на модела DeepSeek r1 демонстрира, че той може бързо и лесно да се стартира от агрегатор за невронни мрежи. Това предизвиква глобален резонанс, Лян Уънфън става национален герой. Същият е завършил Джъдзянския университета, който е един от най-старите и престижни университети в Китай, със степен по „ИИ". През 2016 г. става съосновател на количествения хедж фонд High Flyer, който бързо спечели признание за своите авангардни инвестиционни стратегии, задвижвани от „ИИ". Днес High Flyer е единственият инвеститор на DeepSeek. До 2021 г. фондът преминава напълно към автоматизирано управление на капитала, използвайки машинно обучение за прогнозиране на пазарните тенденции и вземане на инвестиционни решения. Според информация на уебсайта на фонда екипът включва лауреати на международни олимпиади по математика и физика, носители на сребърни и златни медали, както и специалисти с академични степени по статистика, научни изследвания и кибернетика.
През май 2023 г. Лян Уънфън предприема смела стъпка, като основава DeepSeek с амбициозната цел да напредне в изследванията в областта на изкуствения общ интелект (Аrtificial General Intelligence - AGI). Според Forbes, уникалният модел на финансиране на компанията – изцяло финансиран от хедж фонда High Flyer – ѝ е позволил да разработва авангардни „ИИ" проекти без натиск от външни инвеститори. Този подход дава на DeepSeek пълна свобода да се съсредоточи върху дългосрочни изследвания и технологично развитие.
Екипът на DeepSeek се състои само от десет души, но всеки от тях е изключителен специалист, възпитаник на водещи китайски университети. Компанията култивира атмосфера на иновации и поставя особен акцент върху задълбоченото познаване на китайския език и култура. При подбора на служители те оценяват предимно техническите способности, а не формалния трудов опит. Това създава нови перспективи на екипа и дава възможност за развитие на пробивни идеи в областта на „ИИ".
В. В какво се състои по-конкретно „философията" и визията на DeepSeek за бъдещето?
О. В интервю, озаглавено „Бъдещето е за тясната специализация" с Анюн /Anyong/, дъщерно дружество на китайския медиен холдинг 36Kr. Лян споделя фрагменти от своята философия и визия за бъдещето. По повод на ефекта, както в Китай, така и в глобален план във връзка с ниските цени на DeepSeek той заявява: „Това бе много неочаквано. Дори не предполагахме, че въпросът с цените ще бъде толкова чувствителен. Ние просто тръгнахме по свой път - калкулирахме разходите и на тяхна база определихме цените. Нашият принцип е да не работим на загуба, но и да не гоним свръхпечалби. Текущите цени осигуряват само малка печалба над разходите."
По-нататък Лян Уънфън добавя: „Нашата цел не беше да привличаме потребители. Намалихме цените по две причини: първо, докато изследваме нови архитектури, цената на нашите модели намаля. Второ, ние вярваме, че услугите, свъразни с „ИИ" и Приложно програмирания интерфейс" - ППИ (англ.ез. Аpplication Programming Interface-API, който представлява набор от правила и инструменти, които улесняват комуникацията между софтуерните приложения) трябва да бъдат достъпни за всички.
В отговор на въпрос „Защо DeepSeek се съсредоточава изключително на изследвания Лян Уънфън отговаря: „Защото най-важното сега е да участваме в световния технологичен прогрес. Години наред китайски компании взимат иновации, създадени в чужбина, и ги монетизират под формата на приложения. Но този подход не може да бъде устойчив. Този път нашата цел не е бърза печалба, а да развием технологична основа, която да тласне цялата екосистема напред."
Като излага своята философия основателят на DeepSeek споделя следните мисли: „Ние вярваме, че с развитието на китайската икономика тя трябва да премине от обикновен потребител на технологии към създател на технологии. През последните 30 години на Информационно-технологическата революция на практика не сме участвали във фундаменталните технологични разработки.
Ние сме убедени, че Китай не може да остане вечно в ролята на догонващ последовател. Често казваме, че китайският „ИИ" е с една или две години зад американския, но основната разлика не е във времето, а в подхода: между оригиналността и копирането. Ако не променим това, Китай ще остане догонваща страна. И някои рискове и провали по пътя са неизбежни. Доминиращата позиция на Nvidia не е просто резултат от тяхната работа, тя е плод на усилията на цялата западна технологична екосистема, която колективно изгражда пътни карти за бъдещи технологии. Китай трябва да създаде подобна система. Сега много китайски чипове се провалят не защото ни липсват ресурси, а защото нямаме същата силна технологична среда - ние сме твърде зависими от решенията на други хора. Някой трябва да направи първата крачка към неизвестното.
Нямаме никакви „магьосници" – само завършили водещи университети, специализанти и понякога дори стажанти четвърта или пета година. Млади специалисти с малък опит, но с голям потенциал. Моделът v2 е изцяло разработен от наши експерти. Днес в Китай може да няма топ 50 световни звезди, но нашата цел е сами да ги култивираме. Бъдещето е в тясната специализация. Основните „ИИ" модели изискват постоянни иновации, а големите компании имат своите ограничения - те може не винаги да са най-добрите в тази роля."
В. В т.нар „Колективен Запад" и по-специално в САЩ се разпространяват някои „митове" за Deep Seek, предизвикани от стартирането на модела. Какво целят те и какво биха могли да постигнат? И в тази връзка - адекватни ли са реакциите на САЩ и Запада като цяло на технологическия пробив на DeepSeek?
О.. „Дебютът" на DeepSeek удари по американските ИТ «динозаври» - раздутият производител на много модерни чипове "NVIDIA"(който в своя уебсайт заявява, че е пионер в ускореното изчисление за справяне с предизвикателства, които никой друг не може да разреши. Нашата работа в областта на „ИИ" трансформира най-големите индустрии в света и оказва дълбоко влияние върху обществото) загуби 590 милиарда от стойността си за ден. Общият спад на компаниите, листнати в NASDAQ/ Фондовият пазар Nasdaq е американска фондова борса, базирана в Ню Йорк. Това е най-активното място за търговия с акции в САЩ по обем и е на второ място в списъка на фондовите борси по пазарна капитализация на търгуваните акции в САЩ/, възлиза на почти трилион долара. Това е най-големият спад след Covid. Е, няколко дена по-късно напомпаната стойност се възстанови донякъде от спада, което, обаче поражда съмнения по повод на т.нар. капитализация на фондовите борси, доколко те са верен показател на стойността и ценността на бизнеса.
Ударът безспорно е силно болезнен. Той обезсилва ентусиазма, породен от изборите на Донал Тръмп, обявил "MEGA" – Make America Great Again, т.е. „Да направим Америка отново велика". Но също така и групата от „техно-либерали" милиардерите Илън Мъск, Джеф Безос, Марк Зукърбърг, Питър Тил, Дейвид Сакс и другите около тях.
А най-вече този удар бие по редица митове на „Колективния Запад" и преди всичко на Щатите. Митове, които утвърждават образа на Запада като единствен носител на творчески идеи, на умни мозъци, на високи технологии и прогресивни иновации. Докато според евроа-атлантическите митове всички страни и народи на Изток или Юг са така или иначе „изоставащи", „губещи" и „недорасли". Те прилагат усилия за „догонване", но в крайна сметка си остават само „догонващи".
На практика такива митове пречат да се гледа с отворени очи на реалността, която съвсем не е такава каквато се вижда през „розовите очила" на тези митове. Технологическият и иновационен пробив на DeepSeek определено може да се оцени и като удар по тези митове. Същите следва да наречем дълбоко залегнал в съзнанието на западните елити и западните общества своеобразен „технологичен расизъм".
Що се отнася до реакцията на „обидения" от технологическия пробив на DeepSeek Вашингтон - тя бе шумна, пъстра, многоаспектна и вътрешнопротиворечива. Първоначално се утвърждаваше, че конкуренцията е само в полза на Съединените щати. Едновременно с това започват предложения за „удушаване" на китайците с мита и нови ограничения върху доставките на чипове. Заедно с това започва верига от пиар-реакции, а именно:
·Сем Алтман – главата на" OpenAI" заявява, че китайците са им преподали урок, но американските технологични гиганти умеят да се учат, т.е. „Империята ще отговори на удара", т.е. съвсем по сценария на филмовата сага „Звездни войни";
·След това се появи тълпа от експерти и познавачи, които започнаха да „развенчават" DeepSeek: Моделът не може да се сравнява с този на „Chat GPT" на компанията „OpenAI". Други заявиха, че „6 милиона за обучение" не включват в себе си разходите за изграждане на център за данни и набор на сътрудници. Че на практика проектът струва стотици милиони долара;
·Но най-интересни се оказаха обвиненията, че китайският „ИИ" е опасен и недемократичен и служи на някакви скрити цели на КНР за получаване на секретни данни. Затова тук и там забраниха ползването на DeepSeek;
·Тук дойде и „Големият удар" на 28 януари 2025 г. във Ватикана Светият престол се сети да обяви, че „ИИ" е сянката на злото, способна да работи против човека. Е, когато навремето ботът „Chat GPT" влезе в действие нямаше такива заявления;
·Дейвид Сакс, съветник и спонсор на президента Тръмп, наречен в американската преса „Кралят на „ИИ" утвърждава, че успехът на DeepSeek е свързан с ефективните ограничения за поставяне на нови чипове, което накарало китайците да изтискат всичко от старите микрочипове. Затова решението е да се ужесточат ограниченията;
·И накрая на 24 януари т.г. в интервю за „Фокс" новият американски президент Доналд Тръмп с лекота обясни пробива на DeepSeek, но и последвалите ги нови разработки на „Алибаба" и „БайтДенс" с това, че китайците са откраднали американските секрети в тази област. Иначе те не са способни на нищо свое.
Вместо заключение няколко думи за последиците
В. Какви са изводите, които можем да направим засега за ролята и значението на модела Deep Seek? И какво можем да предвидим като последици от този революционен пробив?
О. Като обобщение може да се каже, че технологичната надпревара в сферата на „ИИ" става все по-непредвидима. Историята на DeepSeek не е просто предизвикателство към глобалното лидерство на „OpenAI". Това е доказателство, че иновациите днес могат да дойдат от неочаквани места. Китай не просто догонва Запада, той създава свой собствен технологичен пейзаж, който се различава от американския не само по подходи, но и по философия. Ударение върху фундаменталните изследвания и дългосрочните перспективи, отказ от краткосрочните търговски цели и фокусирането върху отворените технологии могат да доведат до много интересни резултати.
В заключение нека ще кажа няколко думи и за последиците от революционния пробив на DeepSeek. Първа такава последица е предложението на Илън Мъск да закупи за 97.4 милиарда долара „OpenAI". На което Сем Алтман отговори с „Не". Но и с подигравка предложи да закупи Twitter. Така че като първа последица се оказва един скандал в САЩ между „техно-либералите".
Според мен, една значително по-мащабна последица е това да изпревариш САЩ. DeepSeek засили ролята на Китай като алтернативен доставчик на «ИИ» решения в глобален план. САЩ загубиха монопола си на пазари като Югоизточна Азия, Европа и Русия. Това е ясна победа за Китай с технологични, търговски и геополитически последици.