Vandaag
Nieuws
Hardware
Software
Site
Tip
Oor
Archief nieuwsbrief
Abonneer
☰
Home
Vandaag
Nieuws |
Hoe kan het dat DeepSeek zo veel efficiënter werkt, aan lagere prijs?
Gepubliceerd op: 2025-01-29
Voor wie echt wil weten hoe DeepSeek werkt, en waarom het zo revolutionair is, raden wij de podcast DTNS aan. Daar kregen wij deze uitleg over de revolutionaire werking van DeepSeek, die wij hier in vertaling weergeven.
De DeepSeek-modellen gebruiken wat men Chain-of-Thought noemt, vergelijkbaar met het o1-model van OpenAI. Dit helpt om onnauwkeurigheden en hallucinaties te verminderen. Grote Taalmodellen proberen eigenlijk een zeer goede gok te maken over wat het volgende stukje data zou moeten zijn. Chain-of-Thought laat het model teruggaan en opnieuw proberen. Om het te vereenvoudigen, controleert het zijn werk en gebruikt het resultaat dat het vaakst voorkomt en goed bij de feiten past. Het is een beetje versterkt leren dat dan in Grote Taalmodellen geïntegreerd werd. Dat zorgt er wel voor dat het langer duurt om een antwoord te geven, maar dat het antwoord wel nauwkeuriger zal zijn. Het maakt het geven van een antwoord ook duurder. Hoe meer pogingen je een COT-model geeft, hoe beter het resultaat. Maar ook, hoe duurder dat antwoord wordt. Men zegt dat in sommige gevallen een antwoord van o1 $3.000 aan rekenkracht kostte. Dat is natuurlijk een uitzondering, maar het toont aan waar we mee te maken hebben.
Doordat er geen geavanceerde chips geleverd mochten worden aan China, was DeepSeek wel gedwongen om te werken met minder en goedkopere hardware bij het optimaliseren van de antwoorden. Daarover een goede uitleg bij Jeffrey Emmanuel(2), maar in het kort komt het erop neer dat DeepSeek 8-bit drijvende-komma-getallen gebruikt in plaats van 32-bit om geheugen te besparen in ruil voor precisie. Het COT-model houdt het nauwkeurig. Dit betekent dat het veel minder GPU's nodig heeft voor training.
Er zijn verschillende andere indrukwekkende trucs, maar een van de meest opvallende is Multi-head Latent Attention. Het MLA-systeem van DeepSeek comprimeert hoe individuele tokens van informatie worden weergegeven zodat alleen de meest belangrijke worden vastgelegd, opnieuw met minder geheugengebruik. Het is verspillend om volledige indices op te slaan, dus dat doet DeepSeek niet. Ze slagen erin om een goede load balancing toe te passen in hoe de GPU communiceert en balanceren ook de transformers die de antwoorden op vragen creëren. Om het te vereenvoudigen, maken ze meerdere kleinere modellen die goed zijn in specifieke soorten vragen en routeren de vragen naar die modellen indien nodig. Die modellen kunnen kleiner en efficiënter zijn om te draaien. Hoewel het totale aantal parameters over alle modellen hoog is, hoef je niet alle modellen tegelijk te draaien. Dit betekent dat het kan draaien op twee Nvidia 4090 GPU's in plaats van een reeks dure H100 GPU's: $2.000 vs. $40.000.
Er is veel meer, maar het resultaat is dat DeepSeek 95% minder geld kan vragen voor inferentieverzoeken op zijn API dan OpenAI en Anthropic. Dit is indrukwekkend, tenzij uiteraard....DeepSeek liegt en een groot aantal H100's gebruikt, maar dat natuurlijk niet aan de grote klok gaat hangen, want de export van die H100's naar China was verboden...
(1)
https://dailytechnewsshow.com/2025/01/27/deepseek-makes-deep-impr...
(2)
https://youtubetranscriptoptimizer.com/blog/05_the_short_case_for...
Deel op
Deel per
Terug naar het overzicht
Nieuws
Meta laat je IG Reals naar Threads posten. Maar wat is het nut?
Meta: nieuws over Threads en Meta 3D Gen
Apple Vision Pro in nieuwe landen, en meer functies - en komen er Airpods met een camera?
Steeds meer processen tegen grote tech bedrijven
Ook antitrust klachten tegen hardware
Threads verhoogt interactiviteit met metaverse
POSSE: nieuwe manier om je blog te verspreiden
YouTube: nieuwigheden voor YouTube Premium gebruikers
Apple Diagnostics nu ook in 32 Europese landen
Google: nieuwigheden in Translate, Google Sheets en Chrome voor mobiele toestellen
Naar het Nieuws-archief...
Hardware
Waterkrachtcentrales die vis-vriendelijk zijn
Boox Palma: Android maar dan met e-ink
Grote brand in Koreaanse batterijfabriek
Robot verbreekt Rubik record
De eerste Copilot+ pc s zijn uit
De eerste Copilot Plus pc s zijn uit
Logitech: stylus voor Meta Quest headset
Bill Gates kiest voluit voor atoomenergie
Voortaan ook een Black Box in de operatiezaal
AI begrijpt wat je hond je wil zeggen
Naar het Hardware-archief...
Oor
TuneIn heropent langzaam deur voor nieuwe zenders
RIAA klaagt AI muziekdiensten Suno en Udio aan
All-In Podcast spreekt met Donald Trump
Podcast: de Diamantroof
TikTok Off the Record: artiesten vertellen
Spotify verhoogt prijs van zijn abonnement in Frankrijk
Het Geluidshuis: vijf Belgian Podcast Awards
Streaming video: verschuivingen
All-In Podcast sprak met Sam Altman
Spotify: exclusiviteit loont blijkbaar niet
Naar het Oor-archief...
Site
PlusDocs: AI PowerPoint Maker
De ruimte fotograferen met je smartphone
A Trailtale
Shipmap: transport via zee
Make The Docs
StoryLife: fotoalbums voor koppels
eHammurabi: digitale versie
Recall: online content slim bewaren
Notion Site
Smashing: nieuws verzamelaar
Naar het Site-archief...
Tip
En waarom niet ChatGPT gebruiken voor recepten?
Zo stap je over naar Mastodon
Spotify en albums
Tip Windows 11: je foto s van je Android naar Windows PC overzetten
Factchecking doe je met Search
Evernote: zo laat je die vervelende Slash-tip verdwijnen
Verborgen Emoji Game in Instagram
Apple watch Faces: wat is het en hoe installeer je het
Google Photos update: leuke AI nieuwigheden
Netflix: ontdek meer titels
Naar het Tip-archief...
Software
Geekbench AI: test de AI mogelijkheden van je computer en je smartphone
Winamp Community Update project
Revio Uninstaller
ToDo Screenshots
MSEdge tweaker
WinSCP: FTP tool
CPU Display Code
DevToys: voor ontwikkelaars
Document To Speech
Chemical Structure Viewer
Naar het Software-archief...
Bekijk hier de oudere artikels
Ons archief is wellicht het meest uitgebreide overzicht...
Alle rechten voorbehouden aan www.netties.be (c) 2025 - v50 - voor suggesties en vragen gebruik ons
contactformulier
.
Design en programmatie by PDL