DeepSeek: AI භූ දර්ශනය විප්ලවීයකරණය කරන කඩාකප්පල්කාරී එක

AIPU WATON සමූහය

හැඳින්වීම

තරඟකාරී විශාල මාදිලි, වෙළඳපල කොටස සඳහා තරඟ කරන වලාකුළු සැපයුම්කරුවන් සහ වෙහෙස මහන්සි වී වැඩ කරන චිප් නිෂ්පාදකයින් අතර පවතින කනස්සල්ල - ගැඹුරු සෙවීමේ බලපෑම දිගටම පවතී.

වසන්ත උත්සවය අවසන් වන විට, DeepSeek වටා ඇති උද්යෝගය ශක්තිමත්ව පවතී. මෑත නිවාඩුව තාක්ෂණික කර්මාන්තය තුළ සැලකිය යුතු තරඟකාරී හැඟීමක් ඉස්මතු කළ අතර, බොහෝ දෙනෙක් මෙම "කැට්ෆිෂ්" සාකච්ඡා කර විශ්ලේෂණය කළහ. සිලිකන් නිම්නය පෙර නොවූ විරූ අර්බුදයක හැඟීමක් අත්විඳිමින් සිටී: විවෘත මූලාශ්‍රයේ උපදේශකයින් නැවතත් ඔවුන්ගේ අදහස් ප්‍රකාශ කරමින් සිටින අතර, OpenAI පවා එහි සංවෘත මූලාශ්‍ර උපාය මාර්ගය හොඳම තේරීම දැයි නැවත ඇගයීමට ලක් කරයි. අඩු පරිගණක පිරිවැය පිළිබඳ නව ආදර්ශය Nvidia වැනි චිප් දැවැන්තයින් අතර දාම ප්‍රතික්‍රියාවක් ඇති කර ඇති අතර, එය එක්සත් ජනපද කොටස් වෙළඳපොළ ඉතිහාසයේ වාර්තාගත එක් දින වෙළඳපල වටිනාකම් පාඩු වලට තුඩු දී ඇති අතර, රජයේ ආයතන DeepSeek විසින් භාවිතා කරන චිප් වල අනුකූලතාවය විමර්ශනය කරමින් සිටී. DeepSeek විදේශයන්හි මිශ්‍ර සමාලෝචන මධ්‍යයේ, දේශීය වශයෙන්, එය අසාමාන්‍ය වර්ධනයක් අත්විඳිමින් සිටී. R1 ආකෘතිය දියත් කිරීමෙන් පසු, ආශ්‍රිත යෙදුම ගමනාගමනයේ වැඩිවීමක් දැක ඇති අතර, යෙදුම් අංශවල වර්ධනය සමස්ත AI පරිසර පද්ධතිය ඉදිරියට ගෙන යනු ඇති බව පෙන්නුම් කරයි. ධනාත්මක අංගය නම්, DeepSeek යෙදුම් හැකියාවන් පුළුල් කරනු ඇති අතර, ChatGPT මත යැපීම අනාගතයේදී එතරම් මිල අධික නොවන බව යෝජනා කරයි. මෙම මාරුව OpenAI හි මෑත කාලීන ක්‍රියාකාරකම් වලින් පිළිබිඹු වී ඇති අතර, DeepSeek R1 ට ප්‍රතිචාර වශයෙන් නිදහස් පරිශීලකයින් සඳහා o3-mini ලෙස හැඳින්වෙන තර්කන ආකෘතියක් සැපයීම මෙන්ම o3-mini හි චින්තන දාමය ප්‍රසිද්ධියට පත් කළ පසුකාලීන වැඩිදියුණු කිරීම් ද ඇතුළත් වේ. මෙම චින්තන දාමය සාරාංශයක් ලෙස සේවය කළද, බොහෝ විදේශීය පරිශීලකයින් මෙම වර්ධනයන් සඳහා DeepSeek වෙත කෘතඥතාව පළ කළහ.

ශුභවාදීව, DeepSeek දේශීය ක්‍රීඩකයින් එක්සත් කරන බව පැහැදිලිය. පුහුණු පිරිවැය අඩු කිරීම කෙරෙහි අවධානය යොමු කරමින්, විවිධ උඩුගං බලා චිප් නිෂ්පාදකයින්, අතරමැදි වලාකුළු සපයන්නන් සහ බොහෝ ආරම්භක සමාගම් පරිසර පද්ධතියට ක්‍රියාකාරීව සම්බන්ධ වෙමින්, DeepSeek ආකෘතිය භාවිතා කිරීම සඳහා පිරිවැය කාර්යක්ෂමතාව වැඩි දියුණු කරයි. DeepSeek හි පත්‍රිකාවලට අනුව, V3 ආකෘතියේ සම්පූර්ණ පුහුණුව සඳහා අවශ්‍ය වන්නේ H800 GPU පැය මිලියන 2.788 ක් පමණක් වන අතර පුහුණු ක්‍රියාවලිය ඉතා ස්ථායී වේ. පරාමිති බිලියන 405 ක් සහිත Llama 3 හා සසඳන විට පූර්ව පුහුණු පිරිවැය දස ගුණයකින් අඩු කිරීම සඳහා MoE (විශේෂඥයින්ගේ මිශ්‍රණය) ගෘහ නිර්මාණ ශිල්පය ඉතා වැදගත් වේ. වර්තමානයේ, V3 යනු MoE හි එවැනි ඉහළ විරලතාවයක් පෙන්නුම් කරන පළමු ප්‍රසිද්ධියේ පිළිගත් ආකෘතියයි. ඊට අමතරව, MLA (බහු ස්ථර අවධානය) සහජීවනයෙන් ක්‍රියා කරයි, විශේෂයෙන් තර්කන අංශවල. "MoE විරල වන තරමට, පරිගණක බලය සම්පූර්ණයෙන්ම භාවිතා කිරීම සඳහා තර්කනය අතරතුර අවශ්‍ය කණ්ඩායම් ප්‍රමාණය විශාල වන අතර, KVCache ප්‍රමාණය ප්‍රධාන සීමාකාරී සාධකය වේ; MLA KVCache ප්‍රමාණය සැලකිය යුතු ලෙස අඩු කරයි," AI තාක්ෂණ සමාලෝචනය සඳහා විශ්ලේෂණයකදී Chuanjing තාක්ෂණයේ පර්යේෂකයෙකු සඳහන් කළේය. සමස්තයක් වශයෙන්, DeepSeek හි සාර්ථකත්වය පවතින්නේ තනි තාක්ෂණයක් නොව විවිධ තාක්ෂණයන්හි සංයෝජනය තුළ ය. කර්මාන්තයේ අභ්‍යන්තරිකයින් DeepSeek කණ්ඩායමේ ඉංජිනේරු හැකියාවන් අගය කරන අතර, සමාන්තර පුහුණුව සහ ක්‍රියාකරු ප්‍රශස්තිකරණයේ ඔවුන්ගේ විශිෂ්ටත්වය සටහන් කරමින්, සෑම විස්තරයක්ම පිරිපහදු කිරීමෙන් පෙරළිකාර ප්‍රතිඵල අත්කර ගනී. DeepSeek හි විවෘත මූලාශ්‍ර ප්‍රවේශය විශාල මාදිලිවල සමස්ත සංවර්ධනය තවදුරටත් ඉන්ධන සපයන අතර, සමාන ආකෘති රූප, වීඩියෝ සහ තවත් බොහෝ දේ දක්වා ව්‍යාප්ත වුවහොත්, මෙය කර්මාන්තය පුරා ඉල්ලුම සැලකිය යුතු ලෙස උත්තේජනය කරනු ඇතැයි අපේක්ෂා කෙරේ.

තෙවන පාර්ශවීය තර්කන සේවා සඳහා අවස්ථා

දත්ත වලට අනුව, DeepSeek නිකුත් කිරීමෙන් දින 21ක් ඇතුළත දෛනික ක්‍රියාකාරී පරිශීලකයින් මිලියන 22.15ක් (DAU) රැස් කරගෙන ඇති අතර, ChatGPT හි පරිශීලක පදනමෙන් 41.6%ක් ලබාගෙන ඇති අතර Doubao හි දෛනික ක්‍රියාකාරී පරිශීලකයින් මිලියන 16.95 ඉක්මවා ගොස් ඇති අතර, එමඟින් ගෝලීය වශයෙන් වේගයෙන්ම වර්ධනය වන යෙදුම බවට පත්ව ඇති අතර, රටවල්/කලාප 157ක Apple App Store හි ඉහළින්ම සිටී. කෙසේ වෙතත්, පරිශීලකයින් විශාල වශයෙන් රොක් වෙමින් සිටියදී, සයිබර් හැකර්වරු DeepSeek යෙදුමට නිර්දය ලෙස පහර දී ඇති අතර, එහි සේවාදායකයන්ට සැලකිය යුතු පීඩනයක් ඇති කරයි. කර්මාන්ත විශ්ලේෂකයින් විශ්වාස කරන්නේ මෙය DeepSeek පුහුණුව සඳහා කාඩ්පත් යෙදවීම සහ තර්කනය සඳහා ප්‍රමාණවත් පරිගණක බලයක් නොමැති වීම නිසා බවයි. කර්මාන්තයේ අභ්‍යන්තරිකයෙකු AI Technology Review වෙත දැනුම් දුන්නේ, "නිතර ඇතිවන සේවාදායක ගැටළු ගාස්තු අය කිරීමෙන් හෝ තවත් යන්ත්‍ර මිලදී ගැනීම සඳහා මූල්‍යකරණය කිරීමෙන් පහසුවෙන් විසඳා ගත හැකිය; අවසානයේ, එය DeepSeek හි තීරණ මත රඳා පවතී." මෙය තාක්ෂණයට එදිරිව නිෂ්පාදනකරණය කෙරෙහි අවධානය යොමු කිරීමේදී හුවමාරුවක් ඉදිරිපත් කරයි. DeepSeek ස්වයං-පෝෂණය සඳහා බොහෝ දුරට ක්වොන්ටම් ප්‍රමාණකරණය මත විශ්වාසය තබා ඇති අතර, සුළු බාහිර අරමුදල් ලැබීම නිසා සාපේක්ෂව අඩු මුදල් ප්‍රවාහ පීඩනයක් සහ පිරිසිදු තාක්ෂණික පරිසරයක් ඇති වී තිබේ. දැනට, ඉහත සඳහන් කළ ගැටළු සැලකිල්ලට ගනිමින්, සමහර පරිශීලකයින් සමාජ මාධ්‍යවල DeepSeek වෙතින් භාවිත සීමාවන් ඉහළ නැංවීමට හෝ පරිශීලක සුවපහසුව වැඩි දියුණු කිරීම සඳහා ගෙවන ලද විශේෂාංග හඳුන්වා දීමට ඉල්ලා සිටී. ඊට අමතරව, සංවර්ධකයින් ප්‍රශස්තිකරණය සඳහා නිල API හෝ තෙවන පාර්ශවීය API භාවිතා කිරීමට පටන් ගෙන තිබේ. කෙසේ වෙතත්, DeepSeek හි විවෘත වේදිකාව මෑතකදී නිවේදනය කළේ, "වත්මන් සේවාදායක සම්පත් හිඟ වන අතර API සේවා නැවත ආරෝපණය කිරීම අත්හිටුවා ඇත."

 

මෙය නිසැකවම AI යටිතල පහසුකම් අංශයේ තෙවන පාර්ශවීය වෙළෙන්දන් සඳහා වැඩි අවස්ථාවන් විවෘත කරයි. මෑතකදී, බොහෝ දේශීය සහ ජාත්‍යන්තර වලාකුළු දැවැන්තයින් DeepSeek හි ආකෘති API දියත් කර ඇත - විදේශීය දැවැන්තයින් වන Microsoft සහ Amazon ජනවාරි මස අවසානයේදී සම්බන්ධ වූ පළමු අය අතර විය. දේශීය ප්‍රමුඛයා වන Huawei Cloud, පළමු පියවර ගත් අතර, පෙබරවාරි 1 වන දින සිලිකන්-පාදක Flow සමඟ සහයෝගයෙන් DeepSeek R1 සහ V3 තර්කන සේවා නිකුත් කළේය. AI Technology Review හි වාර්තාවලින් පෙනී යන්නේ සිලිකන්-පාදක Flow හි සේවාවන් පරිශීලකයින්ගේ ගලා ඒමක් දැක ඇති බවත්, එමඟින් වේදිකාව ඵලදායී ලෙස "බිඳ වැටෙමින්" ඇති බවත්ය. BAT (Baidu, Alibaba, Tencent) සහ ByteDance යන ප්‍රධාන තාක්ෂණික සමාගම් තුන ද පෙබරවාරි 3 වන දින සිට අඩු වියදම්, සීමිත කාලීන දීමනා නිකුත් කළ අතර, එය DeepSeek හි V2 මාදිලිය දියත් කිරීම මගින් අවුලුවන ලද පසුගිය වසරේ වලාකුළු වෙළෙන්දාගේ මිල යුද්ධ සිහිපත් කරයි, එහිදී DeepSeek "මිල මස් කපන්නා" ලෙස හැඳින්වීමට පටන් ගත්තේය. වලාකුළු වෙළෙන්දන්ගේ උමතු ක්‍රියා, Microsoft Azure සහ OpenAI අතර පෙර පැවති ශක්තිමත් සබඳතා ප්‍රතිරාවය කරයි, එහිදී 2019 දී, Microsoft සමාගම OpenAI හි සැලකිය යුතු ඩොලර් බිලියන 1 ක ආයෝජනයක් සිදු කළ අතර 2023 දී ChatGPT දියත් කිරීමෙන් පසු ප්‍රතිලාභ ලබා ගත්තේය. කෙසේ වෙතත්, Meta විවෘත මූලාශ්‍ර Llama නිර්මාණය කිරීමෙන් පසු මෙම සමීප සම්බන්ධතාවය බිඳ වැටීමට පටන් ගත් අතර, එමඟින් Microsoft Azure පරිසර පද්ධතියෙන් පිටත අනෙකුත් වෙළෙන්දන්ට ඔවුන්ගේ විශාල මාදිලි සමඟ තරඟ කිරීමට ඉඩ සැලසුණි. මෙම අවස්ථාවේදී, DeepSeek නිෂ්පාදන උණුසුම අනුව ChatGPT අභිබවා ගියා පමණක් නොව, o1 නිකුතුවෙන් පසුව විවෘත මූලාශ්‍ර ආකෘති ද හඳුන්වා දී ඇත, එය Llama හි GPT-3 පුනර්ජීවනය වටා ඇති උද්යෝගයට සමානය.

 

යථාර්ථයේ දී, වලාකුළු සපයන්නන් AI යෙදුම් සඳහා රථවාහන ද්වාර ලෙස ස්ථානගත වෙමින් සිටින අතර, එයින් අදහස් කරන්නේ සංවර්ධකයින් සමඟ සබඳතා ගැඹුරු වීම පූර්වගාමී වාසි බවට පරිවර්තනය වන බවයි. වාර්තා පෙන්වා දෙන්නේ Baidu Smart Cloud ආකෘතිය දියත් කිරීමේ දිනයේදී Qianfan වේදිකාව හරහා DeepSeek ආකෘතිය භාවිතා කළ ගනුදෙනුකරුවන් 15,000 කට අධික සංඛ්‍යාවක් සිටි බවයි. මීට අමතරව, සිලිකන් පාදක ප්‍රවාහය, ලුචෙන් තාක්ෂණය, චුවාන්ජින් තාක්ෂණය සහ DeepSeek මාදිලි සඳහා සහාය දියත් කර ඇති විවිධ AI Infra සපයන්නන් ඇතුළු කුඩා සමාගම් කිහිපයක් විසඳුම් ලබා දෙයි. DeepSeek හි දේශීයකරණය කළ යෙදවීම් සඳහා වත්මන් ප්‍රශස්තිකරණ අවස්ථා ප්‍රධාන වශයෙන් ක්ෂේත්‍ර දෙකක පවතින බව AI තාක්ෂණ සමාලෝචනය ඉගෙන ගෙන ඇත: එකක් දෙමුහුන් GPU/CPU අනුමානය භාවිතා කරමින් බිලියන 671 පරාමිති MoE ආකෘතිය දේශීයව යෙදවීම සඳහා මිශ්‍ර තර්කන ප්‍රවේශයක් භාවිතා කරමින් MoE ආකෘතියේ විරල ලක්ෂණ සඳහා ප්‍රශස්තිකරණය කිරීමයි. ඊට අමතරව, MLA ප්‍රශස්තිකරණය අත්‍යවශ්‍ය වේ. කෙසේ වෙතත්, DeepSeek හි මාදිලි දෙක තවමත් යෙදවීමේ ප්‍රශස්තිකරණයේදී යම් යම් අභියෝගවලට මුහුණ දෙයි. "ආකෘතියේ ප්‍රමාණය සහ බොහෝ පරාමිතීන් නිසා, ප්‍රශස්තිකරණය සැබවින්ම සංකීර්ණ වේ, විශේෂයෙන් කාර්ය සාධනය සහ පිරිවැය අතර ප්‍රශස්ත සමතුලිතතාවයක් ලබා ගැනීම අභියෝගාත්මක වන දේශීය යෙදවීම් සඳහා," චුවාන්ජින් තාක්ෂණයේ පර්යේෂකයෙක් පැවසීය. වඩාත්ම වැදගත් බාධකය වන්නේ මතක ධාරිතා සීමාවන් ජය ගැනීමයි. "CPU සහ අනෙකුත් පරිගණක සම්පත් සම්පූර්ණයෙන්ම භාවිතා කිරීම සඳහා අපි විෂමජාතීය සහයෝගීතා ප්‍රවේශයක් අනුගමනය කරමු, ඉහළ කාර්යසාධනයක් සහිත CPU ක්‍රියාකරුවන් භාවිතයෙන් සැකසීම සඳහා CPU/DRAM මත විරල MoE අනුකෘතියේ බෙදා නොගත් කොටස් පමණක් තබමු, ඝන කොටස් GPU මත රැඳී සිටින අතර," ඔහු තවදුරටත් පැහැදිලි කළේය. වාර්තා පෙන්වා දෙන්නේ චුවාන්ජින් හි විවෘත මූලාශ්‍ර රාමුව KTransformers ප්‍රධාන වශයෙන් විවිධ උපාය මාර්ග සහ ක්‍රියාකරුවන් මුල් ට්‍රාන්ස්ෆෝමර් ක්‍රියාත්මක කිරීමට අච්චුවක් හරහා එන්නත් කරන බවත්, CUDAGraph වැනි ක්‍රම භාවිතා කරමින් අනුමාන වේගය සැලකිය යුතු ලෙස වැඩි කරන බවත්ය. වර්ධන ප්‍රතිලාභ පැහැදිලිව පෙනෙන බැවින්, DeepSeek මෙම ආරම්භක සඳහා අවස්ථා නිර්මාණය කර ඇත; බොහෝ සමාගම් DeepSeek API දියත් කිරීමෙන් පසු සැලකිය යුතු පාරිභෝගික වර්ධනයක් වාර්තා කර ඇති අතර, ප්‍රශස්තිකරණයන් සොයන පෙර සේවාදායකයින්ගෙන් විමසීම් ලබා ගනී. "අතීතයේ දී, තරමක් ස්ථාපිත සේවාදායක කණ්ඩායම් බොහෝ විට විශාල සමාගම්වල ප්‍රමිතිගත සේවාවන්ට කොටු වී සිටි අතර, පරිමාණය හේතුවෙන් ඔවුන්ගේ පිරිවැය වාසි මගින් දැඩි ලෙස බැඳී සිටියහ. කෙසේ වෙතත්, වසන්ත උත්සවයට පෙර DeepSeek-R1/V3 යෙදවීම සම්පූර්ණ කිරීමෙන් පසු, අපට හදිසියේම ප්‍රසිද්ධ සේවාදායකයින් කිහිප දෙනෙකුගෙන් සහයෝගීතා ඉල්ලීම් ලැබුණු අතර, කලින් අක්‍රිය සේවාදායකයින් පවා අපගේ DeepSeek සේවාවන් හඳුන්වා දීම සඳහා සම්බන්ධතා ආරම්භ කළහ." වර්තමානයේ, DeepSeek ආකෘති අනුමාන කාර්ය සාධනය වඩ වඩාත් තීරණාත්මක කරමින් සිටින බව පෙනෙන අතර, විශාල මාදිලි පුළුල් ලෙස භාවිතා කිරීමත් සමඟ, මෙය AI Infra කර්මාන්තයේ සංවර්ධනයට සැලකිය යුතු ලෙස බලපානු ඇත. DeepSeek මට්ටමේ ආකෘතියක් අඩු වියදමකින් දේශීයව යෙදවිය හැකි නම්, එය රජයට සහ ව්‍යවසාය ඩිජිටල් පරිවර්තන උත්සාහයන්ට බෙහෙවින් උපකාරී වනු ඇත. කෙසේ වෙතත්, අභියෝග දිගටම පවතී, මන්ද සමහර සේවාදායකයින් විශාල ආකෘති හැකියාවන් සම්බන්ධයෙන් ඉහළ අපේක්ෂාවන් තබා ගත හැකි අතර, ප්‍රායෝගික යෙදවීමේදී කාර්ය සාධනය සහ පිරිවැය සමතුලිත කිරීම අත්‍යවශ්‍ය වන බව වඩාත් පැහැදිලි කරයි. 

ChatGPT වලට වඩා DeepSeek හොඳද යන්න ඇගයීමට, ඒවායේ ප්‍රධාන වෙනස්කම්, ශක්තීන් සහ භාවිත අවස්ථා තේරුම් ගැනීම අත්‍යවශ්‍ය වේ. මෙන්න පුළුල් සංසන්දනයක්:

විශේෂාංගය/අංගය ඩීප්සීක් චැට් ජීපීටී
හිමිකාරිත්වය චීන සමාගමක් විසින් සංවර්ධනය කරන ලදී OpenAI විසින් සංවර්ධනය කරන ලදී
මූලාශ්‍ර ආකෘතිය විවෘත මූලාශ්‍ර හිමිකාර
පිරිවැය භාවිතා කිරීමට නොමිලේ; ලාභදායී API ප්‍රවේශ විකල්ප දායකත්වය හෝ භාවිතයට ගෙවීමේ මිලකරණය
අභිරුචිකරණය ඉතා අභිරුචිකරණය කළ හැකි, පරිශීලකයින්ට එය වෙනස් කිරීමට සහ එය මත ගොඩනැගීමට ඉඩ සලසයි. සීමිත අභිරුචිකරණයක් තිබේ
නිශ්චිත කාර්යයන්හි කාර්ය සාධනය දත්ත විශ්ලේෂණ සහ තොරතුරු ලබා ගැනීම වැනි ඇතැම් ක්ෂේත්‍රවල විශිෂ්ටයි. නිර්මාණාත්මක ලිවීමේ සහ සංවාද කාර්යයන්හි ශක්තිමත් කාර්ය සාධනයක් සහිත බහුකාර්යතාව.
භාෂා සහාය චීන භාෂාව සහ සංස්කෘතිය කෙරෙහි දැඩි අවධානයක් යොමු කිරීම පුළුල් භාෂා සහාය නමුත් එක්සත් ජනපදය කේන්ද්‍ර කරගත්
පුහුණු පිරිවැය අඩු පුහුණු පිරිවැය, කාර්යක්ෂමතාව සඳහා ප්‍රශස්ත කර ඇත. ඉහළ පුහුණු පිරිවැය, සැලකිය යුතු පරිගණක සම්පත් අවශ්‍ය වීම.
ප්‍රතිචාර විචලනය භූ දේශපාලනික සන්දර්භයේ බලපෑම යටතේ වෙනස් ප්‍රතිචාර ලබා දිය හැකිය. පුහුණු දත්ත මත පදනම් වූ ස්ථාවර පිළිතුරු
ඉලක්කගත ප්‍රේක්ෂකයින් නම්‍යශීලීභාවය අවශ්‍ය සංවර්ධකයින් සහ පර්යේෂකයින් ඉලක්ක කර ගෙන සංවාද හැකියාවන් සොයන සාමාන්‍ය පරිශීලකයින් ඉලක්ක කර ගෙන ඇත.
අවස්ථා භාවිතා කරන්න කේත උත්පාදනය සහ ඉක්මන් කාර්යයන් සඳහා වඩාත් කාර්යක්ෂම වේ. පෙළ ජනනය කිරීමට, විමසුම් වලට පිළිතුරු දීමට සහ සංවාදයක යෙදීමට කදිමයි.

"Nvidia කඩාකප්පල් කිරීම" පිළිබඳ විවේචනාත්මක ඉදිරිදර්ශනයක්

වර්තමානයේ, Huawei හැරුණු විට, Moore Threads, Muxi, Biran Technology සහ Tianxu Zhixin වැනි දේශීය චිප් නිෂ්පාදකයින් කිහිප දෙනෙකු ද DeepSeek හි මාදිලි දෙකට අනුවර්තනය වෙමින් සිටිති. චිප් නිෂ්පාදකයෙකු AI Technology Review වෙත පැවසුවේ, "DeepSeek හි ව්‍යුහය නවෝත්පාදනය පෙන්නුම් කරයි, නමුත් එය LLM එකක් ලෙස පවතී. DeepSeek වෙත අපගේ අනුවර්තනය ප්‍රධාන වශයෙන් අවධානය යොමු කර ඇත්තේ තර්කානුකූල යෙදුම් කෙරෙහි වන අතර එමඟින් තාක්ෂණික ක්‍රියාත්මක කිරීම තරමක් සරල හා ඉක්මන් වේ." කෙසේ වෙතත්, MoE ප්‍රවේශයට ගබඩා කිරීම සහ බෙදා හැරීම සම්බන්ධයෙන් ඉහළ ඉල්ලුමක් අවශ්‍ය වන අතර, දේශීය චිප් සමඟ යෙදවීමේදී අනුකූලතාව සහතික කිරීමත් සමඟ, අනුවර්තනය අතරතුර විභේදනය අවශ්‍ය වන ඉංජිනේරු අභියෝග රාශියක් ඉදිරිපත් කරයි. "වර්තමානයේ, දේශීය පරිගණක බලය භාවිතයේ සහ ස්ථාවරත්වයේ Nvidia සමඟ නොගැලපේ, මෘදුකාංග පරිසර සැකසුම, දෝශ නිරාකරණය සහ පදනම් කාර්ය සාධන ප්‍රශස්තිකරණය සඳහා මුල් කර්මාන්තශාලා සහභාගීත්වය අවශ්‍ය වේ," ප්‍රායෝගික අත්දැකීම් මත පදනම්ව කර්මාන්ත වෘත්තිකයෙක් පැවසීය. ඒ සමඟම, "DeepSeek R1 හි විශාල පරාමිති පරිමාණය නිසා, දේශීය පරිගණක බලයට සමාන්තරකරණය සඳහා තවත් නෝඩ් අවශ්‍ය වේ. ඊට අමතරව, දේශීය දෘඩාංග පිරිවිතර තවමත් තරමක් පසුපසින් ඇත; උදාහරණයක් ලෙස, Huawei 910B හට දැනට DeepSeek විසින් හඳුන්වා දුන් FP8 අනුමානයට සහාය විය නොහැක." DeepSeek V3 මාදිලියේ කැපී පෙනෙන ලක්ෂණයක් වන්නේ FP8 මිශ්‍ර නිරවද්‍යතා පුහුණු රාමුවක් හඳුන්වාදීමයි, එය අතිශය විශාල ආකෘතියක් මත ඵලදායී ලෙස වලංගු කර ඇති අතර එය සැලකිය යුතු ජයග්‍රහණයක් සනිටුහන් කරයි. මීට පෙර, මයික්‍රොසොෆ්ට් සහ Nvidia වැනි ප්‍රධාන ක්‍රීඩකයින් අදාළ කාර්යයන් යෝජනා කළ නමුත්, ශක්‍යතාව පිළිබඳව කර්මාන්තය තුළ සැකයන් පවතී. INT8 හා සසඳන විට, FP8 හි ප්‍රධාන වාසිය නම්, පශ්චාත්-පුහුණු ප්‍රමාණකරණයට පාහේ පාඩු රහිත නිරවද්‍යතාවයක් ලබා ගත හැකි අතර අනුමාන වේගය සැලකිය යුතු ලෙස වැඩි දියුණු කළ හැකි බවයි. FP16 හා සසඳන විට, FP8 හට Nvidia හි H20 මත දෙගුණයක ත්වරණය සහ H100 මත 1.5 ගුණයකට වඩා ත්වරණය ලබා ගත හැකිය. විශේෂයෙන්, දේශීය පරිගණක බලය සහ දේශීය මාදිලිවල ප්‍රවණතාවය වටා ඇති සාකච්ඡා ගම්‍ය වන විට, Nvidia කඩාකප්පල් කළ හැකිද සහ CUDA අගල මඟ හැරිය හැකිද යන්න පිළිබඳ සමපේක්ෂනය වඩ වඩාත් ප්‍රචලිත වෙමින් පවතී. DeepSeek ඇත්ත වශයෙන්ම Nvidia හි වෙළඳපල වටිනාකමෙහි සැලකිය යුතු පහත වැටීමක් ඇති කර ඇති බව ප්‍රතික්ෂේප කළ නොහැකි කරුණකි, නමුත් මෙම මාරුව Nvidia හි ඉහළ මට්ටමේ පරිගණක බල අඛණ්ඩතාව පිළිබඳ ප්‍රශ්න මතු කරයි. ප්‍රාග්ධනය මත පදනම් වූ පරිගණක සමුච්චයකරණය පිළිබඳ කලින් පිළිගත් ආඛ්‍යාන අභියෝගයට ලක් වෙමින් පවතී, නමුත් පුහුණු අවස්ථා වලදී Nvidia සම්පූර්ණයෙන්ම ප්‍රතිස්ථාපනය කිරීම තවමත් දුෂ්කර ය. DeepSeek හි CUDA හි ගැඹුරු භාවිතය විශ්ලේෂණය කිරීමෙන් පෙන්නුම් කරන්නේ නම්‍යශීලීභාවය - සන්නිවේදනය සඳහා SM භාවිතා කිරීම හෝ ජාල කාඩ්පත් සෘජුවම හැසිරවීම වැනි - සාමාන්‍ය GPU වලට ඉඩ සැලසීමට කළ නොහැකි බවයි. කර්මාන්ත දෘෂ්ටි කෝණයන් අවධාරණය කරන්නේ Nvidia හි දිය අගල CUDA පමණක් නොව සමස්ත CUDA පරිසර පද්ධතියම ආවරණය කරන බවත්, DeepSeek භාවිතා කරන PTX (සමාන්තර නූල් ක්‍රියාත්මක කිරීම) උපදෙස් තවමත් CUDA පරිසර පද්ධතියේ කොටසක් බවත්ය. "කෙටි කාලීනව, Nvidia හි පරිගණක බලය මඟ හැරිය නොහැක - මෙය පුහුණුවේදී විශේෂයෙන් පැහැදිලිය; කෙසේ වෙතත්, තර්කනය සඳහා ගෘහස්ථ කාඩ්පත් යෙදවීම සාපේක්ෂව පහසු වනු ඇත, එබැවින් ප්‍රගතිය ඉක්මන් වනු ඇත. ගෘහස්ථ කාඩ්පත් අනුවර්තනය කිරීම ප්‍රධාන වශයෙන් අනුමානය කෙරෙහි අවධානය යොමු කරයි; පරිමාණයෙන් ගෘහස්ථ කාඩ්පත් මත DeepSeek හි කාර්ය සාධනය පිළිබඳ ආකෘතියක් පුහුණු කිරීමට කිසිවෙකු තවමත් සමත් වී නැත," කර්මාන්ත විශ්ලේෂකයෙක් AI තාක්ෂණ සමාලෝචනයට සඳහන් කළේය. සමස්තයක් වශයෙන්, අනුමාන දෘෂ්ටි කෝණයකින්, දේශීය විශාල මාදිලි චිප් සඳහා තත්වයන් දිරිගන්වන සුළුය. අනුමාන ක්ෂේත්‍රය තුළ දේශීය චිප් නිෂ්පාදකයින් සඳහා ඇති අවස්ථා වඩාත් පැහැදිලි වන්නේ පුහුණුවේ අධික ලෙස ඉහළ අවශ්‍යතා නිසා වන අතර එය ඇතුළුවීමට බාධාවක් වේ. විශ්ලේෂකයින් තර්ක කරන්නේ ගෘහස්ථ අනුමාන කාඩ්පත් භාවිතා කිරීම පමණක් ප්‍රමාණවත් බවයි; අවශ්‍ය නම්, අතිරේක යන්ත්‍රයක් ලබා ගැනීම කළ හැකි අතර, පුහුණු ආකෘති අද්විතීය අභියෝග මතු කරයි - වැඩි යන්ත්‍ර සංඛ්‍යාවක් කළමනාකරණය කිරීම බරක් විය හැකි අතර, ඉහළ දෝෂ අනුපාත පුහුණු ප්‍රතිඵලවලට අහිතකර ලෙස බලපෑ හැකිය. පුහුණුවට නිශ්චිත පොකුරු පරිමාණ අවශ්‍යතා ද ඇත, අනුමාන සඳහා පොකුරු සඳහා වන ඉල්ලීම් එතරම් දැඩි නොවන අතර, එමඟින් GPU අවශ්‍යතා ලිහිල් කරයි. වර්තමානයේ, Nvidia හි තනි H20 කාඩ්පතේ කාර්ය සාධනය Huawei හෝ Cambrian හි කාර්ය සාධනය ඉක්මවා නොයයි; එහි ශක්තිය පවතින්නේ පොකුරුකරණය තුළ ය. පරිගණක බල වෙළඳපොළට ඇති සමස්ත බලපෑම මත පදනම්ව, Luchen Technology හි නිර්මාතෘ You Yang, AI Technology Review සමඟ සම්මුඛ සාකච්ඡාවකදී සඳහන් කළේ, "DeepSeek අතිශය විශාල පුහුණු පරිගණක පොකුරු ස්ථාපිත කිරීම සහ කුලියට ගැනීම තාවකාලිකව අඩපණ කළ හැකිය. දිගු කාලීනව, විශාල ආකෘති පුහුණුව, තර්කනය සහ යෙදුම් සමඟ සම්බන්ධ පිරිවැය සැලකිය යුතු ලෙස අඩු කිරීමෙන්, වෙළඳපල ඉල්ලුම ඉහළ යාමට ඉඩ ඇත. මේ මත පදනම් වූ AI හි පසුකාලීන පුනරාවර්තනයන් පරිගණක බල වෙළඳපොලේ තිරසාර ඉල්ලුම අඛණ්ඩව ගෙන එනු ඇත." මීට අමතරව, "DeepSeek හි තර්කනය සහ සියුම්-සුසර කිරීමේ සේවා සඳහා ඇති ඉහළ ඉල්ලුම දේශීය පරිගණකමය භූ දර්ශනය සමඟ වඩාත් අනුකූල වේ, එහිදී දේශීය ධාරිතාවන් සාපේක්ෂව දුර්වල වන අතර, පොකුරු ස්ථාපිත කිරීමෙන් පසු නිෂ්ක්‍රීය සම්පත් වලින් නාස්තිය අවම කිරීමට උපකාරී වේ; මෙය දේශීය පරිගණක පරිසර පද්ධතියේ විවිධ මට්ටම්වල නිෂ්පාදකයින් සඳහා ශක්‍ය අවස්ථා නිර්මාණය කරයි." දේශීය පරිගණක බලය මත පදනම් වූ DeepSeek R1 ශ්‍රේණියේ තර්කන API සහ වලාකුළු රූපකරණ සේවා දියත් කිරීම සඳහා Luchen Technology Huawei Cloud සමඟ සහයෝගයෙන් කටයුතු කර ඇත. අනාගතය පිළිබඳව ඔබ යැං ශුභවාදීව ප්‍රකාශ කළේය: "DeepSeek දේශීයව නිෂ්පාදනය කරන ලද විසඳුම් කෙරෙහි විශ්වාසය ඇති කරයි, ඉදිරියට යන විට දේශීය පරිගණකමය හැකියාවන් සඳහා වැඩි උද්යෝගයක් සහ ආයෝජනයක් දිරිමත් කරයි."

微信图片_20240614024031.jpg1

නිගමනය

ChatGPT වලට වඩා DeepSeek "වඩා හොඳ" ද යන්න පරිශීලකයාගේ නිශ්චිත අවශ්‍යතා සහ අරමුණු මත රඳා පවතී. නම්‍යශීලීභාවය, අඩු පිරිවැය සහ අභිරුචිකරණය අවශ්‍ය කාර්යයන් සඳහා, DeepSeek වඩා උසස් විය හැකිය. නිර්මාණාත්මක ලිවීම, සාමාන්‍ය විමසීම් සහ පරිශීලක-හිතකාමී සංවාද අතුරුමුහුණත් සඳහා, ChatGPT පෙරමුණ ගත හැකිය. සෑම මෙවලමක්ම විවිධ අරමුණු සඳහා සේවය කරයි, එබැවින් තේරීම ඒවා භාවිතා කරන සන්දර්භය මත බෙහෙවින් රඳා පවතී.

ELV කේබල් විසඳුම සොයා ගන්න

පාලන කේබල්

BMS, BUS, කාර්මික, උපකරණ කේබල් සඳහා.

ව්‍යුහගත කේබල් පද්ධතිය

ජාලය සහ දත්ත, ෆයිබර්-ඔප්ටික් කේබලය, පැච් ලණුව, මොඩියුල, මුහුණු පුවරුව

2024 ප්‍රදර්ශන සහ සිදුවීම් සමාලෝචනය

2024 අප්‍රේල් 16-18, ඩුබායි හි මැද පෙරදිග-බලශක්තිය

2024 අප්‍රේල් 16-18 මොස්කව්හි සෙකුරිකා

2024 මැයි 9 වන දින ෂැංහයි හි නව නිෂ්පාදන සහ තාක්ෂණයන් දියත් කිරීමේ උත්සවය

2024 ඔක්තෝබර් 22-25, බීජිං හි ආරක්ෂක චීනය

2024 නොවැම්බර් 19-20 සම්බන්ධිත ලෝකය සෞදි අරාබිය


පළ කිරීමේ කාලය: පෙබරවාරි-10-2025