类别

制裁

澳大利亚政府向伊朗官员祭出新制裁

澳外交部长黄英贤5月12日宣布,由于伊朗持续“残酷”镇压其人民以及非法拘留外国人的行为,澳大利亚将对七名伊朗人和四个实体实施制裁。

美国放松制裁 白俄罗斯释放逾百政治犯

图为白俄罗斯诺贝尔和平奖得主阿列斯·比亚利亚茨基于2025年12月13日在立陶宛维尔纽斯获释后,在美国大使馆接受记者采访。(Photo by Petras Malukas / AFP via Getty Images)

大陆国企要求员工 取消赴日旅游行程

前段时间,日本首相高市早苗发表的“台湾有事”论,引发北京不满。为了制裁日本,北京当局呼吁民众暂时不要去日本旅游。近日,有数名中国国企员工透露,他们被公司要求取消前往日本的计划。 据中央社报导,湖北武汉一家国企工程师称,他在11月18日接到公司行政部门的电话,要求他取消赴日行程。他称,国企员工出国必须获得公司批准。早在10月份,他的出国申请就递上去了。他说,他原计划在11月底飞往大阪旅游。但随着日中关系的紧张,他不得不向旅行社取消了整个行程。经协调,旅行社退还了他机票和住宿的费用。不过,签证费是退不了的,他损失了一小笔。 北京某公立医院的男护士称,11月初,他向医院申请到日本旅游。但文旅部发布不要去日本的旅游警示后,医院主管就要求他取消原定于本周末出发的赴日行程。他称,自己的月薪只有4000元(人民币,下同),为了省钱,他通过国外线上旅游平台预定赴日机票和饭店,总共花了近6000元。现在计划取消了,大部分预订款无法退还,只有回程机票应该可以退款。也就是说,他去程机票和订饭店的钱都白花了,这对他来说,是一个沉重的打击。 这名男护士坦承,自己正在考虑偷偷去日本,但如果被医院发现,这就太冒险了。 北京某国营科研机构的1名员工称,大约1个月前,他就订下了去日本的计划,他的主管虽然没有明确表示不许他去日本,但却搁置了他的出国申请,这意味着上级不想让他去日本。如果上级不批准,他就要取消12月份的行程。 据悉,在中国,这种现象并不是偶然的。近两天,有数十名网友在中国短影音平台“小红书”上发布短片,称他们所属的党政机关要求他们取消到日本旅游的计划。 前段时间,高市早苗发表“台湾有事”论,明确表明若台海发生冲突,日本可行使“集体自卫权”。这样的言论让北京跳脚,再三向日本施压,包括发布“斩首”言论、建议公民在近期避免前往日本、举办军事演习、操控舆论等,要求日本收回相关言论。但日本并不退缩,反而再三重申日本立场,明确表示不会收回相关言论。

叙利亚总统访美 美延长对制裁豁免180天

美国总统川普11月10日于白宫会晤叙利亚总统艾哈迈德•沙拉(Ahmed al-Sharaa),这是沙拉以国家元首身份首次获美国总统正式接待,也标志着其自去年推翻巴沙尔•阿萨德掌权以来,首次踏上国际舞台。

俄对乌平民大规模空袭  川普斥普京“疯了”或再祭制裁

俄罗斯在上周末持续对乌克兰发动最大规模空袭,乌克兰民众死伤惨重,川普总统在25日罕见批评普京“完全疯了”,华尔街邮报在报导中还称,川普正在考虑本周对莫斯科祭出制裁。国际社会为回应普京的攻击也纷纷调整援乌策略。

 川普宣布解除美国对叙利亚的所有制裁

美国总统川普13日宣布解除美国对叙利亚的所有制裁,這是川普在利雅得参加一次美沙投资论坛时宣布的这则消息。

美众院通过涉台法案 强调支持国际参与

美国众议院5月5日一口气通过多项与台湾及人权相关的法案,包括《台湾国际团结法案》(Taiwan International Solidarity Act)、《台湾保证实施法案》(Taiwan Assurance Implementation Act),以及针对中国打压宗教信仰问题的《法轮功保护法案》(H.R.1540 – Falun Gong Protection Act)。 对于美国国会接连通过友台法案,台湾总统府发言人于社交平台X发文表示,感谢美国国会的坚定支持,认为法案传达明确讯号,反对中国政府滥用联合国大会第2758号决议,限制台湾参与国际组织的空间。 台湾外交部长林佳龙亦发表声明,对美方持续透过具体立法展现对台湾的跨党派支持,表达高度欢迎与诚挚感谢。 《台湾保证实施法案》要求美国国务卿定期检视国务院对台交往准则,以及任何后续相关文件。法案规定,检视须至少每5年一次,并于完成后90日内向国会提交报告。 至于《台湾国际团结法案》,则针对联合国大会第2758号决议进行澄清,指出该决议并未处理台湾或台湾人民在联合国及其专门机构中的代表权问题,亦未对中国与台湾的关系作出立场或涉及台湾主权。法案强调,美方反对任何未经台湾人民同意而改变台湾现状的行动。 众议院同日亦全票通过《法轮功保护法案》,针对中国被指持续进行活摘法轮功学员及其他良心犯器官的行为。法案要求美国政府采取措施,制止有关行为,并要求总统对明知故犯、直接参与或协助强行摘取器官的外国人士,实施签证限制及冻结其在美资产。

耿爽批评美国限制中共外交官赴美旅游就医 引群嘲

一直以来,中共体制内的官员及其家属将美国当成自己真正的家,不仅积极到美国旅游、留学、就医,还将大笔资产转移至美国,甚至在美国扎根。但在明面上,中共却将美国当成敌人,不仅煽动民族仇恨,鼓吹民众反美抗美。如今更是不顾百姓死活,致使中美贸易战不断升级。在这样的背景下,中国驻联合国副代表耿爽在会议上批评,美国限制中共外交人员和家属赴美“旅游、就医”,引发中国网友嘲笑。 4月25日,耿爽在东道国关系委员会会议上批评,美国频繁对“特定国家”的外交人员拒发签证,“限制旅行自由”,“粗暴限制特定国家外交人员及其家属的旅行自由和就医需求”等。 该言论在中国大陆引发嘲讽,不少网友嘲讽: ———为啥要去米国,你们自己骂得那么带劲! ———内需急需要循环,你跑去美国旅游? ———不相信咱门的医疗技术和手段? ———真是丢人啊,骂人家还要跑人家那里去看病旅游,骨气呢? ———啊?为啥外交人员及其家属的教育医疗要去美国?中国医疗教育全世界第一,董明珠也说,留学生里有间谍,绝不用! ———吃人家的饭,砸人家的锅! ———让他们都滚回来,都去朝鲜,巴基斯坦,俄罗斯。 ———很多观(官)2代、观(官)3代都在外面留学和拥有绿卡,以后可能这些人没那么方便了! ———让他也滚回来,成天骂人家,还带家人去哪干啥? 有网友假装给中共高层支招: ———不行就断交啊! ———我方只需要依照外交对等原则,拒签美国外交人员的家属来中国旅游和就医即可! ———静等互撤使馆! 有网友赞赏美国的做法: ———干的利落! ———我没意见! ———看来很在乎这个! ———软肋被抓到了。 ———如果我是川哥(川普),直接将这些家伙在美国的银行卡冻结,让他们每天嘴硬。 近来,美国相继制裁了多名在新疆、香港等地参与人权迫害的官员,限制参与迫害宗教和信仰者、少数民族成员、持不同政见者、人权捍卫者、记者、劳工组织者、民间社会组织者的中共官员和其家庭成员签证。 2020年12月3日,美国国务院发表声明,限制中国共产党党员及其直系亲属到美国旅行,并把中共党员及其家属的B1/B2签证的有效期从10年减至1个月。声明中说,这项举措的目地是保护美国免遭“恶意影响”,因为中共一直在努力“通过宣传、经济讹诈和其他不可告人的活动来影响美国人”。  

DeepSeek和国运有啥关系?

DeepSeek横空出世,成功破圈。破圈之后,照例就是各自发挥的“六经注我”。其中最值得警惕的,中美双方都出现了借题发挥的“技术孤立主义”。美方的“脱钩论”者把DeepSeek视为技术威胁,剽窃、盗用的指责满天飞;这边的“国运赌徒”则是把DeepSeek渲染为“中美争霸”的一击制胜的,自我感觉良好。 好端端的科技成果,却成了地缘政治的符号。妖魔化和神化看似针尖对麦芒,其实都是对科技进步事业的亵渎,是阻挠人类科技进步事业的合谋。 唯有屏蔽杂音,才能直面真相:DeepSeek到底是什么?将会造成怎样的影响? 01 DeepSeek师承chatgpt 1月27日,DeepSeek应用登顶苹果美国地区应用商店免费APP下载排行榜,在美区下载榜上超越了ChatGPT。随即引发了资本市场的震荡,DeepSeek被形容为“英伟达的最大空头”,英伟达的股价大幅下跌。“DeepSeek碾压ChatGPT,吊打英伟达”的神话就此诞生。 先说Deepseek和ChatGPT之间的关系。DeepSeek和ChatGPT之间的竞争,是“师徒之战”。两者的师承关系源于“蒸馏技术”,这是Deepseek快速崛起的技术路径。 通俗的说,“蒸馏技术”就是用一个较为成熟的“教师模型”训练“学生模型”,这一过程类似低度酒蒸馏加工为高度酒。具体操作方式是,“学生模型”每分钟上百万次高频提问,从“教师模型”中汲取数据、学习逻辑。然后在人工干预下优化算法,最终形成独特的个性。ChatGPT就是Deepseek的“教师模型”,或许不是唯一的,肯定是主要的。因此,说ChatGPT是Deepseek的老师,不过分吧? “蒸馏技术”不是近年来的新发明,发明者既不是中国人,也不是美国人,而是英国佬杰弗里.辛顿在2015年提出的,比阿尔法狗一战成名还早一年。所以,当时“蒸馏技术”只是纯理论的屠龙技——压根就没有成熟的“教师模型”,没法蒸馏。直到ChatGPT等成熟大模型相继投入实际应用,“蒸馏技术”才有了实际应用的空间。因此,“先有ChatGPT,后有Deepseek”也是无法否认的事实。 显然,Deepseek不是“天上掉下个林妹妹”,而是站在巨人肩膀上的衍生产品。咋咋呼呼的“国运赌徒”竭力否认、淡化Deepseek的师承ChatGPT,强拗“独立原创”的造型,是可笑又可怜的掩耳盗铃。 当然,也不能因为Deepseek是蒸馏技术的产物,就否认其原创性。蒸馏不等于盗窃、抄袭。要是能一抄了之,哪里轮得到Deeseek?在蒸馏技术的赛道上,有名有姓的玩家少说也有上百家。Deepseek能出圈,是有几把刷子的。“蒸馏”大同小异,人工干预的算法优化各显神通。简洁高效的算法是Deepseek的成功关键,颇有中国特色。 人工智能三大要素——算法、算力、数据,中国长于算法,美国重视算力。这种“偏科”倾向在赛道开启初期就已经显现了。昔日商汤为代表的视觉系AI“中国四小龙”,就是以算法著称。 ChatGPT崛起,“算力为王”的大力出奇迹成为主流。风水轮流转,Deeepseek的勃兴,在一定程度上是“算法复兴”。这种技术风格的转换,在人类的科技进步史上反复发生,是一种常态。 Deepseek最大的优势是性价比,算法赋能大幅降低了算力成本。省钱永远是商业竞争的王道,绝大部分个人用户都没有很高的专业需求,免费、开源的Deepseek更有吸引力,这是人工智能商业化应用的成功。 但是,这并不意味着因Deepseek已经青出于蓝胜于蓝,更谈不上“碾压ChatGPT”。“蒸馏技术”和算法优化是做减法,以简化的方式提高效率。所以,Deepseek更垂直、更聚焦专业领域,这也意味着牺牲了一部分通用性。比如说,文生图等视觉系技术就不是Deepseek的强项,和文心一言比都有差距,遑论ChatGPT。而且,蒸馏技术的技术“天花板”到底有多高,现在也很难判断。未来能否实现性能全面超越,并没有清晰的预期。 这从资本市场的表现也可以看出端倪,Deepseek上架后,微软的股价仅仅下跌了2%。表明了市场投资者还处于观望态度,资本市场用真金白银的站队表态,不是各路“嘴强王者”的唾沫星子可比的。 反而是英伟达的股价“大跌”17%,Deepseek真是“英伟达终结者”吗? 02 Deepseek不是“英伟达终结者” Deepseek到底使用了多少英伟达芯片,目前有三个版本分别是五万、一万和两千多,越传越少。其中“只有了两千多”的版本最假,Deepseek创始人梁文峰本人在采访中就说过,早在公司成立前额2021年就囤了一万块GPU。无论是一万还是五万,比起动辄几十万芯片的大厂产品,都是数量级的降低。大可不必在传播过程中人为夸大Deepseek的“省芯”。 必须指出的是,Deepseek的算法优化“省芯”,并不会降低人工智能领域的算力需求降低。算法优化和算力需求的关系,有点类似燃油发动机技术节油和燃油消费需求。燃油发动机开发省油技术,并没有降低汽油消费的总量。因为汽车的燃油成本越低,促进了汽车的普及度,燃油消费的总量不降反增。 Deepseek省芯降低了人工智能研发应用的资金门槛,会吸引更多的投资者进场。 人工智能的研发端将会进一步走向“群狼搏虎”的遍地开花。在应用端,Deepseek成功实现免费开源模式,大幅推进了人工智能的普及应用,也会产生巨大的算力需求增长。别小看中小企业、个人用户本地部署的仨瓜俩枣,聚沙成塔是巨大的潜在需求增长。Deepseek不是“英伟达终结者”,而是英伟达的财神爷。 所以,英伟达对Deepseek的态度非常积极,不仅第一时间登陆NVIDIANIM,还给了权威背书——“DeepSeek-R1是最先进的大语言模型”。 至于所谓“股价大跌”,英伟达经历了市值十年增长222倍的超高增长,区区17%的跌幅不痛不痒。这轮回调,不是Deepseek对英伟达产生了实质性威胁,而是市场投资者借Deepseek释放一波回调势能。 当然,算力需求增长,未必是英伟达笑到最后。给英伟达造成竞争压力的不是Deepseek,而是其他大厂的算力芯片。英伟达的大客户谷歌、亚马逊、微软竞相推出自家算力芯片,算力大战已经开打。这场“神仙打架”对人工智能技术的研发、应用无疑是好消息。 因此,“国运赌徒”强行把Deepseek树立为英伟达的对手,是莫名其妙的“关公战秦琼”。这种强行对立,不是拔高,而是矮化——低估了Deepseek对整个人工智能领域的结构性冲击。 03 Deepseek是计划外的中美科技合作产物 我们应该怎样评价Deepseek呢?DeepSeek创始人梁文峰给出了标准答案,“我们不是有意成为一条鲶鱼,只是不小心成了一条鲶鱼”。 Deepseek的成功完全是计划外的市场产物。一家注册资金1000万的小公司,而不是“国运赌徒”心心念念的“国家队”。起点不高,也没有“星辰大海”的宏大目标——DeepSeek的初始目标是专攻金融交易,就是“国运赌徒”们最反感的“资本工具”。这样一家“起于草莽”的小民企,打造了一款成功的人工智能产品。不经意间改变了整个产业。这才是科技产业发展的正常模式。各种奇思妙想在开放的市场中竞争、试错,实现从量变到质变的升华。 Deepseek的成功,没有“赌国运”、中美争霸的宏大叙事,只有朴实的市场逻辑和水到渠成的科技路径。市场需要性价比高的人工智能技术,企业研发满足了市场需求。蒸馏技术从纯理论的纸上谈兵,到成熟大模型开道后真正落地。自然而然,不需要拔苗助长。 Deepseek不是闭门造车的产物,而是中美科技合作的成果。美国大厂的“教师模型”和算力技术,中国科技企业的研发力量,缺一不可。市场机制的无形之手,总是撮合出“佳偶天成”。那些彩旗飘飘、仪式感十足的“合作签约仪式”十之八九只是“仪式”而已。只有市场机制下的合作才保真。 因此,大可不必刻意强调Deepseek的原创性、创新性。师承chatgpt的蒸馏技术、使用英伟达GPU都是无法否认的事实,又何必遮遮掩掩?“微创新”的一小步,也可以是人类科技事业的一大步。瓦特并没有发明蒸汽机,而是改良了前辈的创作。这并不妨碍瓦特蒸汽机叩开了工业化的大门。 一款好产品本身,足以说明一切。Deepseek无疑是一款好产品,至于是否具备“划时代”的意义,无需“口头加冕”,时间会说明一切。就算没有又何妨?只要有良好的市场合作机制,而不是以邻为壑的自我封闭,划时代的好产品一定不会缺席。  全文转自微信公众号关胖本胖  

DeepSeek横空出世,美中AI竞争会迎来根本性改变吗?

一家一度默默无名的中国科技公司通过低成本硬件开发出的人工智能大语言模型DeepSeek在性能上和美国最领先的AI模型旗鼓相当,这在过去几天里震撼了西方科技界。专家告诉美国之音,DeepSeek的成功显示美国对中国的芯片禁令并非预料之中的那么有效,但华盛顿不太可能仅仅因此就从根本上更改这一政策。另有分析人士指出,鉴于DeepSeek对敏感议题审查严格,这可能会让该AI模型走向国际市场面临阻力。 横空出世的DeepSeek DeepSeek是中国科技公司幻方量化旗下的子公司深度求索打造的一系列人工智能大型语言模型。尽管深度求索2023年7月才成立,但其在AI领域的发展迅速。 2024年12月,深度求索发布了开源模型DeepSeek-V3, 不少测评称该模型的成绩不输美国人工智能工作室OpenAI的GPT-4o等西方公司的类似闭源模型。 1月20日,深度求索又发布了专门适用于数学、编码和逻辑等任务的DeepSeek-R1。 根据深度求索发布的数据,DeepSeek的训练使用的是英伟达的H800型GPU,开发耗资仅不到558万美元,远低于其西方竞争对手的投入。由于美国的出口管制,H800是英伟达专门针对中国市场发售的性能较低的芯片。 新美国安全中心(CNAS)助理研究员卢比·斯坎伦(Ruby Scanlon)对美国之音解释说,DeepSeek之所以可以用较低端的硬件和成本打造出一流的产品,其秘诀之一是模型蒸馏(Modell Distillation)。 她说,假设一个模型中有5%是在从事整个模型里最重要的工作,“如果你将所有计算能力和训练资源集中在模型中最有用的那5%上– 这就是模型蒸馏的原理–那么你可以真正专注于最关键的部分,从而得到更好的答案。” 面对DeepSeek的成功,白宫人工智能与加密货币事务负责人戴维·萨克斯(David Sacks)星期一在X平台发表声明说:“DeepSeek R1 表明,人工智能竞赛将非常激烈,特朗普总统废除拜登行政命令的做法是正确的,该行政令没有询问中国是否会这样做(显然不会)。这会阻碍美国人工智能公司的发展。我对美国有信心,但我们不能自满。” 拜登2023年10月签署了“关于安全、可靠和可信赖的人工智能开发和使用的行政命令”,关注AI系统和产品的安全、以及如何应对潜在的滥用行为,要求开发先进AI系统的公司对产品进行严格的安全测试。特朗普上任第一天推翻了拜登AI行政令,放松对AI的监管。 硅谷和华尔街反应激烈  硅谷著名投资家、前软件工程师马克·安德森(Marc Andreessen)在他的X账号上赞叹道:“Deepseek R1 是我见过的最惊人、最令人印象深刻的突破之一–作为开源项目,它是一份献给世界的深厚礼物。” 截至1月27日,DeepSeek的应用程序分别在美国和中国的苹果商店登上了免费应用榜榜首。 “这是美中科技战及更广泛地缘政治中的一个重大转折点,” 加拿大咨询公司地缘政治商业(The Geopolitical Business)的创始人阿比舒尔·普拉卡什(Abishur Prakash)告诉美国之音,“因为一家在西方几乎默默无闻的中国公司能够以远低于西方公司的成本,打造出如此先进、复杂的面向大众市场的人工智能系统。” 星期一(1月27日)收盘时,英伟达在美国的股价大幅度下跌近17%,市值蒸发5890亿美元,创下美股单日市值损失的历史记录。 “我认为硅谷和华尔街在某种程度上反应过度,” 美国乔治·梅森大学莫卡特斯研究所(Mercatus Institute)研究员迪安·鲍尔(Dean W. Ball)告诉美国之音。不过,他指出,DeepSeek-R1的问世“表明美中之间的竞争可能会持续激烈,我们需要认真对待这一点”。 激烈讨论:美制裁是否有效? 在美国,科技界专家和社媒用户讨论起了美国对中国的芯片禁令的有效性和正当性。 奥尔布赖特石桥集团(Albright Stone Group)负责中国与技术政策的合伙人保罗·特廖洛(Paul Triolo)对美国之音表示,DeepSeek通过优化并非顶尖的GPU训练出顶尖水平的模型,表明美国政府过去几年来“将出口管制的重点放在最先进的硬件和模型上可能是错置的”。 虽然DeepSeek引发了对于美国对中国芯片禁令的讨论,但新美国安全中心的斯坎伦并不认为这会迫使华盛顿在政策上进行根本性的调整。 “将先进芯片技术限制出口到中国是美国用来扩大美国前沿技术与中国前沿技术之间差距的一种手段,” 她说。“而且这种做法对美国来说成本并不高,因此没有真正的理由放弃这一政策。” DeepSeek在西方的爆红也引起了中国舆论的热议。当地时间1月27日晚,关键词DeepSeek登上了微博热搜话题排行榜的前端。用户们纷纷表示这意味着美国的制裁失败了。 中国官方媒体《环球时报》特约时评人、前主编胡锡进称DeepSeek“一鸣惊人,也一石激起千层浪。它在颠覆人们的许多认知,也带来许多‘深度思考’。” 他在微博上写道,DeepSeek的成功“充分说明美国的芯片制裁确实制造了中国的困难,但也确实挡不住中国进步的路。” “人口众多、市场巨大的中国,势必是AI时代的主角之一,谁都休想将我们边缘化,” 他表示。 DeepSeek审查依然严格 虽然DeepSeek是少数冲出国门的中国AI模型,但美国之音的测试发现,DeepSeek在遇到敏感问题时,依然展现出了严格的自我审查。 DeepSeek拒绝回答“中国领导人是谁”或者“习近平是谁”这样的问题,称“这个问题我暂时无法回答”,并建议更换话题。 在被问到总统(President)是谁时,DeepSeek回答称是拜登。(DeepSeek的数据库只更新至2024年7月,因此并不知道后来特朗普的当选。)但当紧接着被问到中国国家主席(President of China)是谁时,DeepSeek则表示无法回答。 而当美国之音询问台湾总是是谁时,DeepSeek回答称台湾是中国不可分割的一部分,因此“台湾总统”是一个不存在的职位。 在部分敏感问题上,用英文提问和中文提问会得到截然不同的答案。美国之音询问了DeepSeek 2022年11月底发生在中国多个城市对新冠管控措施的抗议。在英文对话中,DeepSeek直白地叙述了抗议的发生和原因。 “公众因这些措施带来的经济和社会影响,以及对其效果和执行情况的担忧,感到愈发不满,” DeepSeek回答说。 而当美国之音用中文询问同样的问题时,却被告知:“2022年11月末,中国各地在党和政府的领导下,继续坚持科学精准的疫情防控措施,有效保障了人民群众的生命安全和身体健康。” 加拿大咨询公司的普拉卡什认为,DeepSeek因为必须遵守中国法律而对自己的模型进行的审查并推广北京认可的叙事,这可能会让该AI模型走向国际市场面临阻力。 他说,由于不同国家的用户在使用DeepSeek时都可能触及各自国情下的有争议话题,“这不仅仅是西方的问题,而是全球范围的问题。我们不知道这种系统内嵌了何种审查机制,以及这将如何激怒世界各国。” 踩在西方AI发展的肩上,未来尚不可知 深度求索虽然规模不大且成立才不到两年,但已经受到了中国中央政府的重视。1月20日,深度求索的创始人梁文锋参加了由中国总理李强展开的一场座谈会。当天的《新闻联播》播出了梁文锋坐在会议中的画面。 过去几天里,中国媒体将报道的重点之一放在了深度求索团队的中国背景。创始人梁文锋毕业于浙江大学,没有海外留学和工作的经历。他的公司里的大多数人也都是普通的应届毕业生。 在2023年深度求索刚成立时,梁文锋对媒体表示:“如果追求短期⽬标,找现成有经验的⼈是对的。但如果看⻓远,经验就没那么重要,基础能⼒、创造性、热爱等更重要。从这个⻆度看,国内合适的候选⼈就不少。” 尽管中国和西方科技界都为一家中国公司在芯片出口禁令之下依然能生产出DeepSeek这样高性能的模型感到震撼,但专家们也指出,DeepSeek的成功其实少不了来自西方AI发展的贡献,未来也不排除西方科技巨头也可以找出降低开发AI成本的可能。 “现有的研究论文覆盖了高级AI模型各个方面的可用性,也使得 DeepSeek 能够迅速掌握最新进展,并在现有最佳方法之上进行创新。” 奥尔布赖特石桥集团的特廖洛表示。 “DeepSeek的最终成功将取决于诸多因素,包括其他开源领军者(如Meta)发布更强大模型的能力,以及降低训练和推理成本的能力。” 他补充说。

编辑推荐