找回密码
 注册

QQ登录

只需一步,快速开始

搜索
查看: 66|回复: 0

[科技新闻] 中国开源力量崛起

[复制链接]
  • 打卡等级:已臻大成
  • 打卡总天数:383
发表于 2025-3-31 13:50 | 显示全部楼层 |阅读模式

马上注册,查看更多内容,享用更多功能,让你轻松玩转社区。

您需要 登录 才可以下载或查看,没有账号?注册

×
1.webp

最近一段时间,以DeepSeek、阿里、群核科技等为代表的国内科技企业密集发布高性能开源大模型,引发广泛关注。美国AI社区多位业内人士预测,接下来几个月,中国将会出现一波开源人工智能(AI)模型的浪潮。美国CNBC电视台网站发布标题为《中国对开源的拥抱颠覆了围绕人工智能的传统看法》的文章,称“中国正在积极拥抱开源AI模型,这一趋势推动国内人工智能技术的普及与创新”。可以看到,中国开源力量的崛起已在全球AI竞争中激起层层涟漪。开闭源之争出现新转折点一直以来,开闭源之争从未停止过,却也保持着微妙的平衡。开源和闭源实际上是两种开发模式。开源模型指由开源社区或组织开发、维护和共享的大型软件模型,模型源代码是公开的,所有人都可以查看、修改和分发。闭源大模型的源代码、数据集和技术细节不对外公开,通常作为商业产品进行销售或通过API服务提供。DeepSeek的出现刷新了国际上对于中国开源大模型技术的认知,同时也标志着开源模型的一次巨大成功。就连OpenAI首席执行官Sam Altman也不得不承认:“我们在这里站在了历史的错误一边,需要找出一个不同的开源策略。”“DeepSeek是一款完完全全的开源模型,将各个环节包括数据、代码、权重、推理链的运行思路、工程构建方法都开放出来,让更多人愿意参与进去。”赛迪研究院信软所软件产业研究室副主任黄文鸿解释说道。就好比建造一所房子,真正的开源不仅公开图纸、材料、房屋结构,还会清晰地告诉你每一步应该建什么,有了这些信息就可以1:1还原房子。DeepSeek开放程度之高前所未有,这也是其一经发布就产生巨大影响的原因之一。
2.webp

与此同时,DeepSeek从软硬件的适配到应用推广甚至产品宣传,都是由全球厂商和开发者共同完成的,这极大降低了其生态建设成本。国际市场上,微软、英伟达、亚马逊、英特尔、AMD等全球科技巨头皆已上线DeepSeek开源模型推理服务;国内互联网科技厂如阿里、腾讯、百度以及运营商、车企等也都相继宣布接入DeepSeek。在分享DeepSeek带来的流量红利的同时,实际上这些厂商也将反哺DeepSeek,助其进一步拓展模型生态,快速提升用户数量和市占率。国际评级机构Counterpoint Research人工智能首席分析师孙薇评论称,OpenAI和DeepSeek分别代表了AI领域的两极:开源阵营通过互相借鉴持续创新,闭源企业则面临维护高成本尖端模型的压力。DeepSeek的成功证明开源战略能够带来更快的创新速度和更广泛的应用。零一万物创始人李开复指出,开源模式最终将占据主导地位,Deepseek 采取免费、开源的模式,对 OpenAI 构成了根本性的挑战。Meta首席AI科学家杨立昆更是直言:R1的出现是“开源模型的胜利”。不只有DeepSeek开源实际上,不止是DeepSeek,国内还有不少企业都在开源模型领域取得了不俗的成绩。比如阿里在2018年底便启动了大模型研发,在超大模型、语言及多模态能力、低碳训练、平台化服务、落地应用等多个方面,为中文大模型的发展做了前沿性、引领性的工作。作为全球较早研发并开放类GPT语言模型的科技公司之一,阿里一直坚持走开源之路。记者了解到,截至目前,阿里已开源200多款模型,包括文本生成模型、视觉理解/生成模型、语音理解/生成模型、文生图及视频模型等多模态,覆盖从0.5B到110B参数的各类尺寸。通义千问全球下载量已突破2亿,稳居全球最大AI开源社区Hugging Face趋势榜榜首。旗下魔搭社区模型总数已超4万个,成为国内最大的AI开源社区。
3.webp


阿里最新发布的开源大模型QwQ-32B

值得关注的是,3月27日,阿里开源首个全模态大模型Qwen2.5-Omni7B,已经可以在手机上部署运行。在权威的多模态融合任务OmniBench等测评中,Qwen2.5-Omni刷新业界纪录,全维度远超Google的Gemini-1.5-Pro等同类模型。3月28日消息,被誉为杭州“六小龙”之一的群核科技发布的空间理解开源模型SpatialLM登上全球最大AI开源社区Hugging Face趋势榜第二位。据悉,SpatialLM是群核科技自主研发的一款空间理解模型,该模型仅通过一段视频即可生成物理正确的3D场景布局。不同于传统大语言模型,SpatialLM突破了对物理世界几何与空间关系的理解局限,将在机器类人的空间认知和解析能力上发挥重大作用。该模型的开源,将为像具身智能领域的企业或机构科研团队提供一个空间认知理解的基础训练框架。尤其是对那些不具备模型开发能力的具身智能企业,可以基于SpatialLM模型进行微调,降低具身智能训练门槛。目前,SpatialLM已在HuggingFace、GitHub、魔搭社区等平台面向全球开发者开源。在开源后一周,SpatialLM在海外社交平台LinkedIn、Twitter受到行业人士追捧。值得一提的是,目前Hugging Face趋势榜前三名皆为中国科技企业推出的开源大模型(通义千问Qwen2.5-Omni、DeepSeek、群核科技SpatialLM)。据业内人士统计,在最新的 Hugging Face 热门模型榜单中,中国模型的含量已经超过了50%。越来越多国际开发者选择中国基础模型作为微调起点,以DeepSeek和Qwen系列模型为基点的衍生模型越来越多。科技大V、天使投资人、技术创始人Balaji预测,接下来几个月里,中国还会有一波开源AI模型的浪潮,涵盖从计算机视觉到机器人技术,再到图像生成的各个领域。“中国如今成了开源AI的先锋,这实在令人惊讶。”中国正重塑全球AI发展格局工信部消息显示,中国已成为全球开源参与者数量排名第二、增长速度最快的国家。“中国愿意与世界分享AI资源,促进AI的普惠化发展,这意味着中国正在重塑全球AI的发展格局。”克罗地亚AI研究专家德拉戈·奇利加表示。
4.webp

群核科技SpatialLM模型开源页面

腾讯研究院发布的报告指出,2022年以来,开源模型呈赶超之势。开源与闭源模型在性能和应用领域的差距迅速缩小,甚至在某些方面实现超越。这一方面是因为开源的“集市协作模式”正在AI领域重演,开源大模型将底层能力公开,公众可免费下载权重自行部署,进行“二次创作”,在不同行业和场景中微调形成专用版本,灵活适配性大大增强。开发者共同分享工程经验,参与技术路线试错,加速了AI发展进化。另一方面也是因为开源模型提升了AI系统的透明度和安全性,由于模型架构、权重开放,外部研究者可以深入“解剖”模型,及时发现偏见或漏洞并共同改进。相反,封闭模型如同“黑箱”,外界难以对其进行监督。此外,开源打破了AI领域的既有封闭格局。此前最先进的AI模型往往为少数巨头掌握,产业下游通过API付费使用,对其缺乏议价或约束能力。开源减少了单一供应商的锁定效应,提升了技术自主权。在大模型领域,开源社区用更低算力复现了商业闭源模型的大部分能力,也迫使大型科技公司不得不重新评估策略,保障了行业的良性竞争。黄文鸿认为,信息技术领域具有强者恒强的发展规律,我国在开源模型上是有先发优势的,必须进一步筑牢技术“护城河”。但目前各行各业真正懂开源模型的人才并不多,基于开源大模型的下游企业,以及做工程优化、模型调优的研发人员相对较少,高校应该培养更多相关人才,共同促成“创新—共享—再创新”,助力产业生态更加完备。阿里云高级总监朱迅垚建议,从国家到地方再到企业,应以更加积极的态度拥抱开源,同时在智能算力、高质量数据集、上云用云等方面加快创新步伐,紧跟世界先进水平。这样的举措不仅有助于降低技术门槛,也将为用户提供更方便的工具,帮助他们更好地进行技术实现和创新。“大模型的格局将从比拼底层模型的技术指标,走向拥抱开源的底层模型,进行商业赋能。”李开复表示,中国有超大、超常、超多的场景,所以2025年一定会有很多厂商开始拥抱开源底层模型,加速行业赋能,预计在全球会有非常优异的表现。
作者宋婧编辑丨赵晨美编丨马利亚监制丨连晓东
您需要登录后才可以回帖 登录 | 注册

本版积分规则

文字版|手机版|小黑屋|RSS|举报不良信息|精睿论坛 ( 鄂ICP备07005250号-1 )

GMT+8, 2025-4-2 07:18 , Processed in 0.135108 second(s), 9 queries , Redis On.

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表