

若以DeepSeek的“破圈”为分界线,之前大模型圈的“风暴眼”是“参数量”和“模型架构”,之后显然是“开源”和“免费”了。
DeepSeek火爆出圈之后的一个月里,百度、OpenAI、谷歌等主流大模型厂商纷纷跟进:旗下闭源高端AI模型将转向开源,而主流AI产品逐步向用户免费开放。
开源,不仅是大模型竞技步入白热化新阶段的信号,更是AI技术“飞入寻常百姓家”的关键节点。在蛇年首场科技盛会——2025全球开发者先锋大会(GDC)上,“开源”二字当仁不让成为“流量担当”。正如香港科技大学校董会主席、美国国家工程院外籍院士沈向洋所说:“通过上海的努力,相信开源这件事情会越做越好。中国的团队、上海的团队一定会引领开源潮流!”

参观者现场体验各类AI设备。
开闭之争终究是利益之争?
什么是开源?
在计算机领域,或许可以简单理解为公开自己的源代码、设计思路以及底层架构等。开源的思想其实可以追溯到计算机发展早期——彼时,程序员们经常在一个小圈子里互相分享代码,共同改进软件。
回归AI圈,开源和闭源之争是道颇为纠结的“选择题”。大名鼎鼎的、研发了ChatGPT的OpenAI,创始人山姆·奥特曼曾是个典型的开源主义者——从企业的名字也不难看出。然而,开源几个不成功的大模型后,到了GPT3,OpenAI就不Open(开放)了。奥特曼“美其名曰”:“开源可能会带来安全风险”“闭源可以确保技术不被轻易复制”。此后的故事大家都知晓了,OpenAI慢慢建起了“token经济”的商业模式。
后来,首先开源的,是meta的大模型Llama。虽是开源“先行者”,但充其量是“薛定谔的开源”——只公开训练出的模型,但不公开训练代码和训练数据,而且明文要求:只能用于科研,不能用于产品。相较之下,DeepSeek不仅开源了多个类型的模型,还把相关训练数据、代码和MoE架构都开源了,甚至提供了基本的开发工具包。
不可忽视的是,大模型能够走向开源和免费,背后离不开技术突破所带来的训练和推理成本下降。近期OpenAI计划逐步开放深度检索相关功能,原因之一就是山姆·奥特曼发现,AI使用成本正大幅下降,每年比前一年便宜约9成!
“沪研”大模型勇于开源
就在大会召开前夕,本土AI初创公司阶跃星辰开源了两款Step系列多模态大模型——Step-Video-T2V视频生成模型和Step-Audio语音模型。前者参数量达到300亿,可以直接生成 204帧、540P分辨率的视频;而后者能够根据不同的场景需求生成情绪、方言、语种、歌声和个性化风格的表达。
“此次开源大模型发布后,第一时间就得到了云厂商、社区、芯片厂商的跟进适配。这些动作都是自发形成的,说明开源社区的蓬勃生机和力量,也能帮助厂商更好地去做模型迭代。”阶跃星辰副总裁李璟透露。
同样发布了开源大模型的还有MiniMax——今年1月发布并开源了新一代MiniMax-01系列模型,其算法架构的独特创新大幅减少了大模型的算力成本。MiniMax副总裁刘华认为,优秀大模型的持续开源能推动行业发展,让社会大众体验到高水平大模型的能力,吸引更多开发者一起参与大模型的研发。
开源的不只有大模型,还有面向程序开发者的工具。商汤科技在本次大会上发布了一站式开源Agent应用开发框架——LazyLLM,这一框架弥补了国外类似工具的不足,同时确保软件自主可控。

DeepSeek成为不少报告探讨的话题
“开闭”并非对立商业模式
“DeepSeek让大家看到开源社区的胜利。把了不起的模型开源后,让更多人得到机会,在这个模型上做更多了不起的事情。”在2025年全球开发者先锋大会上,美国国家工程院外籍院士沈向洋如是说。
他提到,纵观前两年,不同公司开发的模型在企业实际使用中的比例,市场份额从高到低的大模型,开、闭源策略各不相同,与其市场份额没有明显关联,“开源和闭源不是对立的商业模式”。
开源亦是全球合作的重要领域。沈向洋指出,中国是开源研究的受益者,现在是国际开源社区的贡献者。
商汤科技联合创始人林达华同样认为,开源不仅改变了全球AI和大模型的产业格局,还加速了技术的传播和普及;其次,开源模型的追赶速度非常快,与顶尖闭源模型的差距正在迅速缩小。
“在这种背景下,真正的竞争优势体现在两个方面:一是与基础设施的深度整合,通过软硬件的垂直整合实现成本优势;二是在特定行业的纵深发展,通过工程优化、业务理解和模型调优,为客户提供深度的价值。”林达华分析。
新民晚报记者也从全球开发者先锋大会上获悉,上海将发挥超大城市的综合优势,通过进一步完善开源开放生态系统,推动引领开源潮流。
原标题:开还是闭?上海这场盛会给出答案:开出自信,开出未来
栏目编辑:张炯强 图片来源:新民晚报 陈梦泽
来源:作者:新民晚报 郜阳

海量资讯、精准解读,尽在新浪财经APP