证券日报APP

扫一扫
下载客户端

您所在的位置: 网站九游会·J9 > 评论频道 > 产经评论 > 正文

大模型“百轲争流” 唯有“奋楫者”才能扬帆远航

2023-07-10 00:40  来源:证券日报 

    贾丽

    近日,在多场重要的科技盛会上,大模型均占C位。数十个大模型悉数登场,相关应用在各行业逐步垂直渗透,数字人、智能舱等“百花齐放”。国内多模态等各类大模型技术路线并行突破,产业链芯片、算力等关键技术市场蓬勃发展,更多企业联合探路。

    随着在国内热度持续上涨,大模型“百轲争流”,呈现蓬勃发展态势。科技部新一代人工智能发展研究中心发布报告显示,上半年我国10亿参数规模以上的大模型已发布79个。根据上海市人工智能学会数据,截至目前,我国大模型已近百个,可谓真正进入了“百模大战”。下半年国内还将进入大模型发布的密集期。

    热闹之下,国内大模型也必须直面灵魂拷问。

    首先,能否烧得起?大模型需要庞大的算力支持,同时也带来巨大的成本压力。有专家直言,ChatGPT大模型每训练一次,相当于报废了3000辆特斯拉汽车。众多企业陷入一边疯狂烧钱短期内难以覆盖预训练成本,一边模型商业化难以落地的困境之中。

    其次,可否规模商用?当下大模型仍有局限性,存在效率低、涉嫌侵犯数据隐私和知识产权、高端人才匮乏等问题。业内认为,大模型效率需得到10倍以上的提高,大规模商用才有可能。

    再次,如何避免过度?在庞大的模型数量和种类之下,存在一些过度现象。部分企业追求炫技忽视应用可行性,部分追求模型“规模大”而堆叠参数,更有部分企业或机构追求“参数高”过度训练,导致大模型过拟合和泛化能力不足。

    面对挑战,国内大模型“航船”该如何顺利“渡江”?

    其一,注重前端技术,勇攀“芯”高峰,深耕算力。企业在关键技术道路上勤耕不辍,探索新的预训练架构、方法,进一步提升大模型的性能和效率,推动国内大模型与国际接轨,让大模型真正成为企业参与全球AI大模型竞争的重磅“船票”。鼓励创新创业,让开发者设施可以站在巨头肩膀上创造未来。

    其二,推动产业链联动,扩大开放开源生态。大模型热带来了算力、国产芯“创新架构+开源生态”的新机会。行业通过共建开放生态,鼓励产业链共享和合作,从而减少重复建模。企业也可通过收购、孵化等方式,扩大自身在行业影响力和市场份额。

    其三,加强模型评估和验证。机构及企业应建立评估标准和机制,规范模型开发和应用过程,避免过度夸大模型的能力,防止炒作,注重大模型可解释性和可理解性,使其在实际应用中更加可信、可靠。

    大模型“百轲争流”后是大浪淘沙,只有真正的“奋楫者”,才可以勇立潮头扬帆远航。

九游会·J9 - 中国官方网站 | 真人游戏第一品牌
  • 24小时排行 一周排行

版权所有证券日报网

互联网新闻信息服务许可证 10120180014增值电信业务经营许可证B2-20181903

京公网安备 11010202007567号京ICP备17054264号

证券日报网所载文章、数据仅供参考,使用前务请仔细阅读法律申明,风险自负。

证券日报社电话:010-83251700网站电话:010-83251800

网站传真:010-83251801电子邮件:xmtzx@zqrb.net

证券日报APP

扫一扫,即可下载

官方微信

扫一扫,加关注

官方微博

扫一扫,加关注