本报讯 近日,商汤科技方面人士向《证券日报》记者透露,为了提高算力,商汤科技全新的AI算力中心(AIDC)将于2021年年底在上海临港新片区投入使用。
“商汤科技全新的AI算力中心(AIDC),计算峰值速度将达到3740Petaflops(1petaflop等于每秒1千万亿次浮点运算)——作为参照,OpenAI的千亿参数模型GPT-3完整训练一次需要3.14E23次浮点运算,而商汤科技临港AIDC的算力仅在一天内即可完成。毫无疑问,商汤科技的这个全新AIDC,目标就是为更大规模参数模型的训练而来。但在商汤AI大装置中,AIDC不到1/3又1/3。”上述商汤科技方面人士如是说。
据介绍,商汤科技AI大装置的全貌包含了三层:“n算力层(AI芯片及处理卡+AIDC+AI传感器),n平台层(模型生产+训练平台+数据平台)n算法层(算法工具箱+开源框架)三位一体,以基础设施方式输出模型,把AI能力输出到企业服务、城市管理和个人生活等三大落地方向中。”
可以说,SenseCore商汤AI大装置是商汤科技多年来研发出的最新技术成果体现,商汤科技CEO徐立认为,这是商汤科技长线核心竞争力的标志、持续经营和更大规模跃迁的护城河,以及推动AI时代生产要素降低的关键一步。
从AlexNet以来看过去十年AI模型的发展,每年最新的算法网络、最好的技术,对于算力的需求,几乎是呈数量级的增长,每年都大概会有十倍的算力需求增长。徐立认为造成这种趋势的原因其实很简单,表达越来越丰富,模型越来越通用,参数也就越来越多,算力要求也就越高。
徐立向记者表示:“SenseCore商汤AI大装置是一整套完整的AI基础设施,其本质是让AI落地摆脱人力密集的状态。”
徐立认为,AI大装置可以打造大参数模型。首先可以解决AI落地中的长尾问题。比如在城市的日常治理中,把“城管”的工作场景,实现全AI流程覆盖。无论是暴露垃圾的问题,共享单车乱堆乱放的问题,还是新冠肺炎疫情、火灾、汛情、人群拥挤踩踏、危化品泄露等等公共场景中的各类问题,不管高频还是低频,都能实现一站式解决。徐立透露,公司从2018年开始大胆设想时,(AI大装置)这种发展路线甚至是反共识的,但商汤科技内部还是顶住压力,做重做深,历时3年,越来越多业内玩家拿出的大参数模型,不同维度验证了这确实是一条通向未来的路。(记者 矫月)
(编辑 张明富)