“百模大战”前夜 这家大模型“超市”公布战绩

IT时报   2023-07-11 01:49:26

商汤大模型全面升级,公布最新落地成果

作者/ IT时 报记者 孙妍


(资料图)

编辑/ 孙妍

“百模大战”即将到来,此次世界人工智能大会(WAIC 2023),30多个大模型同台竞技,全国近一半的大模型几乎都来了,但多数是行业大模型,只有少数几家大厂有实力撑起通用大模型,其中,商汤便是最早入局通用大模型的大厂之一。

商汤“日日新SenseNova”大模型于今年4月发布,短短3个月后,7月7日,在WAIC 2023上,商汤“日日新”再度宣布全面升级,并公布一系列的大模型产品更新和落地成果。

“爆发式增长 ” 、“迅速涌现 ” ,商汤科技董事长兼CEO徐立用这两个词来形容大模型的产业需求和落地场景发展,半年时间,大模型给各行各业带来了冲击,在徐立看来,从根本上降低大模型的下游应用成本和门槛,才能让千行百业在大模型土壤上百花齐放。

大模型“超市”全面升级

100多天“重建”一座城

当一个五音不全的人,拥有了一位歌神级别的数字人分身是什么样的感受?惊艳!商汤此次一揽子升级中,最为惊艳的是如影SenseAvatar2.0数字人,它生成的徐立数字人分身连语气都能还原到五六分像,语音和口型流畅度提升30%以上,数字人的能力也从新闻播报、产品介绍升级到歌唱,视频画质也达到了4K高清。

38小时构建100平方公里的城市空间,按这个速度计算,“重建”上海这座6340平方公里的城市,也只需要100多天,当然,这只是一个相对理想化的估算。 这是商汤琼宇SenseSpace 2.0的速度,空间重建效率提升20%,渲染性能提升50%。再借助商汤格物SenseThings来对小物件进行3D还原,那么在云端重建一座博物馆也不是难事。而且,格物2.0对小物体的纹理及材质还原达到毫米级精细度,并突破对高反光和镜面物体的采集难题。

商量SenseChat是商汤的自然语言处理大模型,参数达千亿级别,此次更新的商量 2.0版本突破了大语言模型输入长度的限制,并推出不同参数量级的模型版本,可以适配到云端,还可以适配到移动端,降低了部署成本。

秒画SenseMirage是商汤自研的文生图大模型,此次发布的3.0版本从今年4月的10亿参数提升至70亿量级,发布时,《IT时报》记者曾试用过秒画,虽然它已能非常逼真地还原人物,但其细节的处理还不是特别细腻,如今已可以实现专业摄影级别的图片呈现。

至此,商汤大模型的五大产品全面升级,同步进行的是五大产品的落地应用。

大模型“工厂”落地

向行业“输送”实际生产力

大模型是一座巨大的耗能“工厂”,需要“烧”掉巨大的算力,对行业来说,能真正产出解决实际问题的行业大模型,才能真的帮企业提升生产力,毕竟不是所有企业都需要通用大模型。

自“日日新”发布3个月以来,商汤大模型“工厂”已经为行业“输送”了实际生产力——行业大模型。

商汤数字人从大模型“工厂”被送往银行、保险、券商等,担任智能客服、智慧营销等工作,接入大语言模型能力,还能提供投研分析、研报撰写等新功能,实现降本增效。 挂载金融知识库后,就能输出一个定制化的“数字人”,100%基于企业自家的产品说明进行内容问答输出,并实现信息及时更新。在短视频平台、直播平台,你见到的主播可不一定全是真人了。商汤如影2.0生成的数字人正在进入多个头部企业的直播间、短视频频道。

拦在看病前面的第一环是得了什么病,该挂什么科,人们时常会遇到因为挂错科而白跑一趟医院的窘境,既浪费了患者的时间,也浪费了医疗资源。商汤打造了中文医疗语言大模型“大医”,它基于海量医学知识和临床数据,主要提供导诊、问诊、健康咨询、辅助决策等多场景多轮会话能力,解决的主要是就医的第一环:线上问诊和导诊。未来,“大医”即将支持医学图像、文本、结构化数据等多模态综合分析,并可不断提升医疗语言理解和推理能力,届时可以真正提升医院诊疗效率及患者服务。

实现轻量化后,商量2.0和秒画3.0已经可以在移动终端部署和运行。以刘慈欣获奖小说《三体》为故事蓝本,商汤打造了《三体·引力之外》沉浸式科幻体验空间,通过大模型的能力突破想象力的边界,创作并展现极具未来感的科幻航程。

如果说去年自动驾驶还是当红辣子鸡,那么今年的风头可被AIGC抢了,自动驾驶+AIGC这种重磅组合,会给我们的出行带来哪些改变?

AIGC最先改变的是智能座舱,基于大模型在视觉、听觉等多模态融合上的优势,通过标签化数据记录用户习惯和偏好,就能让车子记住车主的信息和喜好。大模型在环境理解、逻辑思维和内容生成等方面的能力也很强,它改造的“车舱大脑”更懂车主和乘客,可支持形象、语音快速定制的数字人进行拟人化交互,坐车不再是一件费时又无聊的事了。

更加革命性的变化发生在车舱外,也就是大模型对自动驾驶和车路协同能力的提升。商汤绝影部署端云协同,统一流量入口,支持私有化部署及千万量级的应用需求。在近期的CVPR 2023中,商汤及联合实验室首个提出感知决策一体化的自动驾驶通用大模型UniAD,开创了以全局任务为目标的自动驾驶大模型架构,并斩获最佳论文奖,为自动驾驶技术与产业的发展提出了新的方向。基于此,商汤打造车路云协同的交通体系,凭借多模态多任务通用大模型开发路侧视觉感知大模型,结合琼宇2.0及格物2.0构建智能交通孪生与仿真,并利用商量2.0的感知推理和人机交互能力推动车路云共同向大模型对话式交互的演进。

同一时间,各行各业都在经历着大模型的范式革新。电网巡检是一项费时又危险的工作,现在商汤大模型就能完成故障识别和复杂缺陷判断等。济南马山镇区域开发、合肥中国视界园区、上海瑞金医院,在琼宇2.0的空间重建下,它们已经拥有实景空间的数字孪生。格物2.0则先在珠宝行业发光,复刻珠宝首饰,放大展现其工艺特点。

AGI时代或许还在到来的路上,但我们不能静待智能涌现,大模型带领着千行百业的无限趋近通用智能,给AI产业落地带来范式革命。

排版/ 季嘉颖

图片/ 商汤

来源/《IT时报》公众号vittimes

E N D

请加「 星标 」不错过我们】】】