(资料图片)
8月15日,讯飞星火认知大模型V2.0升级发布会上,科大讯飞董事长刘庆峰对讯飞星火的多模态能力进行重磅发布,讯飞星火在图像描述、图像问答、识图创作、文图生成、虚拟人合成等方面全新升级。他表示,“讯飞星火的多模态能力在业界可测的大模型中明显领先。”
刘聪现场继续真机实测,让星火大模型现场“读图”,生成人物、风景等各类照片,生成班级手抄报,还能根据古诗词“作画”,“智商”在线。星火还能进行虚拟人短视频的生成,“创作一篇立秋抒情散文,并用一个短发民国风的女生形象生成视频”,他话音刚落,一个身穿民国风格的女生站在不断切换的秋天美景前娓娓道来。
发布会上多模态能力升级后的产品——讯飞智作2.0也正式发布,无论是视频的后期处理还是创意视频生产,搭载了讯飞星火核心能力的讯飞智作2.0都能轻松搞定,不仅进一步降低了短视频制作的门槛,满足更多元的视频制作需求,也将为AIGC带来前所未有的产业机会。
对于升级多模态能力,刘庆峰重点介绍了两点。“多模态能力是赋能行业的刚需,也是实现通用人工智能的必经之路。”他强调,当前多模态能力已广泛应用在教育、医疗、工业、汽车、机器人等领域,它可以从真实世界获得越来越多的数据,在产品终端有学习、训练和提升,包括更柔性更自主的工业机器人、更好的自动驾驶、走入家庭的陪伴机器人等。(曾震宇)
标签: