点击右上角微信好友
朋友圈
请使用浏览器分享功能进行分享
近日,2024世界智能产业博览会在天津举行。开幕式主论坛上,360集团创始人周鸿祎发表演讲表示,政府和企业拥抱大模型,应该走越做越专的道路,找到“明星场景”后训练专业大模型。目前,360已通过在企业级场景的持续探索,总结出八类大模型基础设施,通过简单定制和训练就能把大模型能力“拉下神坛”。周鸿祎称,未来360将进一步在天津打造“模型即服务”新模式,推动“三个一百”计划,助力大模型在天津的产业化落地。
作为新质生产力的关键支撑技术,以大模型为代表的人工智能技术正在对各行各业进行重塑。周鸿祎表示,对于政府和企业来说,拥抱大模型应该走越做越专的道路,未来政府企业内部会是多个专业大模型组合起来工作。同时,过去限制大模型走进政府和企业的参数、算力、成本、响应速度、训练难度、人才要求及数据安全等问题也都会迎刃而解,“就像360AI浏览器是由5个专业小模型支撑,测试速度要比百亿、千亿参数大模型快100倍左右。”
周鸿祎表示,大模型只有结合场景才能真正地发挥作用,政府和企业使用大模型的关键问题是找到“明星场景”,在对上、对下、对内、对外的四个方向上,选择可以降低十倍人力、降低十倍成本、提高十倍效率、提升十倍体验的痛点、刚需场景训练专业大模型。
“百亿以内的大模型加上垂直场景、企业专有知识及应用开发框架等,在专业能力上也可以优于千亿参数大模型。”周鸿祎以360安全大模型为例介绍,该模型由六个专家模型组成,每个模型只做一件事,最终在安全能力上实现了对GPT-4的全面超越。
针对训练专业大模型大量重复建设、耗时耗力的行业痛点,360通过100多个POC总结了企业级场景下的八类大模型基础设施,每个独立的基础设施都有数个大模型在其中工作,八大基础设施可以自由排列组合,通过简单的定制和训练来满足不同业务场景的具体需求。目前,360已在天津海油工程等行业和场景帮助政企客户部署大模型基础设施,并获得多个生产效率指标的大幅提升。
周鸿祎介绍,未来,希望将360在专业化大模型上的技术能力服务于天津的政府部门和企业,建立“城市大模型服务中心”,打造“模型即服务”的新模式,带动天津大模型产业生态发展。同时,积极推动“三个一百”计划,与100家企业合作,寻找100个大模型应用场景,打造100个专业化大模型,推动大模型在天津的产业化落地。(李文)