APUS发布多模态大模型AiLMe 让AI产品更智慧、场景更多元

来源：光明网2023-04-18 21:18

　　4月18日，APUS在京发布自研多模态人工智能大模型AiLMe，其参数已达千亿规模，具备对文本、图像、视频、音频的理解和生成能力。针对具体应用场景，APUS从AiLMe内蒸馏出文本模型“异雀八”、图像模型“异雀三”、视频模型“异雀四”、音频模型“异雀六”四个垂直领域精炼模型，并基于此研发出智能问答大师、简笔成画等人工智能产品。

　　人工智能将助产业提质增效

　　在APUS创始人兼CEO李涛看来，当今人们的生产生活是生长于“信息化”平台之上的，未来，AI（人工智能）将重塑信息产业、农业、制造业、服务业等所有产业，起到大规模提质增效的作用。

　　当下，全球AI产业百舸争流，但能够实现超千亿参数的大模型研发并非易事。大模型尤其是多模态大模型的塑造是结合算力、算法、数据、场景的综合性系统工程，这决定了大模型的锻造绝非一朝一夕之功，而是要有对AI的前瞻布局和长期积淀。“我们在2018年就进行了AI技术布局，并在2018年推出了多款基于AI技术的应用。”李涛说。

APUS发布多模态大模型AiLMe 让AI产品更智慧、场景更多元

　　APUS转型人工智能的契机是什么？“今年一月，我们已在内部所有系统接入人工智能，用来提升工作效率，随后便进行产品的改造升级。大模型AiLMe是我们阶段性的重要成果。”李涛表示，人工智能发展将遵循“四步走”，即现有信息系统提效，现有产品服务改造与重构，新场景、新物种，以及全产业升级，APUS自身的发展印证着这一路径。

　　AiLMe将开放API接口便利调用AI能力

　　发布会现场发布了多模态大模型技术白皮书《AiLMe技术白皮书》。白皮书显示，AiLMe在文本、图像、视频、音频的“理解”部分采用Transformer架构；在文本、图像、视频、音频的“生成”部分，AiLMe使用扩散模型（Diffusion Model），并继承了开源社区的生态。

　　AiLMe模型训练，分为预训练（Pre-trained）阶段和微调（Fine-tuning）阶段。在数据方面，目前大模型的训练数据一般来自于互联网公开的语料库、网页以及行业公开数据，除此之外，在APUS绘制的训练数据图中，其在为全球用户提供产品和服务时积淀的高质量专有数据也占了很大比重。

　　李涛认为，决定大模型效果的因素重要性排序为训练数据质量、训练数据规模、参数规模。因此，AI技术研究已经告别了单纯增加大模型参数规模的阶段，应在提高训练数据质量和加大训练数据规模上下功夫。AiLMe采用高质量的海量训练数据来训练模型，实现了较好的效果。

　　值得一提的是，AiLMe采用了插件式架构，后续能够通过迭代开发补充多种插件扩充自身能力，并自主学习调用插件，无需用户干预即可实现大模型自我进化。

　　据了解，AiLMe将会向客户开放API接口及服务，用户可根据实际应用需求，调用AiLMe的各项AI技术能力。

　　AiLMe能力释放形成开发者创新平台

　　聊天对话、创作文章、作诗谱曲、慰藉心绪……基于AiLMe的智能应用已焕发生机。

　　从AiLMe大模型蒸馏出的异雀（八、三、四、六）系列精细模型，分别对应着文、图、视、音四个垂直领域。基于四款精炼模型，APUS已研发多款人工智能产品。

　　其中，包括AI图片、视频、娱乐创作工具，帮助用户高质量、高效率、低门槛地创作；能够在对话之间帮助用户快速完成撰写报告、论文、程序、简历及解答生活疑问的智能问答应用；助眠类产品除了能为用户提供白噪音音频等帮助用户快速入睡，还能依据用户喜好勾勒理想的数字人朗读睡眠故事；此外，还有在手机屏幕上画出草图即可自动补全图案，形成精美绘画等应用。

　　李涛表示，AiLMe的能力释放让AI产品更加智慧、场景更加多元，既丰富了APUS的产品矩阵，也为开发者打造了创新平台。（孔繁鑫）

[ 责编：李政葳 ]

阅读剩余全文（）