发布日期:2024-12-21 11:51 点击次数:135
今天分享的是:2024快意大模型及短视频场景应用
报告共计:56页
《快手快意大模型及短视频场景应用》主要介绍了快手的快意大模型相关情况,包括项目背景、模型介绍、关键技术、应用场景和未来展望等内容。
模型介绍
2022年底ChatGPT开启AI技术突破新篇章,快手于2023年初启动快意大模型研发专项。其具有广泛应用场景、海量多模态数据和领先算力基建等优势。已发布的“快意”13B/66B/175B模型在权威榜单中表现出色,多模态理解大模型kwaii-vlm-8B-dev版本业务可用性佳。
关键技术
1. 预训练阶段
- Temporal Scaling Law:验证大模型训练过程时序可预测性,提供超参搜索有效路径,降低预测误差,提升模型效果,证明无需对不同位置token加权。
- MiLe Loss:解决预训练Token学习难易bias问题,基于信息熵加权损失优化方案,提升多种参数规模预训练模型效果。
- Scaffold - BPE:改进词表学习方法,消除“伪高频”token,提升词表压缩率和大模型学习效果,可迁移至其他任务。
- MoE路由错误自适应检测与Loss优化:解决MoE路由错误导致的问题,提升路由模块预测准确性和整体效果。
2. 后训练阶段
- SFT训练数据采样策略:迭代式数据扩充策略实现数量 - 覆盖面权衡。
- SFT答案质量:通过多种策略提高训练数据质量,包括答案检错、基于智能体的答案校验(HaluAgent框架提升错误检测能力)、多答案校验(降低任务难度,检出多种错误)和Rejection sampling(获取更优质答案)。
- SFT负反馈机制:引入负反馈机制提升模型区分优劣回复能力。
- 迭代式RLHF + RLAIF:采用迭代式更新方式提升策略探索和学习效率,在安全性等方面提升明显。
- 细粒度反馈训练 - RLMEC:基于生成式模型提供词汇级反馈信号,设计强化学习策略,提升模型训练稳定性和效果。
3. 推理阶段:词汇单元并行解码策略大幅提升解码速度,扩大模型服务吞吐量。
应用场景
1. AI小快:基于快意大模型的情感陪伴机器人,面临多模态内容理解、有趣有温度、长多轮互动、整合资源和工具等挑战,其技能随用户需求迭代,在多方面满足用户需求。
2. 对话式搜索:包括知识类单轮问答和多轮对话式搜索。
3. 商业化短视频文案创作:生成符合快手风格的灵感文案。
4. 营销智能Bot:线上开通大模型营销BOT行业开口 - 留资率高于人工。
5. B&C端理解:打造可解释推荐系统,提升商业化推荐效果。
6. 数字人智能体:数字人与快意大模型结合,实现不同程度AI和人类协作。
7. 文生图大模型(可图)和文生视频大模型(可灵):具备多种能力,如提示词润色、开放域文字绘制、交互式图像生成等,且效果良好。
未来展望
以快意大模型为起点,提升能力,融合AIGC能力打造通用模型,深耕应用并与现有业务结合,建立智能体生态,赋能更多场景和行业。
以下为报告节选内容
报告共计: 56页
中小未来圈,你需要的资料,我这里都有!
智能体模型快手模态快意发布于:广东省声明:该文观点仅代表作者本人,搜狐号系信息发布平台,搜狐仅提供信息存储空间服务。上一篇:没有了
下一篇:没有了
Powered by 如何看亚盘赢盘走盘输盘 @2013-2022 RSS地图 HTML地图