1. 什么是阶跃AI?
阶跃AI是由上海阶跃星辰智能科技有限公司开发的多模态AI助手(前身为“跃问”),定位为个人效率与创意伙伴。它集成了智能问答、多模态创作、文档处理等能力,技术核心是自研的Step系列大模型,覆盖文本、语音、图像、视频等模态。
此外,阶跃AI坚持开源战略,推动AI普惠化。截至2025年8月,产品已迭代至v5.2.0版本,成为国内多模态AI领域的重要代表。
2. 核心功能
阶跃AI的功能体系以多模态交互与生成为核心,主要包括:
| 功能类别 | 具体能力 | 技术亮点 |
|---|
| 智能问答 | 支持文字、图片、语音、文档、拍照等输入,回答生活问题、专业分析(如金融数据)。 | 金融专用模型“财跃星辰”在多模态评测中排名第一。 |
| 多模态创作 | 文案润色、代码生成、风格化图像生成、最长10秒的视频创作(如赛博敦煌主题)。 | Step-Video-T2V模型开源,支持204帧高清视频生成。 |
| 文档与数据处理 | 自动生成摘要、提取关键信息,表格数据分析与可视化建议。 | 强化学习优化信息抽取精度。 |
| 深度研究支持 | “阶跃深研”工具可在10分钟内生成完整研究报告(金融、医疗、学术等)。 | BrowseComp基准测试通过率23%,行业领先。 |
3. 如何使用阶跃AI?
官方入口
高阶研究工具(阶跃深研)使用流程
- 登录官网并注册账号;
- 输入研究问题(如“分析母婴行业趋势”)或上传文件(PDF/Word);
- 系统自动规划研究方案,生成含图表、溯源数据的报告;
- 结果支持导出为PDF/Word。
开发者资源
在 GitHub 开源了部分模型(如Step-Video-T2V、Step-Audio),支持商业级二次开发。
4. 应用场景
阶跃AI已广泛应用于多个行业:
- 教育:将古诗词转化为动态教学动画(如《钱塘湖春行》)。
- 电商/广告:5分钟生成商品特效视频,成本仅为传统制作的1/10。
- 金融:与财联社合作推出“AI小财神”,能自动解读财报并生成数据图表。
- 智能终端:
- 汽车:与吉利合作开发智能座舱,实现“可见即可说”多模态交互;
- 手机:为OPPO打造“一键问屏”,支持拍照识物与跨应用搜索。
- 影视/游戏:快速生成开放世界概念场景或动画,开发周期缩短70%。
5. 核心优势
阶跃AI的独特竞争力主要体现在以下四个方面:
- ✅ 免费开源:基础功能免费,Step-Video-T2V等核心模型遵循MIT协议开源。
- ✅ 中文优化:基于1.9TB中文多模态数据训练,擅长生成中国特色内容(如“赛博敦煌”)。
- ✅ 高效低成本:Step-3模型采用MFA多矩阵分解注意力与AFD注意力-前馈分离设计,推理效率是DeepSeek的300%,成本下降40%。
- ✅ 安全与兼容性:端云协同架构确保数据留在终端,兼容华为昇腾等国产芯片,支持自主可控。
6. 技术迭代历程
- 2023年
- 2024年
- 发布 Step-Video-T2V(300亿参数)与 Step-Audio 模型;
- 上线推理模型 Step R-mini,支持5万token长文本深度推理。
- 2025年
- 7月:推出 Step-3旗舰模型
- 3210亿参数多模态模型,在 SimpleVQA 排名超越同类开源模型;
- 推理效率达 DeepSeek 的3倍,成本降低40%。
- 建立“1+N模型矩阵”:
- “1”为Step-3基座模型;
- “N”覆盖语音(Step-Audio 2)、视觉(Step 3o Vision)等专项模型。
结语:智能阶跃,十倍可能
阶跃AI通过“多模态+开源+高效推理”的技术战略,正在从工具型AI进化为创意伙伴。其开源普惠理念和高效能优势,使其在教育、金融、内容创作等领域展现出巨大潜力。未来,随着更多多模态模型的加入,阶跃AI有望推动AI进入更高维度的人机协同阶段。
更多信息请访问官网或开源社区(GitHub)。
维基百科: