阶跃AI

6个月前更新 00

阶跃星辰推出的支持多模态的AI聊天机器人

收录时间:
2025-07-14
阶跃AI阶跃AI

1. 什么是阶跃AI?

阶跃AI是由上海阶跃星辰智能科技有限公司开发的多模态AI助手(前身为“跃问”),定位为个人效率与创意伙伴。它集成了智能问答、多模态创作、文档处理等能力,技术核心是自研的Step系列大模型,覆盖文本、语音、图像、视频等模态。

此外,阶跃AI坚持开源战略,推动AI普惠化。截至2025年8月,产品已迭代至v5.2.0版本,成为国内多模态AI领域的重要代表。


2. 核心功能

阶跃AI的功能体系以多模态交互与生成为核心,主要包括:

功能类别具体能力技术亮点
智能问答支持文字、图片、语音、文档、拍照等输入,回答生活问题、专业分析(如金融数据)。金融专用模型“财跃星辰”在多模态评测中排名第一。
多模态创作文案润色、代码生成、风格化图像生成、最长10秒的视频创作(如赛博敦煌主题)。Step-Video-T2V模型开源,支持204帧高清视频生成。
文档与数据处理自动生成摘要、提取关键信息,表格数据分析与可视化建议。强化学习优化信息抽取精度。
深度研究支持“阶跃深研”工具可在10分钟内生成完整研究报告(金融、医疗、学术等)。BrowseComp基准测试通过率23%,行业领先。

3. 如何使用阶跃AI?

官方入口

  • 网页端https://yuewen.cn
  • 安卓APP:最新版 v5.2.0(82.97MB),支持临时会话与跨设备数据同步。

高阶研究工具(阶跃深研)使用流程

  1. 登录官网并注册账号;
  2. 输入研究问题(如“分析母婴行业趋势”)或上传文件(PDF/Word);
  3. 系统自动规划研究方案,生成含图表、溯源数据的报告;
  4. 结果支持导出为PDF/Word。

开发者资源

在 GitHub 开源了部分模型(如Step-Video-T2V、Step-Audio),支持商业级二次开发。


4. 应用场景

阶跃AI已广泛应用于多个行业:

  • 教育:将古诗词转化为动态教学动画(如《钱塘湖春行》)。
  • 电商/广告:5分钟生成商品特效视频,成本仅为传统制作的1/10。
  • 金融:与财联社合作推出“AI小财神”,能自动解读财报并生成数据图表。
  • 智能终端
    • 汽车:与吉利合作开发智能座舱,实现“可见即可说”多模态交互;
    • 手机:为OPPO打造“一键问屏”,支持拍照识物与跨应用搜索。
  • 影视/游戏:快速生成开放世界概念场景或动画,开发周期缩短70%。

5. 核心优势

阶跃AI的独特竞争力主要体现在以下四个方面:

  • 免费开源:基础功能免费,Step-Video-T2V等核心模型遵循MIT协议开源。
  • 中文优化:基于1.9TB中文多模态数据训练,擅长生成中国特色内容(如“赛博敦煌”)。
  • 高效低成本:Step-3模型采用MFA多矩阵分解注意力AFD注意力-前馈分离设计,推理效率是DeepSeek的300%,成本下降40%。
  • 安全与兼容性:端云协同架构确保数据留在终端,兼容华为昇腾等国产芯片,支持自主可控。

6. 技术迭代历程

  • 2023年
    • 阶跃AI初版发布,聚焦多模态基础能力。
  • 2024年
    • 发布 Step-Video-T2V(300亿参数)与 Step-Audio 模型;
    • 上线推理模型 Step R-mini,支持5万token长文本深度推理。
  • 2025年
    • 7月:推出 Step-3旗舰模型
      • 3210亿参数多模态模型,在 SimpleVQA 排名超越同类开源模型;
      • 推理效率达 DeepSeek 的3倍,成本降低40%。
    • 建立“1+N模型矩阵”:
      • “1”为Step-3基座模型;
      • “N”覆盖语音(Step-Audio 2)、视觉(Step 3o Vision)等专项模型。

结语:智能阶跃,十倍可能

阶跃AI通过“多模态+开源+高效推理”的技术战略,正在从工具型AI进化为创意伙伴。其开源普惠理念和高效能优势,使其在教育、金融、内容创作等领域展现出巨大潜力。未来,随着更多多模态模型的加入,阶跃AI有望推动AI进入更高维度的人机协同阶段。

更多信息请访问官网或开源社区(GitHub)。


维基百科:

相关导航

暂无评论

none
暂无评论...