灵光app是蚂蚁旗下推出的AGI多模态智能应用,依托支付宝技术生态开发,主打“快速理解与高效交互”的AI服务。其核心功能分为两大板块:一是“快速研究”模式,可一键解析合同、医疗报告、学术论文等复杂文档,自动提取关键信息并生成结构化摘要。
【AGI相机功能】
通过相机镜头识别并理解现实世界中的场景与内容,实现“拍摄即问、实时理解与回答”。例如,拍摄停车缴费单可自动识别支付需求,拍摄体检单可生成健康建议。
【多模态理解能力】
依托蚂蚁自研的Ming-Lite-omni模型,实现图像、语音、文本的跨模态融合,较传统OCR工具的信息处理效率提升300%。
【快速研究功能】
能迅速整理复杂文档要点,如合同、发票、医疗报告等,自动提取关键信息并生成结构化摘要。
【本地初步识别+云端语义推理模式】
将响应延时控制在500毫秒内,同时降低移动端能耗峰值至传统多模态应用的1/3。
【场景化生成能力】
支持“识别-理解-推荐-交易”全链路,如商品识别后跳转支付宝小程序购买,车牌识别后完成停车缴费。
1、拍摄停车缴费单,相机可识别单据类型并自动关联支付需求;
2、拍摄体检报告,能分析异常指标并推荐健康险产品。
3、拍摄商品并询问价格,AI可调用电商数据提供比价信息;
4、拍摄街景并询问路线,AI会结合地图数据规划路径。
1、高语义理解准确率
依托支付宝12亿实名用户和日均10亿笔交易数据,在消费场景的语义理解准确率高,较行业平均高15个百分点。
2、多语言支持与跨文化场景优化
已适配12种主流语言,并针对海外商品识别等场景进行优化,计划将“视觉即服务”模式复制至东南亚、中东等新兴市场。
3、商业闭环构建能力
通过入口层(AGI相机、支付宝搜索、小程序调用)、能力层(场景理解、知识图谱、决策支持)和变现层(保险推荐、理财顾问、企业服务)的整合,形成完整的商业生态。
4、技术路径创新
较Meta Segment Anything模型更侧重实时决策而非通用分割,采用“实时点云即带绝对坐标”等技术,提升场景适应性和可靠度。
5、用户隐私保护与数据合规
在数据合规方面投入大量资源,预计占研发费用的25%,确保用户数据安全。
v1.0.22.8000版本
优化体验,增强稳定性。
软件评论
网友评论