图片来源:网络 编者按:「AI 智能体专栏」是米塔之家打造的聚焦 AI 智能体生态的深度分享平台。以产业链为脉络,追踪智能体产品迭代创新,解码 AI 智能体从前沿技术到产业应用的全景发展脉络。 “你是一个专业的旅行规划师,请为我规划一份 5 天 4 夜的成都旅行攻略,涵盖美食、景点、住宿等方面,每天的行程安排详细到每个时间段,并且要考虑到交通换乘时间。”当你向 ChatGPT 提出这样的需求时,它可能会给你输出一份看似不错的文字攻略,但也可能存在信息不够准确、不够实时,或者缺乏个性化定制的问题。比如说推荐的餐厅可能近期已经关门,或者推荐的景点并不符合你的兴趣偏好。 而现在,有一款名为 Genspark 的 AI 产品,或许能给你带来不一样的体验。它不仅能快速理解你的复杂需求,还能利用自身强大的智能体系统,整合多方资源,为你实时生成一份定制化的成都旅行“Sparkpages”,里面不仅有详细的文字攻略,还可能包含餐厅的实时评价、景点的实时人流量信息,甚至能直接帮你预订机票和酒店,让你的旅行规划变得轻松又高效。 这就是 Genspark,一个致力于重新定义人们获取信息和完成任务方式的 AI 智能体平台。 01. Genspark 的核心灵魂人物为景鲲与朱凯华。景鲲曾任百度副总裁、智能生活事业群组(SLG)总经理、小度科技 CEO,被称为 “小度之父”,在百度时全面负责小度助手的技术、产品及商业化,带领团队将小度打造成国民级 AI 品牌,在人工智能等领域有超十年深厚积累与卓越商业化落地经验。 朱凯华曾任小度科技 CTO,是景鲲的得力技术干将,负责小度整体技术架构和研发,在大规模分布式系统等方面有丰富实战经验,为小度产品技术领先性和稳定性提供核心保障。二人在百度共同主导打造了中国市场领先的智能助手与智能硬件生态 —— 小度。 2024 年 6 月,景鲲与朱凯华联合创立 AI 创新产品公司 MainFunc,公司名源于编程术语 “main function”(主函数)—— 程序运行的起点,寓意其立志成为 AI 驱动创新产品的发源地与引领者。 Genspark不再局限于传统搜索的被动响应,而是通过多智能体协同与实时验证技术,成为能自主拆解任务、调用工具的“数字执行助手”。 无论是将5小时视频转为10页PPT,还是生成赛博朋克风格的烹饪视频,用户只需自然语言描述需求,Genspark便能跨模态调度DeepSeek V3、Claude 3.7 Sonnet等9种顶尖模型,实现从创意到成品的全链路自动化。其技术已在GAIA基准测试中超越OpenAI Deep Research,且因“零邀请码免费使用”策略引爆硅谷开发者社群,估值半年内从18亿跃升至38.5亿人民币,成为全球AI Agent赛道的新标杆。 刚推出,就在智能体基准测试GAIA上击败了Manus和OpenAI Deep Research 02. 产品矩阵 Genspark 的产品矩阵包含多个创新型AI应用,其中基于AI Agent 引擎的搜索和研究平台是核心。该平台通过三大核心技术组件,打破了传统搜索模式的局限。 这是 Genspark 的核心所在,它是一个多智能体协同工作的系统。与传统搜索引擎单纯地索引和匹配网页不同,Genspark 的智能体引擎由多个专门化的 AI 代理构成,每个代理都能针对特定类型的查询提供专业服务。 其最具创新性的是混合多智能体系统(Mixture-of-Agents,MoA)架构,整合了 9 个不同规模的语言模型,其中包括 Google 的 Gemini、OpenAI 的 GPT 系列等。 根据Genspark官方透露及相关技术分析,其MoA架构通常采用分层设计: 输入层:动态解析用户指令,智能评估任务复杂度并分发至最优处理路径,如简单查询直连低成本模型,复杂任务触发多模型协作。 系统会通过模型路由和检索进行动态选择,根据不同任务的特性调用最合适的模型。 这是 Genspark 的第二大核心技术,是一种基于 AI 的网页内容生成方式。每个 Sparkpage 都是根据用户需求实时生成的定制化页面,它整合了多个可信来源的信息,为用户提供统一、连贯的内容。 和传统网页不一样,Sparkpages 不会受到商业因素的干扰,也不存在业务偏见,提供的信息更加精炼准确。而且,每个 Sparkpage 都内置了 AI 助手,能根据用户后续的查询动态响应,提供更深入的信息。 作为 Genspark 最新推出的重磅产品,Super Agent 是一款多功能合一的 AI 助手,它具备自主思考、规划、行动以及使用工具处理日常任务的能力。它融合了顶尖 AI 搜索、极速无广告浏览器以及强大 AI 代理平台的特点。 Super Agent 具有以下核心技术优势: 多模型整合,采用 9 种不同规模的语言模型协同工作;拥有丰富工具集,集成了 80 多种专用工具,涵盖从数据分析到创意生成的各类任务; 具备专有数据库,有 10 多个专业数据集,能保证信息的准确性和时效性;可视化思考过程,可以清晰展示 AI 代理的推理路径,增加了透明度和可信度。 03. 技术亮点解析 Genspark的核心技术之一是多智能体协同系统,它模拟人类团队的协作模式,通过精细化分工与实时协作解决复杂任务。这种设计让系统能够处理复杂的多步骤任务。 当用户输入查询时,多个 Agent 会从不同角度对问题进行分析,提供多维度的解答,最后由核心 Agent 整合这些结果,生成最终的 Sparkpage。 这些智能体并行作业,既大幅提升了信息处理效率,又确保结果准确全面。同时,该机制还具备良好扩展性,能灵活适应新任务与新需求,为用户带来高效精准的智能服务。 将 9 种不同规模的语言模型深度整合,如 Google Gemini、OpenAI 的 GPT 系列等。系统依据任务类型与特性,通过动态的模型路由和检索技术,精准调用最合适的模型 。 例如创意写作任务启用擅长文本创作的模型,数据分析任务则匹配专业数据处理模型。这种“按需分配”的模式实现了各模型优势互补,使系统在 GAIA 基准测试中取得 87.8% 的高分,超越众多竞品,为用户提供更优质、高效的智能服务。 Genspark 的工具编排能力依托集成的 80 多种专用工具与 10 多个专业数据集。面对用户任务,系统通过工具路由和检索技术,智能筛选适配工具,如同为任务精准匹配“趁手兵器”。 无论是数据分析、创意生成,还是内容创作等复杂任务,各工具可协同作业,自动完成多步骤任务链。例如规划旅行时,它能串联航班查询、酒店预订、景点推荐等工具;制作视频时,整合素材收集、剪辑处理等功能,高效实现任务目标,极大提升服务的实用性与便捷性。 Genspark 的透明化思考过程是其独特亮点。在处理用户需求时,系统不仅输出结果,还会清晰展示 AI 代理的推理路径与决策逻辑,就像为用户提供一份详细的“解题步骤”。 通过可视化技术,从信息检索、分析判断到最终结论的每一个环节都一目了然,用户能直观了解答案生成过程,知晓信息来源与筛选依据。 这种透明化设计增强了用户对 AI 决策的信任感,避免 “黑箱操作”,让用户使用更安心,也为后续优化和调整提供清晰指引 。 相比那些单一模型的 AI 产品,Genspark 就像是一个拥有多元智慧的智囊团,能够应对各种复杂的问题情境。 04. 差异化竞争 在 AI Agent 这片竞争红海,OpenAI、谷歌、微软等科技巨头凭借技术与资源优势占据高地,众多初创企业也在奋力突围。Genspark 作为后来者,以鲜明的差异化策略在赛道中锚定独特定位,走出了一条属于自己的创新之路。 Genspark 的创始团队堪称“秘密武器”。景鲲等人曾在中国市场打造出国民级 AI 品牌,对本土用户需求有着“手术刀”般的精准洞察。 这种深入骨髓的本土化经验,让 Genspark 在探索 AI Agent 与生活服务场景融合时,更能抓住用户痛点,为产品注入贴近真实需求的 “灵魂”。 技术架构上,Genspark 摒弃了 “追求单一超级模型” 的传统路线,采用 Mixture-of-Agents 架构。这一选择如同为不同任务匹配专属“特种兵”,既能控制成本,又能实现任务专业化处理,极大提升了系统的稳定性和扩展性。这种务实的工程思维,让产品迭代更加敏捷,能快速响应多样化的市场需求。 产品设计层面,Genspark 将目光投向真实世界的交互场景。它赋予 AI Agent 调用各类工具的能力,甚至能模拟电话预订等真实操作,让技术不再停留在虚拟对话,而是真正“落地”解决生活中的实际问题。这种从一开始就扎根现实的设计理念,让产品迅速在实用场景中打开突破口。 在用户体验方面,Genspark 深知 AI“幻觉”带来的信任危机。因此,它格外强调用户对 AI 任务的全程参与和引导,通过实时交互机制,将 AI 输出的可控性牢牢掌握在用户手中。这种对用户体验和信任度的执着追求,成为其提升产品黏性的关键。 05. 公司生态&动态 2025 年 2 月,Genspark 完成了 1 亿美元的 A 轮融资,估值达到 5.3 亿美元,较种子轮增长了一倍多。这笔资金将主要用于技术研发、市场拓展和团队建设。 Genspark 的月活跃用户已经突破 200 万,这一数据显示出市场对其产品的强烈需求,也为 Genspark 的商业化发展奠定了坚实基础。 除了核心的搜索引擎功能,Genspark 还推出了多款创新产品, 比如 Super Agent,能自主思考、规划和执行复杂任务; AI Sheets,可通过自然语言处理表格数据; Deep Research,能提供高密度、高准确性的研究报告;Fashion,具备虚拟试衣功能,用户通过拍照就能试穿各品牌服装。 06. 写在最后 Genspark的崛起,标志着AI搜索领域悄然完成了一场静默的革命——从“链接索引”到“答案生成”的范式跃迁,本质上是技术对人本需求的回归。它不再满足于机械罗列网页链接,而是像一位贴心的私人助理,既能听懂“筹备创业公司”的模糊需求,也能拆解出注册公司、融资规划、股权设计等数十个关联步骤;既能生成创意文案,还能联动设计工具完成视觉转化,最终将抽象指令转化为触手可及的成果。 这种变革的力量,源自混合智能代理技术的深层突破。当多模型动态协作打破单一AI的“能力天花板”,当工具链编排让AI从“单点突破”走向“全链路闭环”,用户终于不必成为“任务拆解专家”——你只需描绘愿景,AI便能自动生成抵达终点的地图。正如我们在旅行规划、视频创作甚至法律文书等场景中看到的,Genspark正在重塑信息交互的本质:它不再是冷冰冰的搜索引擎,而是理解意图、预见需求、主动进化的“数字伙伴”。 从技术演进的角度看,Genspark的多智能体协同系统与工具编排能力,恰似为AI装上了“社会性大脑”。它预示着未来互联网入口的形态:不再是冰冷的搜索框,而是一个能感知需求、调度资源、解决问题的智能中枢。 当AI Agent开始接管复杂任务的执行,当普通人也能通过自然语言驾驭专业知识与工具,我们或许正在见证“个人智能体”时代的黎明——在这个时代,技术不再追求炫目的参数竞赛,而是沉下心来,解决真实世界中那些“最后一公里”的难题。 免责声明:本文为作者独立观点,不代表米塔之家立场。如因作品内容、版权等存在问题或其他任何异议,欢迎联系 AIGC综合资讯交流群,欢迎入群交流!共享AIGC最新热门资讯

介绍


处理层:8类异构智能体(文本/图像/数据/代码等)并行或串行协作,通过动态资源调度(如低成本GPU→H100切换)实现效率与成本的最优平衡。
聚合层:交叉验证多模型输出结果,自动过滤错误信息并统一风格,最终生成结构化、可交互的高质量反馈






免责声明:本文不代表米塔之家立场,且不构成投资建议,请谨慎对待。



