撰文 / 智沅 像素
审核/智枢
图片来源:网络


谷歌AI模式支持图像理解与多模态搜索


4.8插图1.png谷歌近期在其实验性搜索功能“AI 模式”中全面升级多模态搜索能力,用户可通过上传本地照片或调用相机实时拍摄的图像进行复杂提问。


例如拍摄书架照片后询问“推荐类似的高评价书籍”,系统将基于 Google Lens 的多模态技术精准解析图像中的书籍封面、排列方式及环境细节,并生成包含书名、作者、评分及购买链接的推荐列表。


该功能支持多轮交互,用户可进一步细化需求,如“推荐篇幅最短的作品”,AI 将结合书籍元数据动态调整答案。


技术层面,AI 模式采用 “查询扇出”(query fan-out) 机制,同时分析图像本体与内容对象的关系(如物体材质、颜色、空间布局),并通过动态生成关联问题引导用户深入探索。目前该功能已从 Google One AI 高级订阅用户 扩展至实验室计划的数百万用户。


OpenAI拟收购io Products


4.8插图2.pngOpenAI 近几周在讨论以不低于 5 亿美元的价格收购 io Products,不过也在考虑除全资收购外的其他合作模式。


io Products 此前已从 Emerson Collective 及其他公司获得了未披露金额的融资,还计划筹集高达 10 亿美元的资金,软银 CEO 孙正义也与奥特曼和伊夫进行了交流,但具体参与情况尚不明确。


若收购达成,OpenAI 将获得 io Products 的专业团队及正在研发中的 AI 设备


小编推测,这不仅可能使其与苹果公司展开直接竞争,还将推动 AI 行业从单纯的软件技术发展向软硬件深度融合的方向转变。

亚马逊推出长视频生成工具


4.8插图3改.png亚马逊网络服务(AWS)宣布其 AI 视频生成模型 Nova Reel 迎来重大升级,新版本 Nova Reel 1.1 能够生成时长最长可达两分钟的视频

功能特点:


长视频生成:用户可以提供最长 4000 个字符的提示词,通过系统生成由多个六秒镜头组成的长视频,且生成的多镜头视频具有一致风格。


“多镜头手动”模式:用户只需上传一张分辨率为 1280×720 的图片并附加最多 512 个字符的提示词,系统便能结合图像与文本生成多达 20 个镜头的视频片段。


用户还可透过调整镜头构图、运动轨迹等参数,实现更具创意的视觉表达。

川崎重工发布氢动力机械狗



4.8插图4.jpeg日本川崎重工在大阪关西世博会预展上,推出了一款名为 “CORLEO” 的氢动力骑乘型机械狗。它在续航与地形适应性方面有如下表现:

续航方面:CORLEO 搭载 150cc 氢燃料发电引擎,后置储氢罐通过化学反应产生电力,驱动四条机械腿的独立电机。


氢燃料电池动力系统实现零碳排放,单次充能可支持 8 小时连续作业或 241 公里续航(按 20km/h 计算)。


相比传统电池方案,氢能储罐能量密度提升 3 倍,解决了户外移动设备的续航焦虑。


地形适应性方面:机器人腿部采用仿生关节与液压阻尼技术,每秒可完成 2.3 次动态平衡调整。


其独创的 “摇臂避震系统” 源自川崎摩托车技术,通过碳纤维金属复合车架吸收 80% 路面冲击,配合橡胶分趾蹄的智能抓地模式,在 45 度斜坡和 30cm 断崖地形中仍能保持车身水平。

阿里国际启动“Bravo 102”计划


4.8插图5改.png阿里国际启动的 “Bravo 102” 计划是一项面向全球的头部 AI 科技人才培养计划,旨在争夺 AI 人才,推动企业在 AI 领域的发展。


在 2026 届校招中,阿里国际 80% 的岗位集中于 AI 相关领域,包括 AI 算法、研发、AI 产品经理等。


这一计划是阿里整体 AI 策略的一部分,阿里巴巴集团 CEO 吴泳铭表示未来三年将围绕 AI 战略核心,在 AI 和云计算的基础设施建设、AI 基础模型平台及 AI 原生应用、现有业务的 AI 转型升级三方面加大投入。

斯坦福发声:美 AI 模型一骑绝尘


4.8插图6.png美国斯坦福大学发布《人工智能指数报告 2025》


报告显示,美国以 40 个模型位居全球 AI 模型入选数量榜首,中国(15 个)、法国(3 个)紧随其后,韩国 LG AI Research 的 ExaOne 3.5 成为该国唯一入选的 AI 模型。


虽然美国在模型数量上保持领先,但中国模型在质量上迅速缩小了差距,在 MMLU 和 HumanEval 等主要基准上的性能差异从 2023 年的两位数缩小到 2024 年的接近相等。


同时,中国在 AI 出版物和专利方面继续领先。


MagicColor AI工具上线


4.8插图7.png实现线稿一键上色,支持多角色场景色彩一致性,降低动漫与设计创作门槛。


一键自动上色:支持用户上传线稿和多个参考图,自动分析线稿中的物体或角色,从参考图中提取每个角色的颜色和风格,然后给线稿涂上合适的颜色,保证每个角色颜色一致、图像边缘干净、细节清晰,解决了传统手动上色耗时、易出错、缺乏一致性的问题。


灵活性强:可以适应多种参考风格,如不同画风、色调,同时保持角色本身的外观不变;


能够在多角色图像中智能识别角色并进行精确分区域上色;对于复杂遮挡场景也有较好表现。


应用场景:可应用于动漫制作、游戏开发、插画设计等领域,帮助设计师和画师快速、高效地完成线稿上色工作,提高工作效率和作品质量,同时也为相关领域的创作者提供了更多的创作灵感和可能性。

免责声明:本文为作者独立观点,不代表米塔之家立场。如因作品内容、版权等存在问题或其他任何异议,欢迎联系。


免责声明:本文不代表米塔之家立场,且不构成投资建议,请谨慎对待。

版权声明:作者保留权利。文章为作者独立观点,不代表米塔之家立场。
了解更多元宇宙知识,结识元宇宙人脉,扫码加入元宇宙行业生态社群。

联系编辑

微信二维码

微信公众账号

微信扫一扫加关注

发表
评论
返回
顶部