14:52
谷歌推出AI视频生成工具Veo
5月15日讯,谷歌今天宣布,推出 AI 视频生成模型 Veo。Veo 目前还处于内部测试阶段,该模型专为视频生成而设计,能理解视觉语义和自然语言,与其他现代模型类似。将这种方法引入视频生成,可以创造性地定制出适合特定风格的结果。Veo 模型能够理解用户提示中的 "电影术语",如航拍和延时摄影格式。Veo 能够生成超过一分钟的 1080p 视频,这超过了 OpenAI 的 Sora 等目前最多只能生成 60 秒的模型。谷歌正邀请创作者和电影制片人对 Veo 进行测试,方便与日后将该模型投入使用。
分享
14:52
谷歌推出新版本图片生成模型Imagen 3
5月15日讯,谷歌今天宣布,推出新版本图片生成模型Imagen 3。Imagen 3 能带来更高水平的图像细节,而不会在生成的图像中出现大量视觉伪影和杂质。在需要时,图像会更加逼真和栩栩如生。更新后的 Imagen 3 拥有更强大的渲染文本的能力。谷歌将这种新模式定位为创建带有文字的个性化图像的一种方式,比如贺卡或带有信息的照片。
分享
14:51
OpenAI首席科学家Ilya Sutskever 宣布离职
5月15日讯,OpenAI联合创始人兼首席科学家Ilya Sutskever 今天宣布,他即将从 OpenAI 离职。Ilya Sutskever 在X上表示,在近十年之后,他决定从OpenAI 离开。
分享
16:41
Quest 2和Quest 3引入旅行模式,以在飞机上进行位置跟踪
Meta Quest 2和Quest 3现在推出了一个“试验性”的旅行模式(Travel Mode),可在飞机上使用。用户可以通过“设置”中“实验”部分的切换将“旅行模式”添加到头显的“快速设置”中。
分享
16:40
锤子便签iOS版更新v4.0:新增AI写作功能
5月14日讯,锤子便签近日宣布,发布4.0版本更新,增加全新的 AI 写作功能。据悉,锤子便签最新的 AI 写作功能,具备续写、扩写、简写、大纲整理、头脑风暴等能力,还新增调优功能,可以对已有的文本进行校正、排版和润色。更新后的锤子便签还可以对已有的文本进行总结,并提炼出关键内容。锤子便签的 AI 写作功能需要用户付费订阅,年费为88.8元。
分享
16:40
TikTok正在测试使用AI生成的搜索结果
据 The Verge 报道,TikTok 目前正在测试一项名为search highlights 的新功能,将借助生成式AI 技术来优化搜索结果。
分享
16:40
阿里开源视频自动化剪辑工具FunClip 支持中文语音识别
5月14日讯,据魔搭社区页面显示,:阿里巴巴通义实验室最近开源了一款名为FunClip的视频自动化剪辑工具,专为精准和便捷的视频切片设计。
分享
17:06
ChatGPT将变身AI语音助手?挑战Siri和谷歌语音助手 1小时前
当地时间5月11日,人工智能巨头OpenAI CEO山姆·奥特曼在一档播客节目中称,OpenAI将继续改进并提升ChatGPT的语音功能质量,并表示相信语音交互是通向未来交互方式的一个重要途径。奥特曼称:“多模态交互能力非常强大,比如可以问:‘嘿,ChatGPT,我正在看什么’或‘我不太确定这是哪种植物。’”据外媒报道,OpenAI正在研发的功能是人工智能语音助手,可以与苹果Siri和谷歌语音助手竞争。
分享
16:22
银河证券:通信+AI新基建产业链有望率先上修
36氪获悉,银河证券研报指出,算网产业链供需双增,优选子行业景气度边际改善优质标的。数字经济“AI+”行动不断加码、新应用赋能产业的背景下,全国一体化算力体系新基建有望夯实。通信+AI新基建产业链有望率先上修,ICT基石光网络产业链供需双增,子行业经营业绩有望边际改善; 运营商提质增效重回报,高派息带来价值凸显,国央企改革有望估值重构;5G应用工业互联网亦是未来政策及需求关注重点。建议关注数字经济“AI+”新基建方向。
分享
17:18
漫威宣布将在Vision Pro上推出互动沉浸式Disney+剧情《What IF...?》
据漫威影业与ILM Immersive宣布,将合作在Vision Pro上推出一部长达1小时的原创互动沉浸式Disney+剧情《What IF...?》。其具体登录时间尚未发行,但漫威表示很快就会发布更多信息。
分享