1.#OpenAI公布首个文生视频模型Sora。北京时间今日凌晨,全球人工智能模型领跑者OpenAI推出了一款能根据文字指令即时生成短视频的模型,命名为Sora。Sora能够从文本说明中生成长达60秒的视频,并能够提供具有多个角色,特定类型的动作和详细的背景细节的场景。Sora还能在一个生成的视频中创建多个镜头,体现人物和视觉风格。(财联社)
2.#谷歌推出全新AI模型Gemini1·5。相比较前代产品 Gemini 1.0 Ultra,1.5 新模型在多个方面都取得了长足进步,能够更高效、更长时间地处理信息。能处理 1 小时视频、11 小时音频、3 万行代码、70 万文字。(IT之家)
3.#谷歌开源Magika:毫秒级识别内容类型;百万文件测试准确率超99%。谷歌宣布开源 Magika,基于人工智能快速高效地识别文件格式和内容类型,相关源代码已托管到 GitHub 上。(IT之家)
4.#传谷歌已开发内部专供AI模型Goose:辅助提高编程效率。据Business Insider报道,谷歌面向内部团队开发了一款名为“鹅”(goose)的大语言模型,专供员工使用。内部文件显示,“鹅”的用途是协助开发新产品。“鹅”被这份文件描述为“Gemini 的后裔”,是一个新型的大语言模型,它的训练基于谷歌“25 年的工程专业知识”。(IT之家)
5.#Meta公布视频联合嵌入预测架构技术V-JEPA。这是一种通过观看视频教会机器理解和模拟物理世界的方法,V-JEPA可以通过自己观看视频来学习,而不需要人类监督,也不需要对视频数据集进行标记,甚至根据一张静止图片来生成一个动态的视频。Meta称,这是人工智能模型迈出的又一重要一步:利用对世界的学习理解来计划、推理和完成复杂的任务。(钛媒体)