AI周观察：Meta开源Llama 3 万兴天幕大模型文生视频能力支持60秒+

Meta推出开源大模型Llama 3 性能直逼GPT-4

4月19日,Meta 公司宣布推出下一代大语言模型 Llama 3,共有 80 亿和 700 亿参数两种版本,号称是最强大的开源大语言模型。

Meta 开源 Llama 3 的 80 亿参数版本,让所有人都能接触最前沿的人工智能技术,全球各地的开发人员、研究人员和好奇心强的人都可以进行游戏、构建和实验。信息显示,Llama 3 不只是能处理文本,还能理解图片和视频。Meta 公司还在训练更大的模型,拥有超过 4000 亿参数。除了 Llama 3,Meta 还发布了新的信任和安全工具,包括 Llama Guard 2、Code Shield 和 CyberSec Eval 2。

据悉,Meta 即将在 Facebook、Instagram、WhatsApp 等应用中整合 Llama 3,为用户带来更卓越的 AI 体验。

国内首个音视频多媒体大模型“万兴天幕”4月28日公测 文生视频能力支持60秒+

4月18—19日,中国生成式AI大会在北京举行,万兴科技(300624.SZ)出席并宣布旗下音视频多媒体大模型万兴“天幕”将于4月28日正式公测。万兴科技副总裁朱伟表示,当前大模型在文本和图像领域已实现生产力商用,在音视频领域的应用存在数据集缺失、视频内容结构及层级复杂、算力成本高等挑战,其成熟应用尚需周期,2024年行业将迎AI视频年,视频大模型将加速迭代。目前,万兴“天幕”大模型已通过中央网信办备案,涵盖文生视频、视频生视频、文生音乐、视频配乐、文生音效等能力,已在万兴科技旗下产品规模化商用。其中,文生视频能力上,已实现不同风格、丰富场景及主题的连贯性,且一键生成时长支持60秒+。

谷歌全面整合AI研究团队集中力量加速开发AI技术

4月18日,谷歌首席执行官桑达尔·皮查伊宣布全面整合谷歌的AI工作团队结构,称此举将有助于该科技巨头更迅速、更高效率地开发人工智能产品和服务。据了解,皮查伊周四在一篇博客文章以及给员工的一封通知中表示,专注于AI大模型以及负责确保AI技术安全等相关领域研究的谷歌研究部人工智能团队将被全面整合到该公司的旗舰人工智能业务部门——谷歌DeepMind。

总体而言,为了加快谷歌人工智能大模型(Gemini和Gemma)的相关推进和研发工作,分散在谷歌旗下的研究部门(Google Research)以及谷歌DeepMind负责该项创新技术的员工们将被整合为一个新的更大规模团队,这也意味着谷歌将训练和构建AI超算等新型系统所需的昂贵计算能力和计算资源全面整合到公司的一个单独部门,力争更加聚焦且简化、高效地推进大模型融入应用端,以及加速开发谷歌全新的AI技术。

联想:招募联想AI PC先锋体验官预计今年全球市场 AI PC市场占有率为10%

4月18日,在第十届联想创新科技大会Tech World上,联想宣布六款AI PC新品,并正式开启“先锋体验者”计划,招募联想AI PC先锋体验官。

联想集团董事长、CEO杨元庆在接受媒体采访时,预计今年全球市场AI PC市场占有率为10%。联想集团执行副总裁兼中国区总裁刘军在接受采访时表示,预计下一个季度联想中国区AI PC占比将达到50%,全年将达到80%。

2024年被称为AI PC元年,科技巨头纷纷布局AI PC。苹果于3月初抢先发布AI PC MacBook Air。3月18日,荣耀发布公司首款AI PC MagicBook Pro 16。3月21日,AMD董事会主席及CEO苏姿丰宣布AMD锐龙8040系列AI PC处理器已经实现出货。3月22日,微软宣布推出首批专为商业用户打造的Surface AI PC。4月11日,华为发布新款MateBook X Pro笔记本电脑,首次应用华为盘古大模型。

Adobe Premiere Pro引入视频大模型视频编辑能力有望大幅提升

4 月16 日,Adobe 宣布旗下的剪辑软件 Premiere Pro 即将引入全新的视频编辑功能。其中包含为第三方 AI 视频生成模型添加插件,不论是 OpenAI 的Sora 还是 Runway 的 Gen-2 和 Pika,很快都将出现在 Adobe 工具体系中,用户可以自由选择最适合他们素材的模型。

新模型将带来三大革新功能:生成式扩展允许用户通过AI 工具延长视频片段,添加过渡效果,并拓展音频;对象添加和删除功能使编辑人员能轻松替换或删除镜头中的对象,丰富视频内容;生成式辅助镜头则通过简单文本提示生成,提升视频理解度和掩盖素材瑕疵。这些功能将极大提升视频编辑效率和质量,预示着视频编辑领域的重大变革。

此前,Adobe 已拥有大模型Firefly,入局生成式AI。Firefly 模型更新后,新增了多种AI 功能辅助图片处理,在创作逼真人类图像方面表现出色。Image 2 模型提供AI 编辑功能,如景深、动态模糊和视野调整,还有“提示指导”提升文本描述效率。Adobe 还推出“生成匹配”功能,可复制特定图像风格。Adobe PremierePro 已通过AI 辅助实现六大视频剪辑功能,包括基于文本编辑、AI 音频分类标注、语音转文本、语音增强、场景编辑检测和颜色校正。这些功能帮助用户更精准、快捷、高效地完成剪辑工作,提升了视频制作的效率和质量。

百度推出三大AI开发工具和文心大模型4.0工具版

4月16日, Create 2024百度AI开发者大会在深圳举办。百度创始人、董事长兼首席执行官李彦宏发表了题为《人人都是开发者》的主旨演讲。

李彦宏表示,百度尽可能为开发者提供所需的开发工具,提升社会创造力。包括1个基础模型系列——文心大模型系列,还有包括智能体开发工具AgentBuilder、AI原生应用开发工具AppBuilder、各种尺寸的模型定制工具ModelBuilder在内的三大AI开发工具。

现场,李彦宏还正式发布文心大模型4.0的工具版。开发者可以在工具版上,体验代码解释器功能,通过自然语言交互,就能实现对复杂数据和文件的处理与分析,还可以生成图表或文件,能够快速洞察数据中的特点、分析变化趋势、为后续的决策提供高效精准的支撑。

其介绍,相比一年前,文心大模型的算法训练效率提升到了原来的5.1倍,周均训练有效率达到98.8%,推理性能提升了105倍,推理的成本降到了原来的1%。

《人工智能示范法2.0(专家建议稿)》发布重视AI开源、知识产权

人工智能产业如何健康、安全发展,是AI时代的核心命题。4月16日,由中国社会科学院法学研究所、中国互联网协会互联网法治工作委员会主办,南财合规科技研究院、清华大学科技发展与治理研究中心、同济大学上海市人工智能社会治理协同创新中心等承办的“人工智能治理创新论坛”举行。会上,《人工智能法(示范法)》2.0发布。

据悉,《人工智能法(示范法)》2.0在此前版本的基础上不断更新,将基于负面清单实施的人工智能许可管理制度与负面清单外人工智能活动的备案制度明确区分,避免过重合规负担影响人工智能产业的经营预期;重视人工智能开源发展,提出促进开源社区建设、制定专门合规指引、明确责任减免规则等支持措施;构建知识产权创新规则,在研发环节对训练数据、个人信息的使用作出专门安排,并针对人工智能生成物的成果保护与侵权认定进行规定。