1k followers 24 articles/week
Meta版Sora深夜横空出世,小扎放出16秒高清大片!92页论文曝光技术细节,Llama 3架构立功

  新智元报道  编辑:桃子 Aeneas【新智元导读】Meta版Sora,就在刚刚惊艳来袭。Movie Gen可生成1080p、16秒、每秒16帧的高清长视频,还能生成音效、编辑视频、上传图像生成个性化视频。甚至Meta还放出了92页论文,模型架构、训练细节一并公开,干货满满! 毫无预兆地,Meta版Sora——Movie Gen,就在刚刚抢先上线了!Meta将其称为「迄今最先进的媒体基础模型」。全新上线的大杀器Movie Gen Video,是一个30B参数的Transformer模型,可以从单个文本提示,生成高质量的高清图像和视频,视频为1080P、16秒、每秒16帧。一同推出的还有Movie Gen Audio。这是一个13B参数的Transformer模型。通过视频输入和文本提示,它就可以可控性生成和视频同步的高保真音频,时长最长45秒。最惊人的是,这次Meta一并连论文都发布了。论文中,详细介绍了Movie...

Sat Oct 5, 2024 07:42
国外游戏作家:吓死了,谷歌NotebookLM的假AI播客正在评论我的书!

  新智元报道  编辑:Aeneas【新智元导读】谷歌NotebookLM的文字生播客功能,简直太惊艳了。一位扫雷游戏作家听到自己的书变成的播客后,反应是又惊又喜。想象一下那些没人做成播客的心头好冷门书,小编有了一个大胆的想法…… 谷歌的NotebookLM功能,能迅速把文字生成播客,一经推出就引起了强烈反响。而就在最近,一位游戏作家发现,自己出版的一本扫雷的书,竟然已经被NotebookLM生成了假的AI播客!看到自己的书被浓缩成了两个不存在的人之间的时长12分半的对话,作者Kyle Orland大呼:我被吓到了!当然,如果仔细听,就会发现播客音频中仍然存在不少问题,显然它还无法取代专业播客。但即便如此,Orland仍然感慨道:播客这样的格式,是我们接受复杂信息的一种更吸引人、更有趣的方式。比起基于文本的聊天机器人给我们的枯燥的回复,它显然为生成式AI指明一个更有魅力的未来。谷歌NotebookLM谷歌的NotebookLM,是一年多前推出的。根据谷歌介绍,它的功能是「作为虚拟研究助理,基于您选择来源总结事实、解释复杂的想法,并且为新的联系集思广益」。不过就在上周,谷歌添加了「音频概述」的功能。一下子,NotebookLM就有了新的...

Sat Oct 5, 2024 07:42
OpenAI canvas一夜封神!超强AI编码研究神器,ChatGPT再次颠覆人机交互

  新智元报道  编辑:桃子 乔杨【新智元导读】ChatGPT横空出世以来,首次迎来界面史诗级升级!全新canvas界面,开启了人类与AI协作研究、编码的新时代,更代表着终极AGI人机交互形态。 时隔两年,ChatGPT终迎来界面全新升级!这一次,OpenAI官宣推出canvas。它不再是简单的对话框,而是能与ChatGPT「并肩作战」的全新界面。不论是写作,还是编码,都可以开启全新的合作方式。canvas基于GPT-4o构建,目前仍在测试阶段,可在所有模型中手动选择。而且所有Plus用户不用等待,直接可用。未来,OpenAI还计划向所有免费用户全面推出。canvas不仅可以让你与ChatGPT一起做研究,还能写代码、邮件等等,最重要的是还能帮你一起脑洞。有趣的是,canvas还可以添加emoji。奥特曼在线发起投票,看看有多少人喜欢这个功能。另外,canvas面板中,还多了一个快捷菜单,让协作更加轻易便捷了。审查代码、修改bug、添加评论、log等等,一键完成。在Canvas界面助力下,GPT-4o编码性能飞跃18%!这是要纷纷取代了GitHub...

Fri Oct 4, 2024 07:31
o1医学领域大胜GPT-4,性能暴涨!顶尖华人团队激动发文:离AI医生越来越近了

  新智元报道  编辑:LRS【新智元导读】OpenAI的o1模型在通用语言任务上展现了显著的性能,最新测评展现了o1模型在医学领域的表现,主要关注理解、推理和多语言能力,结果大幅超越以往的模型! 大语言模型在刚发布的时候,以其任务、领域通用性和流畅的文本生成能力成功破圈,不过当时的技术还只能应用在一些比较简单的任务上。 而随着思维链等提示技术出现,尤其OpenAI最新发布的o1模型更是第一个采用强化学习策略的内化思维链技术的,把大模型解决复杂问题和推理能力提高了全新的高度。 虽然o1模型在各种通用语言任务上表现出了惊人的强大能力,但其在医学等专业领域的表现仍然未知。 来自加州大学圣克鲁兹分校、爱丁堡大学和美国国立卫生研究院的华人团队共同发布了一篇报告,对o1在不同医疗场景下进行了全面的探索,考察了模型在理解(understanding)、推理(reasoning)和多语言(multilinguality)方面的能力。...

Fri Oct 4, 2024 07:31
突发!OpenAI Sora掌舵人叛逃,转投谷歌DeepMind

  新智元报道  编辑:乔杨 桃子【新智元导读】OpenAI又一位关键大牛离职。Sora负责人刚刚官宣,离职OpenAI加盟谷歌DeepMind,恰好是在今天canvas发布之际。OpenAI每次宣布大事之际,总有人要走。 这不,canvas刚发布,Sora项目却再传出坏消息——负责人Tim Brooks在推特官宣离职,加入谷歌DeepMind。我将加入谷歌DeepMind致力于视频生成和世界模拟器!迫不及待地想与这样一个才华横溢的团队合作。我在OpenAI创建Sora的两年里度过了一段美妙的时光。感谢所有与我一起工作的充满热情和善良的人。对下一个阶段感到兴奋!按下葫芦起来瓢,看来发布日官宣离职可以成为OpenAI的传统了。谷歌大佬纷纷在评论区弹冠相庆,包括DeepMind和谷歌研究院首席科学家Jeff...

Fri Oct 4, 2024 07:31
Pika 1.5重磅升级!万物皆可爆炸,搞笑特效全网病毒式疯传

  新智元报道  编辑:编辑部【新智元导读】重磅更新的 Pika 1.5,简直要把社交媒体炸翻了!网友们惊叹:现在的AI视频,已经进化到这种程度了?不仅效果惊艳有趣,这次发布的用户使用手册也让AI视频更加大众化,连小白都可以轻松上手了。 时隔多月,斯坦福华人团队创办的 Pika 终于官宣 —— 新一代AI视频模型来了。刚一上线,全新的特效功能就让全体网友玩疯了!喊着「臣妾做不到啊」的皇后、深情对视的四郎和嬛嬛,忽然被挤瘪。脸上洋溢着神秘微笑的蒙娜丽莎,开始融化。表情包里的网红小猫,猝不及防就被捏了。 更多惊艳效果,请见下方这个宣传片。专业能力大提升这次最直观的升级,就是Pika 1.5在专业领域上达到了全新的高度——图生视频(I2V)和文生视频(T2V)的质量更高,表现力更强。画面质量提高 更加逼真可以看到,Pika...

Thu Oct 3, 2024 11:22

Build your own newsfeed

Ready to give it a go?
Start a 14-day trial, no credit card required.

Create account