Media2Face能够根据声音来生成与语音同步的、表现力丰富的3D面部动画。 同时允许用户对生成的面部动画进行更细致的个性化调整,如情感调整,“快乐”或“悲伤”等。 它还能理解多种类型的输入信息(音频、文本、图像),并将这些信息作为生成面部动画的指引。
最新文章
机器人技术即将迎来它的ChatGPT时刻
机器人初创公司@Figure_robot 发布了一段视频 他们家的Figure-01机器人现在可以自己煮咖啡了 这是一个使用了端到端的人工智能系统,仅通过观察人类制作咖啡的录像,10小时内学会了制作咖啡的技能。
OpenAI 和微软正在洽谈支持人形机器人公司Figure
报道披露了 OpenAI 和微软与人形机器人公司 Figure 的融资谈判。 此轮融资对Figure的估值接近$2B。
Meta发布最新编程辅助模型:CodeLlama70B
CodeLlama-70B-Instruct 在 HumanEval 上获得 67.8 分,使其成为当今性能最高的开放模型之一。 Code Llama 70B分为三个版本: CodeLlama - 70B,基础代码模型; CodeLlama - 70B -...
马斯克人机接口 Neuralink 相关视频
想象一下,仅凭你的思维就能与亲人交流、上网浏览、甚至玩游戏的愉悦体验。 这一切,得益于在你大脑负责规划动作的区域植入一个既微小又不易察觉的装置。
今年人工智能基础设施将分为两个市场:LLM 与扩散模型
预测:今年人工智能基础设施将分为两个市场:LLM 与扩散模型。 为创意市场提供动力的开发者工具将会出现巨大的增长。
TeslaRoadster虚拟体验
很有趣地生成了虚拟 #tesla 体验的标题屏幕。你想跳进去吗?!
Bard与GeminiPro在 Arena上超越了GPT-4
将其与 Google Sheets 结合起来,实现数据处理的自动化。 向您展示如何使用 Bard 来管理没有公式的电子表格:
人工智能广告,它们即将成为大事件
使用人工智能制作了一部戏剧、一部动作喜剧、一部纪录片和音乐视频。接下来:“Fragrance by Elle”,一个商业广告。 使用 @midjourney v6、@runwayml gen2、@Magnific_AI 高档制作。
Adept Fuyu-Heavy是专为数字代理设计的新型多模态模型
宣称是世界上第三大能力超强的多模态模型,仅次于GPT4-V和Gemini Ultra。 它特别擅长理解用户界面,这意味着可以解释和操作各种软件和应用程序的界面。 能够帮助用户执行各种任务,如自动化流程、响应查询、提供信息等。
日本生成艺术家Liber @liberxx0
他的作品有非常强的个人特色和审美,风格化表达
Lumiere:一次性生成整个视频
Google Research团队开发的基于空间时间的文本到视频扩散模型。 它采用了创新的空间时间U-Net架构,能够一次性生成整个视频的时间长度,不同于其他模型那样逐帧合成视频。 确保了生成视频的连贯性和逼真度。
Apple Vision Pro 的模拟真实世界物体构造和物理规律功能演示!
使用的是 @JigSpace 公司的3D to CAD技术! 这个是早前发布会时候的演示,可以模拟真实世界物理规律
MedSAM:通用医学影像分割模型
MedSAM是一种医学影像分割工具,它能够自动识别和描绘医学影像中的重要区域,比如肿瘤或其他组织的病变。 通过学习大量医学影像和对应的掩模(即正确的分割结果),它能够处理各种不同的医学影像和复杂情况。 它可以帮助医生更快、更准确地诊断疾病。
fabdream. ai制作了一个独特的 40 秒AI视频
作为多伦多“货币未来”活动主页横幅,展示了货币的动态演变。
GPT Auth:提供GPTs用户认证功能
确保只有授权用户才能访问你的GPT应用 还可以针对GPTs应用进行收费,包括订阅、按次使用和一次性购买。 这样你就能对自己的GPTs用户进行收费了!