分类: AI项目

人工智能广告,它们即将成为大事件

使用人工智能制作了一部戏剧、一部动作喜剧、一部纪录片和音乐视频。接下来:“Fragrance by Elle”,一个商业广告。 使用 @midjourney v6、@runwayml gen2、@Magnific_AI 高档制作。

Adept Fuyu-Heavy是专为数字代理设计的新型多模态模型

宣称是世界上第三大能力超强的多模态模型,仅次于GPT4-V和Gemini Ultra。 它特别擅长理解用户界面,这意味着可以解释和操作各种软件和应用程序的界面。 能够帮助用户执行各种任务,如自动化流程、响应查询、提供信息等。

Lumiere:一次性生成整个视频

Google Research团队开发的基于空间时间的文本到视频扩散模型。 它采用了创新的空间时间U-Net架构,能够一次性生成整个视频的时间长度,不同于其他模型那样逐帧合成视频。 确保了生成视频的连贯性和逼真度。

MedSAM:通用医学影像分割模型

MedSAM是一种医学影像分割工具,它能够自动识别和描绘医学影像中的重要区域,比如肿瘤或其他组织的病变。 通过学习大量医学影像和对应的掩模(即正确的分割结果),它能够处理各种不同的医学影像和复杂情况。 它可以帮助医生更快、更准确地诊断疾病。

GPT Auth:提供GPTs用户认证功能

确保只有授权用户才能访问你的GPT应用 还可以针对GPTs应用进行收费,包括订阅、按次使用和一次性购买。 这样你就能对自己的GPTs用户进行收费了!

HeyGen的最新功能演示

可以和AI进行视频聊天,就是你用文字可以和机器人对话,然后机器人有一个具象的形象,它可以通过视频来和你聊天!

来自超级大企业的 AI 开发

Google Chrome 刚刚获得了 3 项新的 AI 功能。 此外,还有来自 Adobe、Kanye West、Google Lumiere、ElevenLabs 的 AI 开发。 谷歌刚刚推出了最新的 Chrome 浏览器更新,引入了 3 个新的实验性AI功能。

Runway Multi Motion Brush混合运动笔刷教程

Multi Motion Brush用于精确控制运动的工具。允许你在图像上使用不同的笔刷来控制图像各个部分的运动状态。 你可以选择不同的笔刷来添加或改变图像中的动作,每种笔刷都有自己独特的效果。

vx. dev:v0.dev的开源替代品

vx. dev与GitHub无缝集成,你只需在GitHub上提交一个新的Issue,vx. dev就可以你的需求生成React、Vue或Svelte等UI代码。 支持用户自定义代码生成模式,生成的代码通过拉取请求呈现,方便用户查看和修改。

AI医疗设备DermaSensor 刚刚获得FDA批准

能够检测所有主要皮肤癌的AI医疗设备DermaSensor 刚刚获得FDA批准 该设备能检测三种最常见的皮肤癌:黑色素瘤、基底细胞癌和鳞状细胞癌。 在1000多名患者的研究中,DermaSensor在检测224例皮肤癌方面表现出高灵敏度,正确阳性率为96%

WhisperSpeech:一个开源的文本到语音系统

是通过对OpenAI的Whisper语音识别模型反向工程来实现的。 通过这种反转过程,WhisperSpeech能够接收文本输入,并利用修改后的Whisper模型生成听起来自然的语音输出。 输出的语音在发音准确性和自然度方面都非常的优秀。

退出移动版