AI视频平台D-ID推出了两款新型数字人工具—Express和Premium+,专为内容创作设计,旨在让企业在市场营销、销售和客户支持等领域应用更逼真的虚拟人。Express虚拟人只需一分钟视频训练即可生成,能够同步用户头部的运动;而Premium+虚拟人需要更长的视频进行训练
标签: AI工具
一款开源的AI试衣模型,能够精确操控人物的外观和姿势
可控人物影像產生旨在產生以參考影像為條件的人物影像,從而允許精確控制人物的外觀或姿勢。然而,現有方法儘管實現了較高的整體影像質量,但通常會扭曲參考影像的細粒度紋理細節。我們將這些扭曲歸因於對參考影像中相應區域的關注不夠
智音语音助手:一款通用型智能电脑管家
智音语音助手(Zhiyin_Butler)旨在开发一款通用型智能电脑管家,支持在桌面电脑Windows 10/11系统上安装和部署。项目的所有内容遵循Apache License 2.0开源协议,作为通用型电脑管家系统示例供开发者参考学习。
将照片即时转换为卡通和动画艺术风格的人工智能工具
网站简介:一款可以将照片即时转换为卡通和动画艺术风格的人工智能工具。 只需上传一张照片,网站的AI技术会迅速将其转换为一个个性化的《海贼王》动漫角色。
Ultralight-Digital-Human数字人模型
支持在移动设备上实时运行的超轻量级数字人模型 Ultralight-Digital-Human 是一个创新的开源项目,使得数字人在移动设备上的实时应用成为可能,旨在实现超轻量级的数字人模型,其能够在移动设备上实时运行。 支持在移动设备上实时运行的超轻量级数字人模型 提供了详细的训练和推理步骤
NotebookLlama介绍
Meta 发布了一个通过Llama从 PDF 文件生成播客的引导式教程 NotebookLlama 是一套用于从 PDF 文件生成播客的引导式教程,结合了文本到语音(TTS)模型的应用,旨在帮助用户轻松构建一个完整的 PDF 到播客的工作流程。
谷歌年底将预览接管个人电脑的人工智能
谷歌计划预览人工智能技术,该技术将接管网络浏览器以完成研究和购物等任务。据知情人士透露,谷歌计划最早于今年12月发布其下一代旗舰 Gemini 大型语言模型来展示该产品,该项目代号为“Project...
Instagram 新增AI 扩图工具
YouTube 正在测试一项新功能,允许创作者使用人工智能“重新设计”其短视频中的授权歌曲。获得访问权限的小部分创作者可以输入提示词来更改歌曲中的不同元素,例如情绪或流派。而 Dream Track AI 功能扩展将生成重新制作的30秒配乐。
Cloudflare新的开发工具Workflows
Cloudflare推出了一个新的开发工具:Workflows。的持久执行引擎,目前已进入公开测试阶段。这项工具让开发者可以使用Cloudflare Workers创建稳定、可扩展的多步骤应用。通过自动重试、状态持久化和扩展等功能,简化了多步骤应用的构建。
SynthID:识别AI生成的内容
SynthID 使用各种深度学习模型和算法进行水印嵌入和识别,在不影响原始内容质量的前提下,帮助用户确定内容是否由 Google 的 AI 工具生成,并已集成到 Imagen、ImageFX、Gemini 等 Google 产品中
使用 ChatGPT 中的排程任務自動化您的工作
現在,該功能正在測試版中向 Plus、Pro 和 Team 計劃的用戶推出。計劃在正式發布後擴大訪問範圍。 在此早期測試版中,可以建立排程任務,使 ChatGPT 能夠執行自動提示並按計畫主動與您聯絡。例如,可以要求 ChatGPT 為下列任務建立排程任務:
Meta 为 WhatsApp 引入 AI 机器人聊天记忆功能
Meta公司正在为旗下WhatsApp即时通信软件添加AI聊天记忆功能。在最新的安卓版测试版中,内置的Meta AI能够记住用户过去对话的细节,从而提供更加个性化的体验,以便与其他通信软件竞争。通过存储用户信息,Meta AI可以根据用户的偏好和生活方式,提供更合适的推荐和建议
Claude iOS 和 Android App 迎来新界面
新增分析工具,支持编写和运行JavaScript代码以处理和分析CSV文件数据 Anthropic 今日上线了全新的 Claude AI 内置工具,可以编写和运行 JavaScript 代码,处理数据、进行分析并生成洞察。
Power-over-Skin “皮肤供电”技术
现代计算设备功能强大且小巧,可以轻松佩戴在身体上。然而,电池成为设计和用户体验的主要障碍,增加了设备的重量和体积,并且需要定期充电和移除设备。 为了解决这些问题,卡内基梅隆大学的研究人员提出了通过人体传输能量的“皮肤供电”技术。 ...
将 Android 手机变成监听工具
智能手机中的陀螺仪和加速计等惯性测量单元(IMU),可以通过检测声波振动监听对话。这意味着,即使是一个没有开启麦克风权限的应用程序也可以通过 IMU 获得对话内容。为了不让攻击者获得准确信息,Google 将 Android 应用从 IMU 采样数据的频率限制在每秒 200 次
苹果研究院质疑AI推理
研究员Mehrdad Farajtabar等人发表的论文对大型语言模型(LLM)的推理能力提出质疑,认为LLM所谓的“推理”能力实际上只是复杂的模式匹配,并非真正的逻辑推理。...