只需要一个简短的视频,BakedAvatar就能从这个视频中复制出该人物3D头部模型。同时精确捕捉其面部特征,模拟表情和头部运动。 而且它还能对3D头部进行实时渲染,编辑和调整头像的表情、姿势等。 即使是在普通的移动设备上也能实现。
分类: AI项目
斯坦福大学开发出一个几乎不会产生幻觉的模型:WikiChat
高度准确:因为它直接依赖于维基百科这个权威且更新频繁的信息源,所以WikiChat在提供事实和数据时非常准确。 减少“幻觉”:LLM在谈论最新事件或不太流行的话题时容易产生错误信息。WikiChat通过结合维基百科数据,减少了这种信息幻觉的发生。...
ElliQ3老年护理机器人进行硬件升级
Intuition Robotics的ElliQ机器人是一款由人工智能驱动的设备,可以识别和回应特定的人。 该机器人可以进行对话,公司还在探索其他基于人工智能的活动,如绘画和写诗,以“促进认知健康和创造力”。
Magnific AI 图像升级器再升级
输出尺寸高达 10,000 x 10,000 像素 新滑块:Fractality,用于调整图像的某些特性 使用“Z + 滚轮”可以实时查看放大/缩小结果
微软提供4款移动AI 应用程序
以下是这四个应用程序(如下):Copilot、Edge、Microsoft Designer、Swiftkey
三星在 2024 年的CES上发布了Ballie
这个机器人伴侣可以执行命令、拨打电话,还能投影到地板、墙壁和天花板上。 大众汽车刚刚透露,它将把 ChatGPT Voice 引入新车型中。
Clipper:一个开源的HTML到Markdown转换器和爬虫工具
它可以轻松的将网页内容转换成Markdown格式。 或者从网页中剪辑内容并将其转换为Markdown格式。 Clipper还提供了一个爬虫功能,用于爬取网站并剪辑所有页面。
Google 发明了一种估算照片中光照条件的新方法
该技术可以在照片中加入一个看起来像是真实反射环境的铬球。这个铬球可以帮助计算出照片中的光照是怎样的。 然后,他们使用这些光照信息在照片中添加新的物体,使得这些物体看起来好像是在原来的光照条件下拍摄的一样。
GitHub发布 2023 年开源状况和人工智能崛起报告
基于OpenAI等公司的基础模型的生成性AI项目数量激增,其中一些项目甚至进入了最受欢迎的开源项目前10名。 约92%的开发者正在使用或试验AI编码工具。 93% 的开发人员使用Git在构建和部署软件
ChatGPT套壳开源程序大集合
提供一站式指南,涵盖常见问题解答和基础攻略,帮助用户成功运营套壳站。 同时提供了一些低成本的ChatGPT、Midjourney的API资源的信息。
GEO的概念:生成引擎优化
个专门针对生成引擎的印象度量标准! 实验表明,使用GEO的简单策略可以在商业生成引擎上显著提高内容的可见性,提升幅度高达40%。
AI Tube:首个AI视频平台
AI Tube提供了多种类型的视频频道,包括音乐、动画、Minecraft、Lofi、教程、游戏、公共领域和烹饪等!
Mobile ALOHA:一个可以模仿人类自主学习的机器人操作系统。
可以通过模仿学习(即观察人类操作然后模仿这些动作),仅通过50次任务演示,共同训练,它就能够自主完成日常生活中的各种任务。最重要的是:该机器人的软硬件全部都是开源的。
IP-Adapter-FaceID:上传自己照片,分分钟克隆一个自己
该模型利用面部识别模型的面部ID嵌入,可以更准确地捕捉和再现特定人物的面部特征。结合文本描述生成可以生成高度个性化且与原始面部特征一致的图像。
M2UGen:多模态音乐理解和生成模型
M2UGen能够理解各种音乐,包括风格、演奏乐器、表达的情绪情感等,并进行音乐问答。 而且还能根据文本、图像、视频和音频生成各种音乐,同时对生成的音乐也能理解并根据文字描述对音乐进行编辑。
Text-to-CAD :通过文本提示生成 CAD文件。
只需要输入自然语言描述,就能根据这些描述创建相应的 B-Rep CAD 文件和网格模型。生成的模型可以导入到用户选择的任何 CAD 程序中。