Tarogo Cloud

LibreChat:一个免费的开源 ChatGPT 克隆版

LibreChat是一个免费的开源ChatGPT克隆版,用户可以在一个界面中选择使用不同的AI模型。它支持与OpenAI、Azure、Anthropic和Google等AI模型服务的集成。用户甚至可以在对话中切换AI模型,并使用DALL-E或Stable Diffusion等插件进行图像生成。

Omnivore:一个开源的“稍后阅读”应用

Omnivore 是一个开源的,稍后阅读应用,查看起官方的页面,支持非常多的客户端,包括了 iOS, macOS, Chrome,等等 Android 还在测试中。

Omnivore 吸引的是可以和外部的其他应用同步,比如可以和 Obisidian 同步,还可以接收 Newsletter。 另外还有一个吸引我的点就是,很多宣称可以代替 “Readwise”阅读器,这也是一款还没有深入使用的在线阅读器。

LobeChat:一键免费部署自己的私有聊天机器人

LobeChat 已经支持 OpenAI 最新的 gpt-4-vision 支持视觉识别的模型,这是一个具备视觉识别能力的多模态智能。 用户可以轻松上传图片或者拖拽图片到对话框中,助手将能够识别图片内容,并在此基础上进行智能对话,构建更智能、更多元化的聊天场景。

Clone Robotics:仿生机器人的公司

Clone(克隆)所言,成立于 2021 年的 Clone 是一家致力于开发低成本、生物仿生和智能仿生机器人的公司。
Clone 的宗旨是运用先进的肌肉骨骼技术,打造类似于《西部世界》中的仿生机器人。
在近期的宣传物料中,1:1 复刻的机器人手灵活地拨弄着手指,以及手握针管等工具,肌肉的拉伸在这个过程中也若隐若现。
也许下一秒,《西部世界》就要走入现实。

OpenAI创始人成立新公司,将推出“AI健康教练”

最新成立的Thrive AI Health得到了Huffington的精神健康公司Thrive Global和OpenAI创业基金的支持。该公司计划打造一个”AI健康教练”,为睡眠、饮食、健身、压力管理和人际关系等方面提供个性化建议。

前Fitbit高管DeCarlos Love被任命为CEO。战略投资者包括沃尔玛联合创始人Helen Walton的爱丽丝·沃尔顿基金会。爱丽丝·沃尔顿医学院是Thrive AI Health的首批医疗合作伙伴之一。

谷歌将Gemini 1.5 Pro安装到机器人上 实现记忆导航能力

Google DeepMind 他们把一个叫Gemini1.5Pro的系统装到了机器人身上。这可不是普通的升级,这玩意儿让机器人有了记忆导航的超能力。

想象一下,这个机器人在将近9000平方英尺的地盘上,能执行57种不同的任务,而且成功率达到了90%。这不是简单的任务,比如找到画画的地方,机器人不仅听懂了,还带你找到了一块大白板。这操作,简直比真人还靠谱。

微软开源下一代RAG技术

检索增强生成(RAG)是一种基于用户查询搜索信息并提供结果作为生成AI答案的参考的技术。
该技术是大多数基于LLM的工具的重要部分,并且大多数RAG方法使用向量相似性作为搜索技术。
GraphRAG使用LLM生成的知识图,在对复杂信息进行文档分析时,大大提高了问答性能。

Odyssey:提供影视级别的 AI 视频生成和编辑工具

高质量几何生成:生成精细的三维几何形状,用于构建逼真的场景和物体。
写实材质生成:创建高度真实的材质,使得生成的物体看起来更加生动和自然。
惊艳的光照效果:生成和控制光照效果,增强场景的视觉冲击力和氛围。
可控的运动生成:创建和调整动画和运动效果,使得场景和角色更加动态和逼真。

三星首款智能戒指Galaxy Ring发布

三星在巴黎举办Unpacked 2024发布会,除了发布Galaxy Z Fold6、Galaxy Z Flip6两款折叠屏手机外,三星还发布了首款智能戒指:Galaxy Ring

Galaxy Ring与普通戒指类似,共九种尺寸,可选钛黑、钛银、钛金三款配色,重量最轻2.3克,戴在手上基本无感。

BBC报道 :一个人使用ChatGPT 取代了60名员工

他们的工作逐渐被 ChatGPT 所取代,而他们的职责则变成了专门修改AI生成的文章,使其不那么机械化和公式化

公司引入了一个自动化系统:经理将文章标题输入在线表单,AI生成大纲,

一款语音工具:sherpa-onnx

一款语音识别、语音合成、说话人识别、说话人验证等集成了多种语音处理功能的工具:sherpa-onnx

支持:语音识别(ASR,支持流式和非流式)、语音合成(TTS)、说话人识别、说话人验证、语种识别、音频标注、声音活动检测(VAD,例如silero-vad)、关键词检测等

根据单张图像和音频输入生成唱歌和说话视频

和EMO相比,该项目已开源😄
它能够通过输入语音,生成对应的人物嘴唇同步、表情变化和姿态变化的动画。
提高了语音与生成动画之间的对齐精度,使动画的嘴唇、表情和姿态与语音更匹配。

提供对角色表情、姿态和嘴唇运动的精确控制。
支持多种表情和姿态的自适应控制,增强动画的多样性和真实性。