SearchGPT目前只是临时的原型,计划未来将新功能中最佳的那些直接融入ChatGPT。OpenAI将首先只对一小部分用户和发行商开放SearchGPT,从中获取反馈。 OpenAI并未在官网透露具体将接纳多少测试者。不过,OpenAI的发言人Kayla...
作者: Tarogo Cloud
RoboflowSports :跟踪检测和识别运动员行为
RoboflowSports是一个使用深度学习模型检测和识别运动员行为分析的工具。它通过检测和分割运动员和足球等对象,为体育数据分析提供了强大的工具。 ...
SpeechGPT2:一个端到端的语音对话语言模型
它能够感知和表达情感,并根据上下文和人类指令提供多种风格的语音响应,如说唱、戏剧、机器人、搞笑和低语等。 超过10万小时的学术和野外收集的语音数据, 涵盖了丰富的语音场景和风格。 SpeechGPT2...
Mistral AI 发布最新一代开源模型:Mistral Large 2
Mistral AI 宣布其旗舰开源模型的下一代产品:Mistral Large 2,该模型拥有 1230 亿个参数,在代码生成、数学、推理等方面与 OpenAI 和 Meta 的最新尖端模型不相上下。 紧随 Llama 3.1 405B 之后,Mistral Large 2...
PixVerse 发布V2版本视频模型
升级版的PixVerse V2,不光能生成8秒的视频,还能让你的创意天花乱坠。 别以为8秒就敷衍了事。这V2可是个细节控,分辨率、动态效果都跟打了鸡血似的。 就连蚂蚁打喷嚏,它都能给你拍得清清楚楚。
Adobe 发布Firefly Vector AI 模型
Adobe 最新的 Firefly Vector AI 模型,该模型今天开始公开测试。 这个新的 Firefly Vector 模型为 Illustrator 带来了诸多新功能,比如生成形状填充 (Generative Shape...
Exa AI:真正的AI搜索引擎
一个AI搜索引擎诞生:Exa AI。该公司最近宣布获得了1700万美元的A轮融资,由Lightspeed领投,Nvidia的NVentures和Y Combinator参投。 与其他旨在取代谷歌的AI驱动搜索引擎不同,Exa的目标是创建一个专门为AI设计的搜索工具。
WayveScenes101:一个用于自动驾驶应用的高分辨率图像数据集
WayveScenes101,这是一个数据集,旨在帮助社区推进新颖视图合成的最新技术,该数据集专注于具有挑战性的驾驶场景,其中包含许多具有不断变化的几何和纹理的动态和可变形元素。 该数据集包含 101...
StockBot:由Llama3-70B驱动的实时股票数据聊天机器人
StockBot 是一款基于 ai 的聊天机器人,它利用 Groq 上的 Llama3 70b、Vercel 的 AI SDK 和 TradingView 的实时小部件,通过专门针对您的请求定制的实时交互式图表和界面进行对话响应。 StockBot由Groq...
一个开源项目:AI相册
相册AI是一个实验项目,使用最近发布的gpt-4o-mini作为视觉模型,自动识别相册中图像文件的元数据。然后,它利用 RAG 技术来实现与专辑的对话。 它可以用作传统相册,也可以用作图像知识库来辅助LLM进行内容生成。
AudioNotes:音视频内容转笔记系统
AudioNotes 是一个基于 FunASR 和 Qwen2 构建的音视频内容转结构化笔记系统。它的主要功能是快速提取音视频的内容,并通过调用大模型进行整理,将这些内容转换为结构化的Markdown笔记,便于用户快速阅读和理解。
Mistral AI 和NVIDIA 发布 Mistral NeMo 12B
Mistral AI 宣布发布 Mistral NeMo,这是一个由 NVIDIA 协作开发的 12B 参数模型,具备高达 128k 令牌的上下文窗口。 该模型旨在支持企业应用,包括聊天机器人、多语言任务、编码和摘要。在其尺寸类别中,Mistral NeMo...
微软正式推出 Microsoft Designer
Microsoft Designer 与 Microsoft 产品无缝集成,包括 Word 和 PowerPoint,通过 Microsoft Copilot 进一步提升创意体验。订阅 Copilot Pro 后,当你在 Word 和 PowerPoint...
ElevenLabs 发布Turbo 2.5模型
该模型支持包括普通话在内的 32 种语言,能为全球近 80%的地区提供高质量、低延迟的 AI 对话; 首次支持越南语、匈牙利语和挪威语; 重点提高了印地语、法语、西班牙语、普通话等 27 种语言的响应速度,其中英语速度提高了 25%,最高提升达 3 倍;...
Emilia 一个开源多语言高质量语音数据集
港中大(深圳)联合中科院声学所、上海人工智能实验室等机构发布了超过10万小时包含6种语言的多样化的语音生成数据集—— Emilia! ...
微软团队可以让大语言模型更好地理解和处理电子表格数据
微软发布了一个新的大型语言模型,计划为 Excel、 Sheets 等电子表格应用程序开发全新的 AI 大语言模型--SpreadsheetLLM。 Microsoft在论文指出,SpreadsheetLLM作为一款全新的AI模型,将广泛使用于理解和处理但复杂的电子表格数据。 ...