Functionary 是一种可以解释和执行函数/插件的语言模型。 该模型确定何时执行函数,无论是并行还是串行,并且可以理解它们的输出。它仅根据需要触发功能。函数定义以 JSON 架构对象的形式给出,类似于 OpenAI GPT 函数调用。
分类: AI项目
CT-LLM:一个 2B 微小的 LLM
想象一个语言障碍不再成为获取尖端人工智能技术的障碍的世界。这正是 CT-LLM 背后的研究人员通过优先考虑世界上使用最广泛的语言之一的中文来实现的目标。这个 20 亿参数模型不同于主要在英语数据集上训练语言模型,然后将其适应其他语言的传统方法。
Meta公布了其下一代训练和推理加速器(MTIA)的详细信息
它还提供了更高的GEMM和SIMD顶点操作速度,以及更大的本地和片上内存容量和带宽。 此外,Meta还开发了一个大型机架系统,可容纳多达72个加速器,以及一个全新的软件堆栈,与PyTorch 2.0完全集成,支持高效的模型和内核代码生成。
伦敦国防科技黑客马拉松落下帷幕
2024年伦敦国防科技黑客马拉松大赛是一个激发创新、鼓励协作的盛会,由EMC(Edge Matrix Computing)发起。这场黑客马拉松旨在将AI潜力与Web3革命相结合,促进AI和去中心化技术领域的创新。
伴你思考的AI思维导图
使用 AI 将文本转换为思维导图。并将markdown、txt、freemind文件转为思维导图,轻松以 PowerPoint、PDF 或 Word 格式导出。轻松编辑并与他人分享您的思维导图。
音乐生成应用Udio正式发布
比Suno有更多的自定义能力,听了一些生成的音乐感觉还是比Suno V3差一些。 前谷歌DeepMind的顶尖AI研究员和工程师创立,并且由艺术家 like @iamwill 和 @common 背书。
Google扩充Gemma开源家族
CodeGemma:专注于代码完成和代码生成任务,具备出色的数学和逻辑推理能力 RecurrentGemma:是一个为研究实验优化的高效架构,利用循环神经网络和局部注意力来提高内存效率。
OpenAI 发布了GPT-4-Turbo 正式版
gpt-4-turbo 、 gpt-4 和 gpt-3.5-turbo 指向各自的最新模型版本。您可以通过发送请求后查看响应对象来验证这一点。响应将包括所使用的特定模型版本(例如 gpt-3.5-turbo-0613 )。
Google宣布Gemini-1.5-Pro开放API
Gemini 1.5 Pro能够对上传到Google AI Studio中的视频进行图像(帧)和音频(语音)的同时推理,意味着这个模型具备了理解和处理视频内容的能力,不仅限于视频的视觉部分(如图像帧),也包括音频部分(如对话、背景音乐等)。
巴西医生使用 Apple Vision Pro辅助手术
巴西的骨科医生Bruno Gobbato最近使用Vision Pro成功进行了肩袖撕裂的手术。这种手术通常是由于肌腱组织的长期磨损和撕裂造成的。
由人工智能控制的战斗机已经与人类飞行员进行了空中“狗斗”
2023年9月美国空军取得全球首次的突破,他们成功使用一架改装的F-16战斗机(X-62)与一架有人驾驶的F-16战机进行了空中对抗。
日本Towa因AI芯片需求股价激增四倍
随着 AI 的兴起,一家不太为人知的日本芯片设备公司 Towa 的股价惊人地飙升了 390%。SK Hynix 和三星等公司正依赖 Towa 的设备来生产高端内存芯片。Towa 还在研发新的工具,承诺将芯片成型成本削减一半。
LiteLLM:统一100多种 LLM 的 API 输入输出操作的开源项目
统一 Bedrock、Azure、OpenAI、Cohere、Anthropic、Ollama、Sagemaker、HuggingFace、Replicate 等 100 多种 LLM 的 API 输入输出、异常处理和负载均衡等操作的开源项目
Meta发布了最新的Llama3
首次发布的是 Llama 3 系列中的两款参数分别为 8B 和 70B 的模型。 最大参数的 400+ B 的模型还在开发中,预计几个月内发布。
波士顿动力公司刚刚展示了新一代纯电动Atlas机器人
阿特拉斯一动不动地俯卧在互锁的健身垫上。唯一的配乐是电动机的呼呼声。确切地说,它并不安静,但与它祖先的液压冲击相比,这算不了什么。
线性注意力序列并行(LASP)
上海人工智能实验室和 TapTap 的研究人员提出了线性注意序列并行 (LASP) 技术,该技术优化了线性 Transformer 上的序列并行性。它采用点对点 (P2P) 通信在节点内或节点间的 GPU 之间进行有效的状态交换。 LASP...