在 Microsoft Build 2024 上,Microsoft Copilot Studio 中的一系列强大新功能,您可以使用它来创建自己的自定义副驾驶或通过自己的企业数据和场景扩展 Microsoft Copilot 体验。 第一个是Copilot...
分类: AI巨头
RadOnc-GPT 是医学领域中的LLM
在医学领域中,很少有领域比放射肿瘤学需要更高的精度或数据。 RadOnc-GPT 是一种经过微调的 LLM,使用 Meta Llama 2 构建,有可能显着改善放射治疗决策。 很少有领域比放射肿瘤学需要更高的精度或更多的数据。患者的生命取决于在这个专业领域获得正确的治疗。
Google推出开源视觉语言模型:PaliGemma
支持图像视频等多种视觉语言任务 包括支持图像和短视频字幕、视觉问答、图像文本理解、物体检测文件图表解读、图像分割等任务。 PaliGemma 模型包含 30 亿(3B)个参数,结合了 SigLiP 视觉编码器和 Gemma 语言模型。
关注 Copilot + PC
Copilot+ PC 是迄今为止最快、最智能的 Windows PC。凭借强大的新型芯片,能够实现令人难以置信的 40+ TOPS(每秒万亿次操作)、全天的电池寿命以及对最先进人工智能模型的访问,Copilot+ PC 将使您能够完成任何其他 PC 上无法完成的事情。通过 Recall...
Adobe 的新工具: Project Neo
通过3D技术,Project Neo能够为原本平面的2D图像添加立体效果。 能够快速的为图标、动画插图创建独特的3D形状。 通过简单的操作,你可以在几分钟内完成图标、插图设计,极大地提高了工作效率。 Project...
Google使用Gemini 让Android 开发更快、更简单
Android Studio提供了一站式解决方案,集成了代码编辑、编译、调试和测试的工具,减少了开发者在不同工具间切换的需要。 支持自动编写代码、语法高亮和代码重构
Gemini1.5 Pro+StableDiffusion+ComfyUI=DALL·3
开源社区一直以来的梦想:DALLE3交互和提示词生成能力 + 无数SD模型出图能力,这不巧了嘛 百万上下文、多模态+多轮对话、打标/反推
Google DeepMind 发布了 AlphaFold 3
能够预测所有生命分子结构和相互作用 AI 模型 该模型能够生成蛋白质、DNA 和其他分子的 3D 结构,并揭示它们如何组合在一起。 该模型还能够模拟影响细胞健康的化学变化,并检测可能导致疾病的异常。 AlphaFold 3...
微软开发出数据驱动的AI天气预测模型
能准确预报未来 30 天天气情况 该模型基于微软 Start 团队近日的最新研究成果,结合了 5 种不同的人工智能模型和 3 种深度学习架构,并利用 了过去数十年的天气数据进行训练,能够准确预测 30 天内的天气预报。
Google推出由 Gemini 驱动的网络安全产品
Google 威胁情报的用途示例: 识别和防御网络钓鱼攻击: 假设一家企业遭遇了钓鱼电子邮件攻击,员工可能收到包含恶意链接或附件的电子邮件。 Google Threat Intelligence可以利用其庞大的电子邮件监控网络,检测并阻止这些恶意邮件的传播。
Adobe发布了视频超分项目VideoGigaGAN
VideoGigaGAN,这是一种新的生成 VSR 模型,可以生成具有高频细节和时间一致性的视频。 VideoGigaGAN 基于大规模图像上采样器——GigaGAN。简单地通过添加时间模块将 GigaGAN 扩展到视频模型会产生严重的时间闪烁。...
GitHub 正式推出 GitHub Copilot Workspace 的技术预览版。
一切从任务开始:从一个 GitHub Issue、Pull Request 或仓库中打开 GitHub Copilot Workspace。(截图显示了 octoacademy 仓库中的一个 Issue。)
微软官方出的 PowerToys
很好用的小工具集合,还是开源的。 尤其是里面的 Text Extractor 用作 OCR 很方便。 当前 PowerToy 实用工具
微软必应的一项新专利详细介绍了“视觉搜索”
微软在 Bing 图片搜索中已引入视觉搜索选项,通过识别图片中的内容,并扩展显示相关的图片资源,实现以图搜图功能。 微软计划将必应的图片搜索引入到聊天平台上,增强用户参与度并提供更全面的搜索结果。
基于LLAMA3构建的医疗领域的多模态模型
@ICepfl 和 @YaleMed 的研究人员联手构建了 Meditron,这是一款适用于资源匮乏的医疗环境的 LLM 套件。借助 Llama 3,他们的新模型在 MedQA 和 MedMCQA 等基准测试中优于其参数类别中的大多数开放模型。
谷歌发布基于 Gemini 微调的医疗领域模型 Med-Gemini
在临床推理、多模态理解和长文本处理方面都有很大的提升。 研究人员用了14个医疗基准测试Med-Gemini的能力。 结果发现,它在10个基准上都取得了最佳表现,远超之前最强的GPT-4模型。