AI巨头

LlamaFS:基于Llama 3的能自动帮你分类整理电脑里文件的工具

LlamaFS 是一个自组织文件管理器。它会根据文件的内容和众所周知的约定(例如时间)自动重命名和组织文件。它支持多种文件,甚至图像(通过 Moondream)和音频(通过 Whisper)。
LlamaFS 以两种“模式”运行 – 作为批处理作业(批处理模式)和交互式守护进程(监视模式)。

MS Build 2024 的第一天

在 Microsoft Build 2024 上,Microsoft Copilot Studio 中的一系列强大新功能,您可以使用它来创建自己的自定义副驾驶或通过自己的企业数据和场景扩展 Microsoft Copilot 体验。

第一个是Copilot ,现在可以充当独立代理,可以由事件触发,而不仅仅是对话,并且可以自动化和编排复杂的、长期运行的业务流程,具有更多的自主权和更少的人为干预。

RadOnc-GPT 是医学领域中的LLM

在医学领域中,很少有领域比放射肿瘤学需要更高的精度或数据。 RadOnc-GPT 是一种经过微调的 LLM,使用 Meta Llama 2 构建,有可能显着改善放射治疗决策。

很少有领域比放射肿瘤学需要更高的精度或更多的数据。患者的生命取决于在这个专业领域获得正确的治疗。

Google推出开源视觉语言模型:PaliGemma

支持图像视频等多种视觉语言任务
包括支持图像和短视频字幕、视觉问答、图像文本理解、物体检测文件图表解读、图像分割等任务。
PaliGemma 模型包含 30 亿(3B)个参数,结合了 SigLiP 视觉编码器和 Gemma 语言模型。

关注 Copilot + PC

Copilot+ PC 是迄今为止最快、最智能的 Windows PC。凭借强大的新型芯片,能够实现令人难以置信的 40+ TOPS(每秒万亿次操作)、全天的电池寿命以及对最先进人工智能模型的访问,Copilot+ PC 将使您能够完成任何其他 PC 上无法完成的事情。通过 Recall 轻松查找并记住您在 PC 中看到的内容,使用 Cocreator 直接在设备上近乎实时地生成和优化 AI 图像,并通过实时字幕消除语言障碍,将 40 多种语言的音频翻译成英语。

Adobe 的新工具: Project Neo

通过3D技术,Project Neo能够为原本平面的2D图像添加立体效果。

能够快速的为图标、动画插图创建独特的3D形状。

通过简单的操作,你可以在几分钟内完成图标、插图设计,极大地提高了工作效率。

Project Neo与Adobe的桌面和网络应用程序无缝集成,支持无缝导出高质量的SVG文件和像素完美的图像。

Google DeepMind 发布了 AlphaFold 3

能够预测所有生命分子结构和相互作用 AI 模型

该模型能够生成蛋白质、DNA 和其他分子的 3D 结构,并揭示它们如何组合在一起。

该模型还能够模拟影响细胞健康的化学变化,并检测可能导致疾病的异常。

AlphaFold 3 将为全球科学研究人员和机构免费开放。它的高精度和新一代架构可支持药物发现和生物学的突破性进展。

微软开发出数据驱动的AI天气预测模型

能准确预报未来 30 天天气情况

该模型基于微软 Start 团队近日的最新研究成果,结合了 5 种不同的人工智能模型和 3 种深度学习架构,并利用 了过去数十年的天气数据进行训练,能够准确预测 30 天内的天气预报。

Google推出由 Gemini 驱动的网络安全产品

Google 威胁情报的用途示例:

识别和防御网络钓鱼攻击:

假设一家企业遭遇了钓鱼电子邮件攻击,员工可能收到包含恶意链接或附件的电子邮件。

Google Threat Intelligence可以利用其庞大的电子邮件监控网络,检测并阻止这些恶意邮件的传播。

Adobe发布了视频超分项目VideoGigaGAN

VideoGigaGAN,这是一种新的生成 VSR 模型,可以生成具有高频细节和时间一致性的视频。
VideoGigaGAN 基于大规模图像上采样器——GigaGAN。简单地通过添加时间模块将 GigaGAN 扩展到视频模型会产生严重的时间闪烁。
确定了几个关键问题,并提出了显着提高上采样视频的时间一致性的技术。