AI项目 Magnific AI 图像升级器再升级 by Tarogo Cloud 3 2 月, 2024 现在可以直接把图像提升到10K的级别 输出尺寸高达 10,000 x 10,000 像素。 可以将任何Midjourney图像放大 8 倍! 新滑块:Fractality,用于调整图像的某些特性。 使用“Z + 滚轮”可以实时查看放大/缩小结果 视频:https://youtu.be/nnHWrFvhcXY
AI行业应用 AI项目 多媒体处理 开源项目 文档AI 视频转字幕工具,一键生成高质量 SRT 字幕 该项目名为 video-to-text-conversion,旨在将视频文件中的音频内容转录为文本,也就是自动生成字幕。支持多语言语音识别,并生成带时间轴的字幕 2 5 月, 2025
AI项目 马里兰大学开发出一种”隐形斗篷” 本文研究了对物体探测器发起对抗性攻击的艺术和科学。大多数关于现实世界对抗性攻击的工作都集中在分类器上,分类器为整个图像分配整体标签,而不是定位图像内对象的检测器。检测器的工作原理是考虑图像中具有不同位置、大小和纵横比的数千个“先验”(潜在的边界框)。为了欺骗对象检测器,对抗性示例必须欺骗图像中的每个先验,这比欺骗分类器的单个输出要困难得多。 23 5 月, 2024