使用 GPT 4 和 Midjourney 为你的产品快速、低成本的生成高质量产品背景图。
分类: AI项目
DreaMoving:
这看起来很有趣——就像 AnimateAnyone 和 MagicAnimate 一样,但有提示和面部转移。
微软发布最新开发的小型语言模型 Phi-2
“教科书级”的数据集:为了训练 Phi-2,研究团队创建了特定的数据集,这些数据集专门设计用来教授模型进行常识推理和理解一般知识。
Google宣布Gemini-Pro版本已经向开发者和企业开放
最重要的是目前完全免费!🆓💰
南洋理工发布了一个AI视频放大算法Upscale-A-Video
Upscale-A-Video的文本引导潜在扩散框架,用于视频放大。该框架通过两个关键机制确保时间上的一致性:在局部上,它将时间层集成到U-Net和VAE-Decoder中,保持短序列的一致性;
Microsoft刚刚用Copilot取代了 Bing
以下是 2024 年之前您不想错过的 Copilot 的 12 项新功能:
Upscale-A-Video发布,非常棒
它是视频超分辨率的时间一致扩散模型,并且效果非常棒,看看这些线条变得多么清晰!
Meta刚刚推出了Imagine
他们的第一个AI图像生成器。 它使用超过 10 亿张 Instagram 图片进行训练,结果可以说比 Midjourney 和 ChatGPT 更好。
在手机上的任何应用程序中使用Dall-E 3
下载并激活 Microsoft Swiftkey 键盘(下面的链接)
伯克利研究公司发表了一篇关于人形运动的新论文
结果是:人形机器人现在走遍了伯克利。
MistralAI开源基于MoE的大模型
MistralAI开源全球首个(可能)基于MoE(Mixture of Experts)技术的大模型
GEMINI在GooglePixel8pro上运行
使其成为有史以来最智能的 AI 手机;苹果公司几乎快要成为古老的存在;其他手机无法做到的 7 件特殊事情
Meta刚刚推出了新的AI图像生成器。
有人将其与 Midjourney、DALL-E 3 和 Adobe Firefly 的 10 个图像类别进行了比较。
以下是人们使用 Grok 的一些有趣、有趣且有用的方式:
Grok 刚刚通过了我的健全检查
从任何图像创建独特的logo
只需拖放即可。 DALL-E 3 和 ChatGPT Vision 为您完成工作 🧵
DemoFusion这个图片放大项目
这玩意的资源消耗真是恐怖,2048x2048的图片A100居然跑了两分半的时间。