Al Comic Factory:漫画工厂
自动生成有情感、有故事性的漫画内容
它使用大语言模型和如SDXL来自动创建漫画面板。
你只需提供一个简单的文本提示,AI Comic Factory就能根据这个提示生成包含人物对话和场景描述的漫画。
自动生成有情感、有故事性的漫画内容
它使用大语言模型和如SDXL来自动创建漫画面板。
你只需提供一个简单的文本提示,AI Comic Factory就能根据这个提示生成包含人物对话和场景描述的漫画。
比阿里EMO先开源
AniPortrait:根据音频和图像输入 生成会说话、唱歌的动态视频
它可以根据音频(比如说话声)和一张静态的人脸图片,自动生成逼真的人脸动画,并保持口型一致。
现在,您可以在不安装任何东西的情况下尝试 LaVague,并根据自然语言指令实现自动化 Web 操作。
这个当中最好的部分?所有堆栈都是开源的!我们使用 Hugging Face #Gradio 作为 UI,他们的 Inference API 调用 #Mixtral 、 @llama_index 用于 #RAG ,LaVague 本身也是开放的-来源。
它在语言理解、编程、数学和逻辑方面轻松击败了开源模型,如 LLaMA2-70B、Mixtral 和 Grok-1。
DBRX 在大多数基准测试中超过了 GPT-3.5。
DBRX 是基于 MegaBlocks 研究和开源项目构建的专家混合模型(MoE),使得该模型在每秒处理的标记数量方面非常快速。
最新研究更新:提供每月最佳生成式AI论文列表,包括各项研究的摘要和主题。
免费课程列表:超过65个与生成式AI相关的免费课程。
面试资源:面试准备材料,特别是针对生成式AI领域的面试问题。
课程材料:《Applied LLMs Mastery 2024》课程材料。
它支持文字、网页链接、PDF、提问等直接转视频
也就是你输入文字、链接NoLang能以视频形式快速回答。
输入PDF文件,会先给你总结内容,然后根据总结的内容在生成一个解答视频。
网站: https://caizhongang.com/projects/SMPLer-X/
GitHub 存储库: https://github.com/caizhongang/SMPLer-X
例如打开/关闭抽屉、开合电脑等。DragAPart 可以预测对象组件的交互,下图为我实测结果
这项研究的目标是迈向通用运动模型而非针对特定运动结构或对象类别的模型
Alexander Reben 这十年来致力于创作艺术作品,这些作品探讨了人工智能(AI)中人性的幽默与荒谬。
他通过手工将 AI 生成的图像转换成三维模型,并将这些模型具象化于现实世界中,创造出一系列雕塑作品。
颜值还挺高,可以创建分类、标签,使用官方提供的浏览器扩展一键添加书签,最后还可以转换成图片、PDF、Readable 格式进行阅读或分享。
Google 官方Gemini API提供的指南和示例集合
帮助开发者更好地理解和使用Gemini API,包括如何构建应用程序、编写提示以及利用API的不同特性。
新版模型进行了唇形同步升级,能够产生平滑、准确的唇形,同时减少视频帧之间的闪烁现象
SyncLabs构建了基于给定音频条件生成视频的音视频模型。