提供一站式指南,涵盖常见问题解答和基础攻略,帮助用户成功运营套壳站。 同时提供了一些低成本的ChatGPT、Midjourney的API资源的信息。
最新文章
GEO的概念:生成引擎优化
个专门针对生成引擎的印象度量标准! 实验表明,使用GEO的简单策略可以在商业生成引擎上显著提高内容的可见性,提升幅度高达40%。
AI Tube:首个AI视频平台
AI Tube提供了多种类型的视频频道,包括音乐、动画、Minecraft、Lofi、教程、游戏、公共领域和烹饪等!
Mobile ALOHA:一个可以模仿人类自主学习的机器人操作系统。
可以通过模仿学习(即观察人类操作然后模仿这些动作),仅通过50次任务演示,共同训练,它就能够自主完成日常生活中的各种任务。最重要的是:该机器人的软硬件全部都是开源的。
IP-Adapter-FaceID:上传自己照片,分分钟克隆一个自己
该模型利用面部识别模型的面部ID嵌入,可以更准确地捕捉和再现特定人物的面部特征。结合文本描述生成可以生成高度个性化且与原始面部特征一致的图像。
M2UGen:多模态音乐理解和生成模型
M2UGen能够理解各种音乐,包括风格、演奏乐器、表达的情绪情感等,并进行音乐问答。 而且还能根据文本、图像、视频和音频生成各种音乐,同时对生成的音乐也能理解并根据文字描述对音乐进行编辑。
Text-to-CAD :通过文本提示生成 CAD文件。
只需要输入自然语言描述,就能根据这些描述创建相应的 B-Rep CAD 文件和网格模型。生成的模型可以导入到用户选择的任何 CAD 程序中。
现在米老鼠的SD模型已经出来了
1月1号米老鼠版权不是过期了嘛,任何人都可以使用。Mickey-1928:一个基于Stable-Diffusion-xl的微调版本,专门训练用于生成米老鼠、米妮和皮特的图像。
使用AnimateDiff 将视频转换为任何其他风格样式
将视频转换为任何其他风格样式。通过积分高斯图 ,提高样条线水平 利用 Luma 的强大功能将您的智能手机转变为 3D 捕捉设备。
Pile:一款开源的界面非常整洁美观的AI日记软件
可以帮助你撰写和保存日记条目,记录你的思考和经历,当备忘录也可以!内置了OpenAI 的API功能,可以自己写提示词让AI帮你扩展你的想法和日记。
Paperless-ngx:一个开源的文档管理系统,
可以将你的物理文档转换成可搜索的在线档案,从而减少纸张的使用。它内置了OCR功能,可以自动对上传的扫描文档执行OCR。能够识别文档中的文字,并将其转换为可编辑和可搜索的文本格式。
如何使用 DALL E 3创造一致性的角色:终极指南
这个合集旨在教授人们如何使用 DALL E 3创造一致性的角色,保证生成的一系列图像在不同情境、表情、活动或服装下,角色的核心特征和个性保持一致。
Activepieces:是Zapier的替代方案
Activepieces被视为流行的自动化平台Zapier的一个替代品,提供类似的功能但更多的自定义和控制选项。
FlowVid:一个视频到视频合成工具
FlowVid支持多种视频编辑功能,包括改变视频的风格、换掉视频里的某个物体和局部编辑等。
LARP:一个开放世界游戏代理,赋予游戏角色真实的语言和认知能力
LARP能让游戏角色像真人一样和玩家对话,同时能够理解游戏中复杂的情境、记住过去的互动。并根据这些信息做出合理的反应。
OpenVoice:多功能即时语音克隆
由MyShell TTS开发。它能够仅使用一小段参考发言者的音频片段来复制其声音,然后能生成多种语言的语音。