它是大规模多模态的,可以作为输入:文本、图像、深度和光流或蒙版视频,并且是第一个生成视频+音频的模型之一!
作者: Tarogo Cloud
80%的人都不知道的深圳老历史
深圳以前叫宝安县,宝安作为县建制始于公元331年。辖地大概为今天的深圳市、东莞市和香港等范围。1979年国务院撤销宝安县改为深圳市。
2023年50个访问量最大的AI工具及AI行业分析报告
Writerbuddy AI使用 SEO 行业著名的工具SEMrush,通过抓取AI工具数据,研究了3000多种 AI 工具。 从中选出了访问量最大的 50 个工具,这前 50 位的AI工具就产生了超过 240 亿次的访问量。
虛擬網紅席捲社交媒體,真人網紅生計終於被撼動
Aitana Lopez 在互聯網上擁有了超 20萬的粉絲,她擁有著一頭粉紅色短髮,特別漂亮。
微軟Copilot-AI聊天機器人app也登陸 iOS
Microsoft 稍早之前,微軟正式把旗下 Copilot AI 聊天機器人 app 單獨上架 Google Play,今天 Apple 陣營的朋友也可以享受了,因為 Copilot app 已經正式上架 App Store 可供下載了。
MotionGPT:统一、多功能的运动语言模型
可以将语言指令转换为3D人体运动! 例如,如果你给模型一个指令,如"踢腿"或"跳舞",模型便可以生成相应的3D人体运动。
SSR-Encoder:从图像中提取关键特征来生成新的图像
SSR-Encoder能够提取图像中的多种特征,包括人物、视觉元素、风格、情感和细节等 然后它会利用提取的这些特征再结合文字提示,重新生成新的图像。
Radishes:分分钟复制一个网易云音乐🎵😁
Radishes一个开源的跨平台的无版权音乐平台,它提供的音乐全是无版权音乐。你可以自由地听歌和下载音乐,而不用担心版权问题。
MicrosoftCopilot现在可以创作AI音乐
它可以在一个提示中生成歌词、乐器和歌声。接下里向您展示如何免费生成曲目。您可以使用任何 Copilot 模式(创意、平衡、精确)
MidrealAI这个小说生成工具太强了
与其他LLM直接生成的所谓根本没有逻辑和情节的“小说”不同。这个产品可以生成真正的小说。逻辑性和创造力都在线,而且还加入了互动能力,每到关键节点会让你选择剧情走向,还会生成一张配图。
GPT- Academic:专门为学术论文研究定制了一个优化的ChatGPT界面
界面包含了多种专门针对学术研究的编辑和交互功能,可以提高学术论文研究、编程和数据分析的效率和质量。
几个小工具
AudioCut:音频文件/播客编辑的 Web 工具
Flowpilot:只需一台二手手机,让老旧的燃油车也能实现自动驾驶
Flowpilot是一个开源的自动驾驶辅助系统。它可以运行在Android系统上。 你只需要在一台普通智能手机上运行Flowpilot,然后通过熊猫硬件连接车辆的OBD-II 端口,再把它和手机相连
2023年的 “顶级消费者应用程序”!
这些产品在美国至少有一天占据了梦寐以求的榜首位置。
Amphion:是一个开源工具包,可实现语音、声音和歌唱功能。
除了文字转语音功能,它还能可以将一首歌的声音换成另一个歌手的声音。还支持声音转换、歌声合成、文本到音频、文本到音乐等功能!
苹果发布了一个多模态大模型
苹果12月14日释放了一个名为Ferret的多模态大语言模型,该模型不仅可以准确识别图像并描述其内容。 同时它还能够识别和定位图像中的各种元素,无论你用怎样的方式描述图像内容,Ferret都能准确地在图像中找到并识别出来。